国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
14,關(guān)于了解和用好DeepSeek你真正應(yīng)該知道的

今天短視頻平臺(tái)上,幾千上萬(wàn)點(diǎn)贊的關(guān)于 DeepSeek 的內(nèi)容,大部分都是忽悠你的。

DeepSeek 太火了,以至于原來(lái)教你做短視頻的、做個(gè)人 IP 的,甚至教你線下開店的自媒體老師們,連年都不過(guò),在老家的廁所里錄視頻教你用 DeepSeek 賦能。

連 DeepSeek V3 和 DeepSeek R1 都沒(méi)搞懂,張嘴就“用 DeepSeek 美化照片太牛了”。

那些做視頻的人根本不懂,只是因?yàn)椴溥@個(gè)有流量。

這篇文章,寫給頭腦清晰的朋友。

(確保你頭腦清晰或者希望自己這樣,否則下面的截圖可能會(huì)誤傷到你)

我昨天在校友群里稍帶“諷刺性”的給在做號(hào)的同學(xué)說(shuō)了幾個(gè)選題方向

昨晚有群友試了一下,分分鐘過(guò)千曝光……

希望正在讀這篇文章的你,不是這類內(nèi)容的受眾之一。

DeepSeek 這波熱門,最有價(jià)值的是 R1(也就是那個(gè)推理思考過(guò)程)以及推理思考后的答案。

如果只是用 DeepSeek,它并沒(méi)有比別的 AI 工具在使用體驗(yàn)上強(qiáng)多少。

所以那些上來(lái)就教你“用 DeepSeek 寫腳本”、“用 DeepSeek PS 照片”、“用 DeepSeek 做個(gè)人知識(shí)庫(kù)”的,都是“……”。

如果你真的希望了解 AI、DeepSeek 會(huì)給你帶來(lái)什么影響,那么你應(yīng)該關(guān)注的是 DeepSeek R1,它才是改變技術(shù)和世界的東西;

但如果你只是想跟一下熱點(diǎn),不讓自己太“out”,那么你就更必須得關(guān)注 DeepSeek R1 才行,否則你會(huì)露怯,反倒更丟人;

所以,你關(guān)注對(duì)了么?

你能分清楚普通 DeepSeek 和 R1 的區(qū)別了么?

你知道為什么 R1 引發(fā)全球矚目了么?

你知道為什么所有用過(guò) R1 的人都陷入深深地自我懷疑了么?

不知道也沒(méi)事,它其實(shí)很簡(jiǎn)單。

我開工第一天的晚上,做了一場(chǎng)兩個(gè)半小時(shí)的直播,從“大模型基礎(chǔ)”開始講起,(我個(gè)人感覺(jué))通俗易懂的講了一遍“ DeepSeek R1 為什么這么強(qiáng),它對(duì)我們有什么影響”。

這是校友昨天上午聽直播前對(duì) R1 的感受:

到晚上聽直播回放后,實(shí)現(xiàn)乾坤大挪移:

如果你錯(cuò)過(guò)了,也沒(méi)關(guān)系。這篇文章把直播的關(guān)鍵信息給大家做一番總結(jié),讓你也能更清晰的認(rèn)知 DeepSeek R1。

直播時(shí)的板書

直播的關(guān)鍵信息:

  1. 1. DeepSeek為什么這么強(qiáng)?

  2. 2. 推理模式、強(qiáng)化學(xué)習(xí)是什么?

  3. 3. 為什么私有部署不靠譜,蒸餾是什么?

  4. 4. 對(duì)普通人有啥影響,還需要學(xué)習(xí)提示詞么?

  5. 5. 怎么流暢的用上DeepSeek?

DeepSeek R1 為什么這么火?

原因很簡(jiǎn)單,就兩個(gè)字:便宜。

這里的“便宜”是面向所有人的:

  • · 對(duì)全球的大模型創(chuàng)業(yè)者來(lái)說(shuō),訓(xùn)練研發(fā)成本降到了 10%;

  • · 對(duì)全球的大模型研究者來(lái)說(shuō),所有研究細(xì)節(jié)開源免費(fèi)試用;

  • · 對(duì)全球的大模型使用者來(lái)說(shuō),不花錢就能用上付費(fèi) ChatGPT 同水平的智能。

R1 這樣的模型,2024 年 10 月 ChatGPT 就上線了。

名字叫 o1,需要充值 20 美元/月的 Plus 才能使用,并且限量、不顯示思考過(guò)程。

以及 OpenAI 這個(gè) Gou 公司閉源、不介紹任何技術(shù)細(xì)節(jié),搞得全球的科研人員都很煩躁。

DeepSeek 春節(jié)前發(fā)布 R1 這樣的:模型、數(shù)據(jù)、權(quán)重全部開源;線上版本免費(fèi)不限量使用;展示全部思考推理過(guò)程。

能不炸么!

從國(guó)外火回國(guó)內(nèi)的起點(diǎn)是這個(gè),但是真正能持續(xù)爆火的原因,是 R1 實(shí)在是太太太太太太太太強(qiáng)了!

隨便截圖一個(gè) DeepSeek 的思考過(guò)程:

在此基礎(chǔ)上生成的答案,又是「逆天」級(jí)別

那么,如此強(qiáng)大的 AI,怎么做到極致性價(jià)比呢?

從大模型訓(xùn)練方法講起

我用通義聽悟總結(jié)了直播回放這部分的內(nèi)容,直接復(fù)制粘貼吧。

(AI 總結(jié)有些偷懶,詳細(xì)的回答在文末有直播回放的獲取方式)

大模型訓(xùn)練過(guò)程中的主要階段有哪些?微調(diào)階段對(duì)大模型的影響是什么?
直播總結(jié):主要階段包括預(yù)訓(xùn)練和微調(diào)。預(yù)訓(xùn)練階段生成預(yù)訓(xùn)練模型,之后進(jìn)行微調(diào)以得到更精準(zhǔn)的模型,并通過(guò)人工驗(yàn)校來(lái)提升模型的質(zhì)量。在微調(diào)階段,給定的內(nèi)容質(zhì)量和人工打分/校驗(yàn)決定了大模型回答問(wèn)題的水平。這意味著人類對(duì)于模型好壞判斷的標(biāo)準(zhǔn)直接限定了大模型的發(fā)展水平。

預(yù)訓(xùn)練模型參數(shù)量的巨大意味著什么?
直播總結(jié):擁有4000億個(gè)參數(shù)的預(yù)訓(xùn)練模型就像一個(gè)人要掌握所有學(xué)科知識(shí)并應(yīng)用到建設(shè)祖國(guó)中,所需消耗的算力和資源非常龐大,這也是成本高昂的原因之一。

MoE模型是如何降低成本和提高效率的?
直播總結(jié):MOE模型采用多專家協(xié)作模式,將參數(shù)分散到多個(gè)模型上,每個(gè)模型針對(duì)特定領(lǐng)域優(yōu)化,這樣既能節(jié)省資源,又能更好地處理跨學(xué)科問(wèn)題,降低訓(xùn)練和推理過(guò)程中的成本。

DeepSeek在訓(xùn)練R1模型時(shí),問(wèn)答對(duì)兒是如何生成的?這種AI生成的訓(xùn)練內(nèi)容如何降低成本?
直播總結(jié):?jiǎn)柎饘?duì)是通過(guò)AI生成的,具體過(guò)程是使用引導(dǎo)性提示詞讓deepseek v3生成帶有過(guò)程推理和分析的QA對(duì)進(jìn)行訓(xùn)練。成本降低體現(xiàn)在兩個(gè)方面:一是訓(xùn)練內(nèi)容由AI生成,降低了人工生產(chǎn)成本;二是deepseek v3模型本身具備一定的對(duì)錯(cuò)判斷標(biāo)準(zhǔn),在人工校對(duì)時(shí)能夠更高效地進(jìn)行驗(yàn)證和修正。

推理是什么?為何如此強(qiáng)大?

下面依然是來(lái)自 AI 對(duì)直播的總結(jié)

deepseek v3模型為何具備天然的推理能力和對(duì)錯(cuò)判斷能力?強(qiáng)化學(xué)習(xí)是如何幫助DeepSeek v3實(shí)現(xiàn)強(qiáng)大推理能力的?
直播總結(jié):deepseek v3在早期版本中就采用了code模型進(jìn)行訓(xùn)練,尤其是針對(duì)編程語(yǔ)言的學(xué)習(xí),使它能夠從一開始就獲得基本的對(duì)錯(cuò)判斷能力。在合并了chat模型和code模型后,這種強(qiáng)推理能力被賦予了整個(gè)模型。強(qiáng)化學(xué)習(xí)是DeepSeek v3訓(xùn)練過(guò)程中采用的關(guān)鍵技術(shù),類似于阿爾法狗打敗柯潔事件中所展現(xiàn)的非傳統(tǒng)人類棋譜策略,讓模型通過(guò)學(xué)習(xí)和實(shí)踐來(lái)優(yōu)化決策,而非依賴于大量的歷史數(shù)據(jù)背誦。

這些機(jī)器人通過(guò)比賽學(xué)習(xí)到了什么?
直播總結(jié):機(jī)器人學(xué)會(huì)了兩件事情:一是如何下棋并贏得比賽,即知道了贏得比賽的方法和正確錯(cuò)誤的判斷標(biāo)準(zhǔn);二是能根據(jù)歷史數(shù)據(jù)推斷出每一步棋對(duì)應(yīng)的結(jié)果,并了解這一步棋如何導(dǎo)向最終的勝負(fù),這實(shí)際上是一種因果推理的過(guò)程。

強(qiáng)化學(xué)習(xí)中self play是什么意思?
直播總結(jié):self play是指讓機(jī)器人自己與自己進(jìn)行對(duì)弈,通過(guò)不斷的游戲來(lái)學(xué)習(xí)和提升,利用自身的勝負(fù)判斷條件來(lái)進(jìn)行推理和學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)具體是怎么運(yùn)作的?
直播總結(jié):在強(qiáng)化學(xué)習(xí)中,系統(tǒng)會(huì)給出一個(gè)問(wèn)題和答案,并給出明確的對(duì)錯(cuò)判斷標(biāo)準(zhǔn)。例如,讓大模型去做數(shù)學(xué)題、下象棋或編寫程序,系統(tǒng)具備完全正確的評(píng)判標(biāo)準(zhǔn),產(chǎn)生大量訓(xùn)練語(yǔ)料后,大模型通過(guò)自我對(duì)弈和回顧復(fù)盤,逐漸學(xué)習(xí)到判斷好壞的標(biāo)準(zhǔn)。

大模型的語(yǔ)言文字表達(dá)能力是如何涌現(xiàn)出來(lái)的?
直播總結(jié):大模型首先學(xué)會(huì)了數(shù)學(xué)和一些領(lǐng)域知識(shí)的正確錯(cuò)誤判斷標(biāo)準(zhǔn),然后將這種能力應(yīng)用于語(yǔ)言理解中,發(fā)現(xiàn)也能判斷文字表達(dá)的優(yōu)劣。DeepSeek的R1通過(guò)自身生成的大量語(yǔ)料進(jìn)行訓(xùn)練和迭代,最終擁有了強(qiáng)大的文字表達(dá)能力,這是強(qiáng)化學(xué)習(xí)帶來(lái)的“涌現(xiàn)”效應(yīng),即在大量信息和條件變化下產(chǎn)生的新能力。

手機(jī)/電腦部署的“平替”為什么不靠譜?

這里涉及到一個(gè)叫做“蒸餾”的概念。

你能在自己電腦或者手機(jī)上部署的 DeepSeek R1,下載的模型都帶著一個(gè)distill-qwen。

它的意思是,你用的模型,是用 DeepSeek R1 教會(huì)了推理的通義千問(wèn)模型。

咱不是說(shuō)通義千問(wèn)的模型不行,但是它肯定不如 DeepSeek V3。

以及,能在手機(jī)電腦上運(yùn)行的模型,不會(huì)超過(guò) 14B。

DeepSeek 官網(wǎng)用的 R1 的底摸是 671B。

先別管B是什么意思,671 是 14 的接近 50 倍。

相當(dāng)于你讓一個(gè)知識(shí)面只有 1/50 的模型,學(xué)會(huì)了奧數(shù)的推理方法。

所以,直接不用試了,浪費(fèi)時(shí)間毫無(wú)意義。

關(guān)于蒸餾的詳細(xì)內(nèi)容,直播中有詳細(xì)的介紹,文末拿回放獲取方式。

對(duì)普通人的影響?

總結(jié)兩句話:

  1. 1. 普通人有了一個(gè)可以免費(fèi)學(xué)習(xí)表達(dá)的對(duì)象;

  2. 2. 普通人想要變強(qiáng)必須提升表達(dá)能力。

這里我來(lái)稍微多說(shuō)一下 DeepSeekR1 時(shí)代有效的表達(dá)是什么,其他的內(nèi)容自己看直播回放。

什么是提問(wèn)的指向性,并為何重要?如何設(shè)置有指向性的提問(wèn)?

直播總結(jié):提問(wèn)的指向性是指在表達(dá)時(shí)要有明確的目的、訴求或動(dòng)機(jī),讓接收方能清晰地了解說(shuō)話人的意圖。
缺乏指向性的問(wèn)題就如同無(wú)目的地說(shuō)話,不僅浪費(fèi)對(duì)方時(shí)間,也容易導(dǎo)致溝通無(wú)效。
在AI交互中,明確的指向性能夠讓AI更好地理解和執(zhí)行用戶的指令,實(shí)現(xiàn)更精準(zhǔn)的結(jié)果輸出。設(shè)置指向性提問(wèn)時(shí),需要在坐標(biāo)軸上確定起點(diǎn)和終點(diǎn)。
例如,寫文案既可以作為工作的終點(diǎn)目標(biāo),也可以作為實(shí)現(xiàn)轉(zhuǎn)化、吸引流量等終點(diǎn)的起點(diǎn)。
因此,在提問(wèn)時(shí)要具體說(shuō)明文案的目的,比如是為了完成KPI還是為了產(chǎn)品轉(zhuǎn)化,這樣AI才能根據(jù)明確的指向性生成符合要求的內(nèi)容。

直播回放視頻&逐字稿總結(jié)

我把直播回放放在知識(shí)星球了,掃碼領(lǐng)券加入領(lǐng)取。


星球內(nèi)容很多,進(jìn)去以后往前翻一翻,2 月 5 日發(fā)的主題。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
史上最強(qiáng)ML神游,誕生于火爆全球的AI模型中?
DeepSeek破圈,AI商業(yè)化臨界點(diǎn)是如何被打開的?
DeepSeek對(duì)AI板塊的影響
白話科普 | 深度解析AI自學(xué)習(xí)與強(qiáng)化學(xué)習(xí):大模型背后的“黑科技”,如何讓AI更聰明?深入淺出DeepSeek等大模型特殊技能
DeepSeek-V3巧取捷徑?
性能匹敵GPT
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服