今天短視頻平臺(tái)上,幾千上萬(wàn)點(diǎn)贊的關(guān)于 DeepSeek 的內(nèi)容,大部分都是忽悠你的。
DeepSeek 太火了,以至于原來(lái)教你做短視頻的、做個(gè)人 IP 的,甚至教你線下開店的自媒體老師們,連年都不過(guò),在老家的廁所里錄視頻教你用 DeepSeek 賦能。
連 DeepSeek V3 和 DeepSeek R1 都沒(méi)搞懂,張嘴就“用 DeepSeek 美化照片太牛了”。
那些做視頻的人根本不懂,只是因?yàn)椴溥@個(gè)有流量。
這篇文章,寫給頭腦清晰的朋友。
(確保你頭腦清晰或者希望自己這樣,否則下面的截圖可能會(huì)誤傷到你)
我昨天在校友群里稍帶“諷刺性”的給在做號(hào)的同學(xué)說(shuō)了幾個(gè)選題方向
昨晚有群友試了一下,分分鐘過(guò)千曝光……
希望正在讀這篇文章的你,不是這類內(nèi)容的受眾之一。
DeepSeek 這波熱門,最有價(jià)值的是 R1(也就是那個(gè)推理思考過(guò)程)以及推理思考后的答案。
如果只是用 DeepSeek,它并沒(méi)有比別的 AI 工具在使用體驗(yàn)上強(qiáng)多少。
所以那些上來(lái)就教你“用 DeepSeek 寫腳本”、“用 DeepSeek PS 照片”、“用 DeepSeek 做個(gè)人知識(shí)庫(kù)”的,都是“……”。
如果你真的希望了解 AI、DeepSeek 會(huì)給你帶來(lái)什么影響,那么你應(yīng)該關(guān)注的是 DeepSeek R1,它才是改變技術(shù)和世界的東西;
但如果你只是想跟一下熱點(diǎn),不讓自己太“out”,那么你就更必須得關(guān)注 DeepSeek R1 才行,否則你會(huì)露怯,反倒更丟人;
所以,你關(guān)注對(duì)了么?
你能分清楚普通 DeepSeek 和 R1 的區(qū)別了么?
你知道為什么 R1 引發(fā)全球矚目了么?
你知道為什么所有用過(guò) R1 的人都陷入深深地自我懷疑了么?
不知道也沒(méi)事,它其實(shí)很簡(jiǎn)單。
我開工第一天的晚上,做了一場(chǎng)兩個(gè)半小時(shí)的直播,從“大模型基礎(chǔ)”開始講起,(我個(gè)人感覺(jué))通俗易懂的講了一遍“ DeepSeek R1 為什么這么強(qiáng),它對(duì)我們有什么影響”。
這是校友昨天上午聽直播前對(duì) R1 的感受:
到晚上聽直播回放后,實(shí)現(xiàn)乾坤大挪移:
如果你錯(cuò)過(guò)了,也沒(méi)關(guān)系。這篇文章把直播的關(guān)鍵信息給大家做一番總結(jié),讓你也能更清晰的認(rèn)知 DeepSeek R1。
直播的關(guān)鍵信息:
1. DeepSeek為什么這么強(qiáng)?
2. 推理模式、強(qiáng)化學(xué)習(xí)是什么?
3. 為什么私有部署不靠譜,蒸餾是什么?
4. 對(duì)普通人有啥影響,還需要學(xué)習(xí)提示詞么?
5. 怎么流暢的用上DeepSeek?
原因很簡(jiǎn)單,就兩個(gè)字:便宜。
這里的“便宜”是面向所有人的:
· 對(duì)全球的大模型創(chuàng)業(yè)者來(lái)說(shuō),訓(xùn)練研發(fā)成本降到了 10%;
· 對(duì)全球的大模型研究者來(lái)說(shuō),所有研究細(xì)節(jié)開源免費(fèi)試用;
· 對(duì)全球的大模型使用者來(lái)說(shuō),不花錢就能用上付費(fèi) ChatGPT 同水平的智能。
R1 這樣的模型,2024 年 10 月 ChatGPT 就上線了。
名字叫 o1,需要充值 20 美元/月的 Plus 才能使用,并且限量、不顯示思考過(guò)程。
以及 OpenAI 這個(gè) Gou 公司閉源、不介紹任何技術(shù)細(xì)節(jié),搞得全球的科研人員都很煩躁。
DeepSeek 春節(jié)前發(fā)布 R1 這樣的:模型、數(shù)據(jù)、權(quán)重全部開源;線上版本免費(fèi)不限量使用;展示全部思考推理過(guò)程。
能不炸么!
從國(guó)外火回國(guó)內(nèi)的起點(diǎn)是這個(gè),但是真正能持續(xù)爆火的原因,是 R1 實(shí)在是太太太太太太太太強(qiáng)了!
隨便截圖一個(gè) DeepSeek 的思考過(guò)程:
在此基礎(chǔ)上生成的答案,又是「逆天」級(jí)別
那么,如此強(qiáng)大的 AI,怎么做到極致性價(jià)比呢?
我用通義聽悟總結(jié)了直播回放這部分的內(nèi)容,直接復(fù)制粘貼吧。
(AI 總結(jié)有些偷懶,詳細(xì)的回答在文末有直播回放的獲取方式)
大模型訓(xùn)練過(guò)程中的主要階段有哪些?微調(diào)階段對(duì)大模型的影響是什么?
直播總結(jié):主要階段包括預(yù)訓(xùn)練和微調(diào)。預(yù)訓(xùn)練階段生成預(yù)訓(xùn)練模型,之后進(jìn)行微調(diào)以得到更精準(zhǔn)的模型,并通過(guò)人工驗(yàn)校來(lái)提升模型的質(zhì)量。在微調(diào)階段,給定的內(nèi)容質(zhì)量和人工打分/校驗(yàn)決定了大模型回答問(wèn)題的水平。這意味著人類對(duì)于模型好壞判斷的標(biāo)準(zhǔn)直接限定了大模型的發(fā)展水平。
預(yù)訓(xùn)練模型參數(shù)量的巨大意味著什么?
直播總結(jié):擁有4000億個(gè)參數(shù)的預(yù)訓(xùn)練模型就像一個(gè)人要掌握所有學(xué)科知識(shí)并應(yīng)用到建設(shè)祖國(guó)中,所需消耗的算力和資源非常龐大,這也是成本高昂的原因之一。
MoE模型是如何降低成本和提高效率的?
直播總結(jié):MOE模型采用多專家協(xié)作模式,將參數(shù)分散到多個(gè)模型上,每個(gè)模型針對(duì)特定領(lǐng)域優(yōu)化,這樣既能節(jié)省資源,又能更好地處理跨學(xué)科問(wèn)題,降低訓(xùn)練和推理過(guò)程中的成本。
DeepSeek在訓(xùn)練R1模型時(shí),問(wèn)答對(duì)兒是如何生成的?這種AI生成的訓(xùn)練內(nèi)容如何降低成本?
直播總結(jié):?jiǎn)柎饘?duì)是通過(guò)AI生成的,具體過(guò)程是使用引導(dǎo)性提示詞讓deepseek v3生成帶有過(guò)程推理和分析的QA對(duì)進(jìn)行訓(xùn)練。成本降低體現(xiàn)在兩個(gè)方面:一是訓(xùn)練內(nèi)容由AI生成,降低了人工生產(chǎn)成本;二是deepseek v3模型本身具備一定的對(duì)錯(cuò)判斷標(biāo)準(zhǔn),在人工校對(duì)時(shí)能夠更高效地進(jìn)行驗(yàn)證和修正。
下面依然是來(lái)自 AI 對(duì)直播的總結(jié)
deepseek v3模型為何具備天然的推理能力和對(duì)錯(cuò)判斷能力?強(qiáng)化學(xué)習(xí)是如何幫助DeepSeek v3實(shí)現(xiàn)強(qiáng)大推理能力的?
直播總結(jié):deepseek v3在早期版本中就采用了code模型進(jìn)行訓(xùn)練,尤其是針對(duì)編程語(yǔ)言的學(xué)習(xí),使它能夠從一開始就獲得基本的對(duì)錯(cuò)判斷能力。在合并了chat模型和code模型后,這種強(qiáng)推理能力被賦予了整個(gè)模型。強(qiáng)化學(xué)習(xí)是DeepSeek v3訓(xùn)練過(guò)程中采用的關(guān)鍵技術(shù),類似于阿爾法狗打敗柯潔事件中所展現(xiàn)的非傳統(tǒng)人類棋譜策略,讓模型通過(guò)學(xué)習(xí)和實(shí)踐來(lái)優(yōu)化決策,而非依賴于大量的歷史數(shù)據(jù)背誦。
這些機(jī)器人通過(guò)比賽學(xué)習(xí)到了什么?
直播總結(jié):機(jī)器人學(xué)會(huì)了兩件事情:一是如何下棋并贏得比賽,即知道了贏得比賽的方法和正確錯(cuò)誤的判斷標(biāo)準(zhǔn);二是能根據(jù)歷史數(shù)據(jù)推斷出每一步棋對(duì)應(yīng)的結(jié)果,并了解這一步棋如何導(dǎo)向最終的勝負(fù),這實(shí)際上是一種因果推理的過(guò)程。
強(qiáng)化學(xué)習(xí)中self play是什么意思?
直播總結(jié):self play是指讓機(jī)器人自己與自己進(jìn)行對(duì)弈,通過(guò)不斷的游戲來(lái)學(xué)習(xí)和提升,利用自身的勝負(fù)判斷條件來(lái)進(jìn)行推理和學(xué)習(xí)。
強(qiáng)化學(xué)習(xí)具體是怎么運(yùn)作的?
直播總結(jié):在強(qiáng)化學(xué)習(xí)中,系統(tǒng)會(huì)給出一個(gè)問(wèn)題和答案,并給出明確的對(duì)錯(cuò)判斷標(biāo)準(zhǔn)。例如,讓大模型去做數(shù)學(xué)題、下象棋或編寫程序,系統(tǒng)具備完全正確的評(píng)判標(biāo)準(zhǔn),產(chǎn)生大量訓(xùn)練語(yǔ)料后,大模型通過(guò)自我對(duì)弈和回顧復(fù)盤,逐漸學(xué)習(xí)到判斷好壞的標(biāo)準(zhǔn)。
大模型的語(yǔ)言文字表達(dá)能力是如何涌現(xiàn)出來(lái)的?
直播總結(jié):大模型首先學(xué)會(huì)了數(shù)學(xué)和一些領(lǐng)域知識(shí)的正確錯(cuò)誤判斷標(biāo)準(zhǔn),然后將這種能力應(yīng)用于語(yǔ)言理解中,發(fā)現(xiàn)也能判斷文字表達(dá)的優(yōu)劣。DeepSeek的R1通過(guò)自身生成的大量語(yǔ)料進(jìn)行訓(xùn)練和迭代,最終擁有了強(qiáng)大的文字表達(dá)能力,這是強(qiáng)化學(xué)習(xí)帶來(lái)的“涌現(xiàn)”效應(yīng),即在大量信息和條件變化下產(chǎn)生的新能力。
這里涉及到一個(gè)叫做“蒸餾”的概念。
你能在自己電腦或者手機(jī)上部署的 DeepSeek R1,下載的模型都帶著一個(gè)distill-qwen
。
它的意思是,你用的模型,是用 DeepSeek R1 教會(huì)了推理的通義千問(wèn)模型。
咱不是說(shuō)通義千問(wèn)的模型不行,但是它肯定不如 DeepSeek V3。
以及,能在手機(jī)電腦上運(yùn)行的模型,不會(huì)超過(guò) 14B。
DeepSeek 官網(wǎng)用的 R1 的底摸是 671B。
先別管B
是什么意思,671 是 14 的接近 50 倍。
相當(dāng)于你讓一個(gè)知識(shí)面只有 1/50 的模型,學(xué)會(huì)了奧數(shù)的推理方法。
所以,直接不用試了,浪費(fèi)時(shí)間毫無(wú)意義。
關(guān)于蒸餾的詳細(xì)內(nèi)容,直播中有詳細(xì)的介紹,文末拿回放獲取方式。
總結(jié)兩句話:
1. 普通人有了一個(gè)可以免費(fèi)學(xué)習(xí)表達(dá)的對(duì)象;
2. 普通人想要變強(qiáng)必須提升表達(dá)能力。
這里我來(lái)稍微多說(shuō)一下 DeepSeekR1 時(shí)代有效的表達(dá)是什么,其他的內(nèi)容自己看直播回放。
什么是提問(wèn)的指向性,并為何重要?如何設(shè)置有指向性的提問(wèn)?
直播總結(jié):提問(wèn)的指向性是指在表達(dá)時(shí)要有明確的目的、訴求或動(dòng)機(jī),讓接收方能清晰地了解說(shuō)話人的意圖。
缺乏指向性的問(wèn)題就如同無(wú)目的地說(shuō)話,不僅浪費(fèi)對(duì)方時(shí)間,也容易導(dǎo)致溝通無(wú)效。
在AI交互中,明確的指向性能夠讓AI更好地理解和執(zhí)行用戶的指令,實(shí)現(xiàn)更精準(zhǔn)的結(jié)果輸出。設(shè)置指向性提問(wèn)時(shí),需要在坐標(biāo)軸上確定起點(diǎn)和終點(diǎn)。
例如,寫文案既可以作為工作的終點(diǎn)目標(biāo),也可以作為實(shí)現(xiàn)轉(zhuǎn)化、吸引流量等終點(diǎn)的起點(diǎn)。
因此,在提問(wèn)時(shí)要具體說(shuō)明文案的目的,比如是為了完成KPI還是為了產(chǎn)品轉(zhuǎn)化,這樣AI才能根據(jù)明確的指向性生成符合要求的內(nèi)容。
我把直播回放放在知識(shí)星球了,掃碼領(lǐng)券加入領(lǐng)取。
星球內(nèi)容很多,進(jìn)去以后往前翻一翻,2 月 5 日發(fā)的主題。
聯(lián)系客服