观看美女视频,美女视频全是黄的a,正经的酒肉美女视频

今天短視頻平臺(tái)上，幾千上萬(wàn)點(diǎn)贊的關(guān)于 DeepSeek 的內(nèi)容，大部分都是忽悠你的。

DeepSeek 太火了，以至于原來(lái)教你做短視頻的、做個(gè)人 IP 的，甚至教你線下開店的自媒體老師們，連年都不過(guò)，在老家的廁所里錄視頻教你用 DeepSeek 賦能。

連 DeepSeek V3 和 DeepSeek R1 都沒(méi)搞懂，張嘴就“用 DeepSeek 美化照片太牛了”。

那些做視頻的人根本不懂，只是因?yàn)椴溥@個(gè)有流量。

這篇文章，寫給頭腦清晰的朋友。

（確保你頭腦清晰或者希望自己這樣，否則下面的截圖可能會(huì)誤傷到你）

我昨天在校友群里稍帶“諷刺性”的給在做號(hào)的同學(xué)說(shuō)了幾個(gè)選題方向

昨晚有群友試了一下，分分鐘過(guò)千曝光……

希望正在讀這篇文章的你，不是這類內(nèi)容的受眾之一。

DeepSeek 這波熱門，最有價(jià)值的是 R1（也就是那個(gè)推理思考過(guò)程）以及推理思考后的答案。

如果只是用 DeepSeek，它并沒(méi)有比別的 AI 工具在使用體驗(yàn)上強(qiáng)多少。

所以那些上來(lái)就教你“用 DeepSeek 寫腳本”、“用 DeepSeek PS 照片”、“用 DeepSeek 做個(gè)人知識(shí)庫(kù)”的，都是“……”。

如果你真的希望了解 AI、DeepSeek 會(huì)給你帶來(lái)什么影響，那么你應(yīng)該關(guān)注的是 DeepSeek R1，它才是改變技術(shù)和世界的東西；

但如果你只是想跟一下熱點(diǎn)，不讓自己太“out”，那么你就更必須得關(guān)注 DeepSeek R1 才行，否則你會(huì)露怯，反倒更丟人；

所以，你關(guān)注對(duì)了么？

你能分清楚普通 DeepSeek 和 R1 的區(qū)別了么？

你知道為什么 R1 引發(fā)全球矚目了么？

你知道為什么所有用過(guò) R1 的人都陷入深深地自我懷疑了么？

不知道也沒(méi)事，它其實(shí)很簡(jiǎn)單。

我開工第一天的晚上，做了一場(chǎng)兩個(gè)半小時(shí)的直播，從“大模型基礎(chǔ)”開始講起，(我個(gè)人感覺(jué))通俗易懂的講了一遍“ DeepSeek R1 為什么這么強(qiáng)，它對(duì)我們有什么影響”。

這是校友昨天上午聽直播前對(duì) R1 的感受：

到晚上聽直播回放后，實(shí)現(xiàn)乾坤大挪移：

如果你錯(cuò)過(guò)了，也沒(méi)關(guān)系。這篇文章把直播的關(guān)鍵信息給大家做一番總結(jié)，讓你也能更清晰的認(rèn)知 DeepSeek R1。

直播的關(guān)鍵信息：

1. DeepSeek為什么這么強(qiáng)？
2. 推理模式、強(qiáng)化學(xué)習(xí)是什么？
3. 為什么私有部署不靠譜，蒸餾是什么？
4. 對(duì)普通人有啥影響，還需要學(xué)習(xí)提示詞么？
5. 怎么流暢的用上DeepSeek？

DeepSeek R1 為什么這么火？

原因很簡(jiǎn)單，就兩個(gè)字：便宜。

這里的“便宜”是面向所有人的：

· 對(duì)全球的大模型創(chuàng)業(yè)者來(lái)說(shuō)，訓(xùn)練研發(fā)成本降到了 10%；
· 對(duì)全球的大模型研究者來(lái)說(shuō)，所有研究細(xì)節(jié)開源免費(fèi)試用；
· 對(duì)全球的大模型使用者來(lái)說(shuō)，不花錢就能用上付費(fèi) ChatGPT 同水平的智能。

R1 這樣的模型，2024 年 10 月 ChatGPT 就上線了。

名字叫 o1，需要充值 20 美元/月的 Plus 才能使用，并且限量、不顯示思考過(guò)程。

以及 OpenAI 這個(gè) Gou 公司閉源、不介紹任何技術(shù)細(xì)節(jié)，搞得全球的科研人員都很煩躁。

DeepSeek 春節(jié)前發(fā)布 R1 這樣的：模型、數(shù)據(jù)、權(quán)重全部開源；線上版本免費(fèi)不限量使用；展示全部思考推理過(guò)程。

能不炸么！

從國(guó)外火回國(guó)內(nèi)的起點(diǎn)是這個(gè)，但是真正能持續(xù)爆火的原因，是 R1 實(shí)在是太太太太太太太太強(qiáng)了！

隨便截圖一個(gè) DeepSeek 的思考過(guò)程：

在此基礎(chǔ)上生成的答案，又是「逆天」級(jí)別

那么，如此強(qiáng)大的 AI，怎么做到極致性價(jià)比呢？

從大模型訓(xùn)練方法講起

我用通義聽悟總結(jié)了直播回放這部分的內(nèi)容，直接復(fù)制粘貼吧。

（AI 總結(jié)有些偷懶，詳細(xì)的回答在文末有直播回放的獲取方式）

大模型訓(xùn)練過(guò)程中的主要階段有哪些？微調(diào)階段對(duì)大模型的影響是什么？
直播總結(jié)：主要階段包括預(yù)訓(xùn)練和微調(diào)。預(yù)訓(xùn)練階段生成預(yù)訓(xùn)練模型，之后進(jìn)行微調(diào)以得到更精準(zhǔn)的模型，并通過(guò)人工驗(yàn)校來(lái)提升模型的質(zhì)量。在微調(diào)階段，給定的內(nèi)容質(zhì)量和人工打分/校驗(yàn)決定了大模型回答問(wèn)題的水平。這意味著人類對(duì)于模型好壞判斷的標(biāo)準(zhǔn)直接限定了大模型的發(fā)展水平。

預(yù)訓(xùn)練模型參數(shù)量的巨大意味著什么？
直播總結(jié)：擁有4000億個(gè)參數(shù)的預(yù)訓(xùn)練模型就像一個(gè)人要掌握所有學(xué)科知識(shí)并應(yīng)用到建設(shè)祖國(guó)中，所需消耗的算力和資源非常龐大，這也是成本高昂的原因之一。

MoE模型是如何降低成本和提高效率的？
直播總結(jié)：MOE模型采用多專家協(xié)作模式，將參數(shù)分散到多個(gè)模型上，每個(gè)模型針對(duì)特定領(lǐng)域優(yōu)化，這樣既能節(jié)省資源，又能更好地處理跨學(xué)科問(wèn)題，降低訓(xùn)練和推理過(guò)程中的成本。

DeepSeek在訓(xùn)練R1模型時(shí)，問(wèn)答對(duì)兒是如何生成的？這種AI生成的訓(xùn)練內(nèi)容如何降低成本？
直播總結(jié)：?jiǎn)柎饘?duì)是通過(guò)AI生成的，具體過(guò)程是使用引導(dǎo)性提示詞讓deepseek v3生成帶有過(guò)程推理和分析的QA對(duì)進(jìn)行訓(xùn)練。成本降低體現(xiàn)在兩個(gè)方面：一是訓(xùn)練內(nèi)容由AI生成，降低了人工生產(chǎn)成本；二是deepseek v3模型本身具備一定的對(duì)錯(cuò)判斷標(biāo)準(zhǔn)，在人工校對(duì)時(shí)能夠更高效地進(jìn)行驗(yàn)證和修正。

推理是什么？為何如此強(qiáng)大？

下面依然是來(lái)自 AI 對(duì)直播的總結(jié)

deepseek v3模型為何具備天然的推理能力和對(duì)錯(cuò)判斷能力？強(qiáng)化學(xué)習(xí)是如何幫助DeepSeek v3實(shí)現(xiàn)強(qiáng)大推理能力的？
直播總結(jié)：deepseek v3在早期版本中就采用了code模型進(jìn)行訓(xùn)練，尤其是針對(duì)編程語(yǔ)言的學(xué)習(xí)，使它能夠從一開始就獲得基本的對(duì)錯(cuò)判斷能力。在合并了chat模型和code模型后，這種強(qiáng)推理能力被賦予了整個(gè)模型。強(qiáng)化學(xué)習(xí)是DeepSeek v3訓(xùn)練過(guò)程中采用的關(guān)鍵技術(shù)，類似于阿爾法狗打敗柯潔事件中所展現(xiàn)的非傳統(tǒng)人類棋譜策略，讓模型通過(guò)學(xué)習(xí)和實(shí)踐來(lái)優(yōu)化決策，而非依賴于大量的歷史數(shù)據(jù)背誦。

這些機(jī)器人通過(guò)比賽學(xué)習(xí)到了什么？
直播總結(jié)：機(jī)器人學(xué)會(huì)了兩件事情：一是如何下棋并贏得比賽，即知道了贏得比賽的方法和正確錯(cuò)誤的判斷標(biāo)準(zhǔn)；二是能根據(jù)歷史數(shù)據(jù)推斷出每一步棋對(duì)應(yīng)的結(jié)果，并了解這一步棋如何導(dǎo)向最終的勝負(fù)，這實(shí)際上是一種因果推理的過(guò)程。

強(qiáng)化學(xué)習(xí)中self play是什么意思？
直播總結(jié)：self play是指讓機(jī)器人自己與自己進(jìn)行對(duì)弈，通過(guò)不斷的游戲來(lái)學(xué)習(xí)和提升，利用自身的勝負(fù)判斷條件來(lái)進(jìn)行推理和學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)具體是怎么運(yùn)作的？
直播總結(jié)：在強(qiáng)化學(xué)習(xí)中，系統(tǒng)會(huì)給出一個(gè)問(wèn)題和答案，并給出明確的對(duì)錯(cuò)判斷標(biāo)準(zhǔn)。例如，讓大模型去做數(shù)學(xué)題、下象棋或編寫程序，系統(tǒng)具備完全正確的評(píng)判標(biāo)準(zhǔn)，產(chǎn)生大量訓(xùn)練語(yǔ)料后，大模型通過(guò)自我對(duì)弈和回顧復(fù)盤，逐漸學(xué)習(xí)到判斷好壞的標(biāo)準(zhǔn)。

大模型的語(yǔ)言文字表達(dá)能力是如何涌現(xiàn)出來(lái)的？
直播總結(jié)：大模型首先學(xué)會(huì)了數(shù)學(xué)和一些領(lǐng)域知識(shí)的正確錯(cuò)誤判斷標(biāo)準(zhǔn)，然后將這種能力應(yīng)用于語(yǔ)言理解中，發(fā)現(xiàn)也能判斷文字表達(dá)的優(yōu)劣。DeepSeek的R1通過(guò)自身生成的大量語(yǔ)料進(jìn)行訓(xùn)練和迭代，最終擁有了強(qiáng)大的文字表達(dá)能力，這是強(qiáng)化學(xué)習(xí)帶來(lái)的“涌現(xiàn)”效應(yīng)，即在大量信息和條件變化下產(chǎn)生的新能力。

手機(jī)/電腦部署的“平替”為什么不靠譜？

這里涉及到一個(gè)叫做“蒸餾”的概念。

你能在自己電腦或者手機(jī)上部署的 DeepSeek R1，下載的模型都帶著一個(gè)distill-qwen。

它的意思是，你用的模型，是用 DeepSeek R1 教會(huì)了推理的通義千問(wèn)模型。

咱不是說(shuō)通義千問(wèn)的模型不行，但是它肯定不如 DeepSeek V3。

以及，能在手機(jī)電腦上運(yùn)行的模型，不會(huì)超過(guò) 14B。

DeepSeek 官網(wǎng)用的 R1 的底摸是 671B。

先別管B是什么意思，671 是 14 的接近 50 倍。

相當(dāng)于你讓一個(gè)知識(shí)面只有 1/50 的模型，學(xué)會(huì)了奧數(shù)的推理方法。

所以，直接不用試了，浪費(fèi)時(shí)間毫無(wú)意義。

關(guān)于蒸餾的詳細(xì)內(nèi)容，直播中有詳細(xì)的介紹，文末拿回放獲取方式。

對(duì)普通人的影響？

總結(jié)兩句話：

1. 普通人有了一個(gè)可以免費(fèi)學(xué)習(xí)表達(dá)的對(duì)象；
2. 普通人想要變強(qiáng)必須提升表達(dá)能力。

這里我來(lái)稍微多說(shuō)一下 DeepSeekR1 時(shí)代有效的表達(dá)是什么，其他的內(nèi)容自己看直播回放。

什么是提問(wèn)的指向性，并為何重要？如何設(shè)置有指向性的提問(wèn)？

直播總結(jié)：提問(wèn)的指向性是指在表達(dá)時(shí)要有明確的目的、訴求或動(dòng)機(jī)，讓接收方能清晰地了解說(shuō)話人的意圖。
缺乏指向性的問(wèn)題就如同無(wú)目的地說(shuō)話，不僅浪費(fèi)對(duì)方時(shí)間，也容易導(dǎo)致溝通無(wú)效。
在AI交互中，明確的指向性能夠讓AI更好地理解和執(zhí)行用戶的指令，實(shí)現(xiàn)更精準(zhǔn)的結(jié)果輸出。設(shè)置指向性提問(wèn)時(shí)，需要在坐標(biāo)軸上確定起點(diǎn)和終點(diǎn)。
例如，寫文案既可以作為工作的終點(diǎn)目標(biāo)，也可以作為實(shí)現(xiàn)轉(zhuǎn)化、吸引流量等終點(diǎn)的起點(diǎn)。
因此，在提問(wèn)時(shí)要具體說(shuō)明文案的目的，比如是為了完成KPI還是為了產(chǎn)品轉(zhuǎn)化，這樣AI才能根據(jù)明確的指向性生成符合要求的內(nèi)容。

直播回放視頻&逐字稿總結(jié)

我把直播回放放在知識(shí)星球了，掃碼領(lǐng)券加入領(lǐng)取。

星球內(nèi)容很多，進(jìn)去以后往前翻一翻，2 月 5 日發(fā)的主題。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

DeepSeek R1 為什么這么火？

從大模型訓(xùn)練方法講起

推理是什么？為何如此強(qiáng)大？

手機(jī)/電腦部署的“平替”為什么不靠譜？

對(duì)普通人的影響？

直播回放視頻&逐字稿總結(jié)

DeepSeek R1 為什么這么火？

推理是什么？為何如此強(qiáng)大？

手機(jī)/電腦部署的“平替”為什么不靠譜？

對(duì)普通人的影響？