幾乎一夜之間,所有人都在關(guān)注DeepSeek,甚至我在老家,完全沒用過AI的七大姑八大姨,都在問我,DeepSeek是什么,怎么用。
今天就來聊一聊DeepSeek,話不多說,開始。
簡單來說,DeepSeek
它是一款A(yù)I大模型,類似于ChatGPT
、豆包
、Kimi
這樣的AI工具。網(wǎng)頁版、APP端都能使用,
但真正讓它火爆出圈的,是它的“深度思考”模式(R1)。
它不僅能給出答案,而且還能像學(xué)霸解題一樣,有推導(dǎo)、分析、檢查過程。相比普通AI模型只是機(jī)械地復(fù)述信息,它更像一個真正會思考的智能助手。
DeepSeek(深度求索),是一家在2023年7月17日成立的公司深度求索所開發(fā)的大模型名稱。公司坐落于杭州,是幻方量化旗下的子公司,全稱是杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司。
DeepSeek
開發(fā)團(tuán)隊是由一群年輕且富有才華的高校畢業(yè)生組成,團(tuán)隊創(chuàng)始人梁文鋒,是量化投資領(lǐng)域的資深專家,擁有豐富的量化投資經(jīng)驗和AI技術(shù)背景。其它主要成員大多數(shù)來自清華大學(xué)、北京大學(xué)和浙江大學(xué)等國內(nèi)頂尖高校。
DeepSeek火爆出圈的最大原因是,它以極低的成本,做出了能比肩海外巨頭的AI大模型。
DeepSeek 成立時間雖才一年多,但已經(jīng)在中美APP store登上免費應(yīng)用榜首,且應(yīng)用成果和行業(yè)影響顯著:
2024年5月,發(fā)布DeepSeek-V2,正式打響中國大模型價格戰(zhàn),當(dāng)時新發(fā)布的 DeepSeek-V2 的API價格只有 GPT-4o 的 2.7%,隨后一周時間,國產(chǎn)廠商全部跟進(jìn)紛紛降價。
2024年12月,DeepSeek推出的DeepSeek-V3,在全球AI領(lǐng)域掀起了巨大的波瀾,它以極低的訓(xùn)練成本,據(jù)說訓(xùn)練成本不到600W美元,實現(xiàn)了與GPT-4o和Claude Sonnet 3.5等頂尖模型相媲美的性能,震驚了業(yè)界。自此,東方的神秘力量徹底坐實。
時隔不到一個月,2025年1月,DeepSeek又一次震動全球AI圈。和上次不同的是,今年1月份推出的新模型DeepSeek-R1
不僅成本低,更是在技術(shù)上有了大幅提升。這款新模型延續(xù)了其高性價比的優(yōu)勢,僅用十分之一的成本就達(dá)到了GPT-o1級別的表現(xiàn),API定價僅是國內(nèi)外其他頭部AI廠商幾十分之一。DeepSeek R1出現(xiàn)如同一匹黑馬,以驚人的姿態(tài)闖入AI圈。它不僅讓英偉達(dá)市值一夜蒸發(fā)超1萬億美金,更是讓各路AI大佬瞬間破防。
而且,更重要的是,DeepSeek還是一個開源模型。你沒看錯,DeepSeek-V3
、DeepSeek-R1
模型全部開源,這種開源策略不僅促進(jìn)了技術(shù)生態(tài)的發(fā)展,還會降低了企業(yè)的使用成本,促進(jìn)AI大模型的普及率。與此同時,開源還意味著:
在硅谷,類似DeepSeek
這樣的AI創(chuàng)新并不少有,只是這次是一家中國公司做出了這個動作,相比傳統(tǒng)的"美國創(chuàng)新、中國應(yīng)用" 的模式顯得格外的讓人興奮。
簡單小結(jié)一下,OpenAI的GPT-4o模型雖強(qiáng)大,但光訓(xùn)練成本可能就已經(jīng)達(dá)到上億美元。而DeepSeek僅用了幾百萬美金,做出了性能接近的模型。再加上它對中文理解極佳,回答更自然,不像其他AI過于“模板化”,這也是它受歡迎的原因之一。
我也讓DeepSeek
列個GPT-4o
和o1
的對比表格,大家應(yīng)該也能一目了然。
而R1,可以直接類比o1,兩者在跑分上,幾乎相同。
所以,很多業(yè)內(nèi)人士甚至喊出了“DeepSeek接班OpenAI”的口號。
DeepSeek 相關(guān)模型已經(jīng)開源,以下是不同模型的開源地址:
1、DeepSeek Coder
,它是代碼大模型,倉庫地址為:
https://github.com/DeepSeek-AI/DeepSeek-Coder
在這個倉庫中,你可以找到模型的詳細(xì)介紹、使用文檔、代碼示例,還能下載對應(yīng)的模型權(quán)重來開展開發(fā)工作。
2、DeepSeek LLM
, 它是通用大語言模型,倉庫地址為:
https://github.com/DeepSeek-AI/DeepSeek-LLM
這里有關(guān)于該模型的架構(gòu)、訓(xùn)練方法等方面的介紹,同時也提供了模型使用的指引。
3、DeepSeek-R1
,倉庫地址:
https://github.com/deepseek-ai/DeepSeek-R1
論文鏈接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
DeepSeek 具有多種強(qiáng)大功能,主要體現(xiàn)在以下幾個方面:
1、高效信息處理與學(xué)習(xí)
2、專業(yè)領(lǐng)域輔助
3、創(chuàng)意與內(nèi)容生產(chǎn)
4、日常效率工具
對于大多數(shù)人來說,最為常用的有幾類AI使用場景:
當(dāng)然,借助AI生產(chǎn)我們所需要的內(nèi)容時,往往通過多個AI工具組合效果會更佳,比如用DeepSeek寫文案,再用AI配圖工具(如Midjourney、即夢)制作配圖。用DeepSeek自動寫代碼,再用ChatGPT優(yōu)化代碼邏輯等。
這部分照顧一下新手,老司機(jī)可跳過。目前 DeepSeek 有 2 個地方可使用,一個是網(wǎng)頁端,一個就是 APP。
1、網(wǎng)頁端沒什么好說的,訪問官網(wǎng)鏈接:https://chat.deepseek.com
或訪問https://ai.com
直接就可以登錄,可以使用手機(jī)號或者微信登錄。
2、移動端,可以直接在各大應(yīng)用商店搜索"DeepSeek"
,或者在網(wǎng)頁端直接掃碼下載:
操作基本也和網(wǎng)頁端差不多,同樣的簡單純粹。
溫馨提示:請關(guān)閉你的一切代理,另外注冊的話要用國內(nèi)手機(jī)號,別問為什么,前人經(jīng)驗。
在上述對話框中不做操作用的就是默認(rèn)的 DeepSeek-V3
模型,點擊「深度思考」才會切換到 DeepSeek-R1
模型。
3、那 DeepSeek-V3
和DeepSeek-R1
這兩使用起來啥區(qū)別呢?
V3 和平時大家使用的ChatGPT
、豆包
、kimi
類似,能快速處理任務(wù),屬于指令型模型,而R1 則是一種推理模型,AI 自己會深度思考來解決復(fù)雜的任務(wù)。
這也是DeepSeek R1
最有價值以及能在眾多AI模型中脫穎而出的原因之一,因為它不只是給出答案,而是能像學(xué)霸解題一樣,有推導(dǎo)、分析、檢查,有完整的思考過程。且這個思考過程是不帶任何個人主觀,非常客觀的思考推理過程,這個思考過程能更好的引導(dǎo)我們向正確的方向去思考。
4、相信你也看到了旁邊還有個「聯(lián)網(wǎng)搜索」按鈕,點了他,DeepSeek 就能幫你搜索互聯(lián)網(wǎng)上資料,類似百度搜索這種。
因為 DeepSeek 默認(rèn)情況下使用的是幾個月前的訓(xùn)練數(shù)據(jù),所以如果我們想要參考最新的消息,就得開啟聯(lián)網(wǎng)搜索,以便聯(lián)網(wǎng)獲取實時信息。
指令型AI模型是一種基于預(yù)設(shè)規(guī)則和指令的AI模型,它按照給定的指令執(zhí)行特定的任務(wù)。特點是高度結(jié)構(gòu)化、任務(wù)明確、依賴預(yù)設(shè)規(guī)則。并按照指令輸出相應(yīng)的結(jié)果。
代表 AI 工具:ChatGPT
、文心一言
、通義千問
、豆包
、Kimi
等。需要說明的是幾乎目前像 GPT 等主流大模型都屬于指令型大模型。
指令型AI在對話時,需要給出清晰、具體的指令,且提供結(jié)構(gòu)化的數(shù)據(jù)或信息,便于模型處理。使用指令型AI工具時,無論是生成文本、圖片還是視頻,如果你想得到相對準(zhǔn)確的答案,核心是你的指令提示詞一定要準(zhǔn)確。
指令型AI提問技巧,也可以說是AI的提問萬能公式,通常需遵循四步:
指令型模型需要你事無巨細(xì)的交代流程,他才能明白怎么做,也就誕生了很多prompt 模板,甚至產(chǎn)生了很多的提示詞工程師。
毫無夸張地說,AI 提示詞在推理型模型沒出前,是學(xué)習(xí) AI 必須掌握的技能。
推理模型是一種基于數(shù)據(jù)分析和邏輯推理的AI模型,它能夠從數(shù)據(jù)中提取知識,進(jìn)行自主學(xué)習(xí)、推理和決策。它側(cè)重于從已知信息中挖掘潛在的規(guī)律和關(guān)系。
代表AI工具:DeepSeek
。
使用 DeepSeek 這類推理模型的AI工具,非常簡單,它拋棄之前繁瑣的提問模板,直接描述清楚你的問題即可。
例如:
可以看到 DeepSeek 加了很多內(nèi)心戲,畫面感更強(qiáng),也能體現(xiàn)很多思考推理的細(xì)節(jié)。
指令型大模型和推理型大模型,這就像兩個員工:
很多人初次體驗DeepSeek,發(fā)現(xiàn)它有時候答非所問,或者說話太高大上,不夠接地氣。其實,這只是你的用法不對。這就像看著一群人拿著東風(fēng)導(dǎo)彈去炸魚,還嫌水花不夠大一樣一樣的。
當(dāng)使用推理型模型DeepSeek R1
,你只需要直接提需求,但如果你在此基礎(chǔ)上稍加優(yōu)化,就更加完美了,讓回答更加接近你的提問。
如果真的需要有一個萬能Prompt模板,送你一個萬能的提問公式:背景+需求(你的目標(biāo))+約束條件(可選)
,背景信息給的越多越能讓DeepSeek R1
理解你的需求幫助你更好的完成任務(wù)。
比如: 我是編程小白(交代背景),怎樣快速的提高我的Java編程能力(提出需求),不考慮英語水平(約束條件)
更加通俗一點,推理型AI提示詞公式,可拆分為四個關(guān)鍵要素:
比如: 我要做一個小紅書的創(chuàng)業(yè)筆記,要給想做副業(yè)的人用,希望能讓他們快速的理解小紅書應(yīng)該如何賺錢,但我擔(dān)心這些創(chuàng)業(yè)小白并不能理解商業(yè)的很多專業(yè)名詞和概念。
總之,在使用DeepSeek
時,不需要你寫"專業(yè)提示詞",直接用自然語言清晰地表達(dá)出真實場景和具體需求就行了。
在使用DeepSeek,還有一個好用的技巧,就是讓它“說人話” 。如果AI的回答太過于專業(yè),或者晦澀難懂,因為所有的AI回答,在你沒有經(jīng)過專業(yè)知識學(xué)習(xí)之前,它的回答通常都會有一些抽象和官方,有時候還是不方便普遍人理解,這個時候,你直接跟deepseek補(bǔ)充回復(fù):“說人話
”,你會發(fā)現(xiàn)它的表達(dá)瞬間變得直白易懂。
例如,你向DeepSeek輸入:"什么是TCP三次握手"
上述回答的答案,如果是非技術(shù)專業(yè)的人員,幾乎看不懂,不過沒關(guān)系,你只需要繼續(xù)補(bǔ)充:“說人話”
是不是,它的回答瞬間變得通俗易懂了,基本上是個人都能看的懂了。
在向DeepSeek
提問時,你還可以讓DeepSeek
模仿名人風(fēng)格,因為它對中文的掌握能力極強(qiáng),能模仿名人的寫作風(fēng)格。如果你想寫一篇特別有味道的文章,不妨讓它模仿某位名人的筆觸。
這也是我很喜歡用的一個小技巧,比如我們在寫文章或者做視頻的時候都喜歡找對標(biāo)對吧。
比如你想模仿對標(biāo)賬號的文風(fēng),你完全可以這樣提問:幫我模仿XXX的語氣,幫我分析下2025年經(jīng)濟(jì)環(huán)境
。
相信最近使用 DeepSeek 都遇到過「服務(wù)器繁忙,請稍后再試」的提示(特別是晚上),使用的人太多加上遭到一堆人攻擊導(dǎo)致的。
這個時候,你可以到:https://status.deepseek.com
這個地址查看 deepseek 的服務(wù)狀態(tài)。
一般來說,當(dāng)服務(wù)狀態(tài)為紅色時,表明服務(wù)壓力大,就會較頻繁出現(xiàn)異常提示了。
當(dāng)然你也可以訂閱異常狀態(tài),有異常就會發(fā)送到你的郵箱了。
上面只能查看DeepSeek服務(wù)狀態(tài),但無法從根本上解決,下一篇我們會分享,如何從根本上解決DeepSeek使用過程卡頓的問題,屏幕前的你可以留言,還想了解學(xué)習(xí)DeepSeek哪方面的內(nèi)容呢?
DeepSeek
快速在全球爆火,它到底是資本炒作,還是國產(chǎn)AI崛起的里程碑?目前沒人能給出準(zhǔn)確答案。但至少,它讓我們看到國產(chǎn)AI的潛力,也讓更多人開始關(guān)注、學(xué)習(xí)、使用AI?;蛟S,再過幾年,AI助手會像智能手機(jī)一樣普及。而DeepSeek
,可能正是推動這場變革的重要力量之一,因為它正在重新定義AI的未來。
好了,今天就先聊到這吧,下篇見!
計劃近期會抽空創(chuàng)建一個AI知識星球和交流社群,對AI感興趣的讀者,可以先加入占坑。
如果覺得不錯,隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標(biāo)?~謝謝你看我的文章,我們,下次再見。