作為一家成立僅一年多的人工智能(AI)初創(chuàng)公司,DeepSeek憑借突破性的AI模型在硅谷收獲了驚嘆和錯愕:該模型的性能不亞于全球最強的那些聊天機器人,而成本看起來只有它們的一個零頭。
DeepSeek的異軍突起,或?qū)I向前發(fā)展將需要越來越多電力和能源的普遍看法構(gòu)成挑戰(zhàn)。
隨著DeepSeek創(chuàng)新引發(fā)的熱度越來越高,投資者開始消化它對其美國競爭對手及它們的硬件供應(yīng)商的影響,全球科技股在1月末大跌。
DeepSeek究竟是什么?
DeepSeek是一家于2023年成立的中國初創(chuàng)企業(yè),創(chuàng)始人是AI驅(qū)動量化對沖基金幻方量化的掌門人梁文鋒。該公司開發(fā)開源AI模型,這意味著廣大的開發(fā)者社區(qū)可以檢查和改進(jìn)軟件。其移動應(yīng)用程序(app)于1月初發(fā)布,然后迅速登頂美國iPhone下載榜。
該app與OpenAI旗下ChatGPT等其他聊天機器人的區(qū)別是,它會在對提示做出回應(yīng)之前闡明其推理過程。該公司聲稱,其R1版本的性能與OpenAI的最新版本相當(dāng),并且允許用戶利用模型輸出、通過模型蒸餾等方式訓(xùn)練其他模型。
DeepSeek R1與OpenAI或Meta AI比起來怎么樣?
盡管該公司沒有詳細(xì)說明培訓(xùn)和開發(fā)DeepSeek模型的成本,但其似乎只是OpenAI或Meta最佳產(chǎn)品的一個零頭。該模型的效率高出了這么多,使得人們懷疑斥巨資購買英偉達(dá)等公司最新、最強大AI加速器的必要性。
DeepSeek R1在幾個主要基準(zhǔn)測評中的表現(xiàn)接近或優(yōu)于競爭對手模型,例如數(shù)學(xué)領(lǐng)域的2024年美國數(shù)學(xué)邀請賽、常識領(lǐng)域的大規(guī)模多任務(wù)語言理解(MMLU)和問答領(lǐng)域的AlpacaEval 2.0。在加州大學(xué)伯克利分校相關(guān)的排行榜Chatbot Arena上,該模型也名列前茅。
DeepSeek何時引發(fā)的全球關(guān)注?
自2023年發(fā)布最早一版模型以來,這家AI開發(fā)商就受到了密切關(guān)注。然后在11月,它向世界展示了一下旨在模仿人類思維模式的DeepSeek R1推理模型。該模式支撐起了其移動聊天機器人app,今年1月,作為一種比OpenAI便宜得多的替代品,其app及網(wǎng)頁版在全球聲名鵲起,投資人Marc Andreessen稱其為“AI的人造衛(wèi)星時刻”。
市場跟蹤機構(gòu)App Figures的數(shù)據(jù)顯示,截至1月25日,DeepSeek移動app在澳大利亞、加拿大、中國、新加坡、美國和英國的iPhone應(yīng)用商店下載量達(dá)到160萬次,排名第一。
DeepSeek的創(chuàng)始人是誰?
梁文鋒1985年出生于廣東,擁有浙江大學(xué)信息與電子工程系學(xué)士和碩士學(xué)位。天眼查數(shù)據(jù)顯示,他創(chuàng)立DeepSeek的注冊資本只有1000萬元人民幣。
梁文鋒曾表示,主要員工大多是中國頂尖高校的應(yīng)屆畢業(yè)生,并強調(diào)英偉達(dá)的領(lǐng)先是整個西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果,中國AI的發(fā)展需要類似的生態(tài)。
“更多的投入并不一定產(chǎn)生更多的創(chuàng)新,否則大廠可以把所有的創(chuàng)新包攬了,”他說。
DeepSeek在中國AI版圖中處于什么位置?
從阿里巴巴集團、百度到騰訊,中國的科技龍頭企業(yè)投入了大量資金和資源來為它們的AI企業(yè)獲取硬件和客戶。DeepSeek和李開復(fù)的初創(chuàng)公司“零一萬物”則另辟蹊徑,采取了開源方式,旨在快速招募盡可能多的用戶,然后再以這些大量用戶為基礎(chǔ)制定變現(xiàn)策略。
由于DeepSeek的模型更便宜,它已經(jīng)在幫助降低中國開發(fā)AI成本方面發(fā)揮了作用;大公司打起了價格戰(zhàn),在過去一年半時間里已經(jīng)多輪降價。
對全球AI市場影響幾何?
DeepSeek的成功可能會促使OpenAI和其他美國供應(yīng)商降價以保持現(xiàn)有的領(lǐng)先地位。如果更高效的模型能夠以少得多的支出參與競爭,那么人們就會質(zhì)疑Meta和微軟等公司的巨額支出 —— 它們分別承諾了今年至少650億美元的資本支出、主要是在AI基礎(chǔ)設(shè)施上。
全球市場掀起風(fēng)浪,阿斯麥、英偉達(dá)等之前受益于AI服務(wù)需求欣欣向榮的股票大跌。科大訊飛等與DeepSeek相關(guān)的中國股票上漲。
世界各地的開發(fā)人員已然在測試DeepSeek的軟件,并考慮用它來構(gòu)建工具。這可能會加速先進(jìn)AI推理模型的采用 —— 同時也可能引發(fā)對是否需要限制使用的更多擔(dān)憂。DeepSeek的進(jìn)步可能會加緊旨在控制AI開發(fā)的監(jiān)管。
DeepSeek有什么缺點?
DeepSeek的云基礎(chǔ)設(shè)施可能會經(jīng)受流量激增的考驗。該公司曾在1月27日短暫大宕機,而隨著新老用戶向其聊天機器人發(fā)去更多問題,其將得管理甚至更大的流量。