●長(zhǎng)江商報(bào)記者 沈右榮
長(zhǎng)江商報(bào)消息 橫空出世的DeepSeek及其創(chuàng)始人梁文鋒,成為全球關(guān)注的焦點(diǎn)。
成立至今僅18個(gè)月,DeepSeek以極低成本實(shí)現(xiàn)了與OpenAI相媲美的性能,低調(diào)而神秘的梁文鋒,推動(dòng)了這場(chǎng)全球AI技術(shù)革命。
從廣東農(nóng)村走出的梁文鋒,走出了一條不斷升級(jí)破局之路。他還是一名量化天才,創(chuàng)立的對(duì)沖基金High-Flyer,管理的資產(chǎn)規(guī)模曾達(dá)百億美元,躋身中國(guó)量化基金前四強(qiáng)。
被稱為技術(shù)理想主義者的梁文鋒,實(shí)際上也是理智的現(xiàn)實(shí)主義者。他認(rèn)為,英偉達(dá)的領(lǐng)先,不只是一個(gè)公司的努力,而是整個(gè)西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果。因?yàn)?,他們能看到下一代的技術(shù)趨勢(shì),手里有路線圖。中國(guó)AI的發(fā)展,同樣需要這樣的生態(tài)。
梁文鋒或?qū)⒅匦聞澏ˋI時(shí)代的權(quán)力版圖。
量化天才之路
一夜之間,梁文鋒的名字響徹全網(wǎng),他的成長(zhǎng)故事讓人津津樂道。
公開信息顯示,1985年,梁文鋒出生于廣東省湛江市吳川市覃巴鎮(zhèn)米歷嶺村,父母是小學(xué)老師,從小,他在學(xué)業(yè)上就展現(xiàn)出天賦。2002年,這名對(duì)數(shù)學(xué)建模充滿熱情的17歲學(xué)子以學(xué)校“高考狀元”考入浙江大學(xué)電子信息工程專業(yè),后攻讀信息與通信工程專業(yè)研究生。
根據(jù)媒體報(bào)道,求學(xué)期間,梁文鋒對(duì)金融市場(chǎng)產(chǎn)生了濃厚興趣。2008年,全球金融危機(jī)席卷,他組建團(tuán)隊(duì)探索機(jī)器學(xué)習(xí)技術(shù)在全自動(dòng)量化交易中的應(yīng)用潛力。畢業(yè)后,梁文鋒就將目光聚焦在表面上波瀾不驚實(shí)則波濤洶涌的金融市場(chǎng)。
2013年,梁文鋒與同學(xué)徐進(jìn)共同創(chuàng)立杭州雅克比投資管理有限公司,兩年后又成立了杭州幻方科技有限公司,致力于通過數(shù)學(xué)和人工智能進(jìn)行量化投資。
2015年,在A股市場(chǎng)波動(dòng)中,幻方科技依靠先進(jìn)的高頻量化策略取得了令人矚目的成績(jī)。
來自2015年12月1日水木社區(qū)上轉(zhuǎn)發(fā)的一則招聘啟事,或可體現(xiàn)當(dāng)時(shí)梁文鋒的職業(yè)狀態(tài)。
招聘啟事標(biāo)題是“幻方科技2016校園招聘——頂尖量化對(duì)沖基金公司覓牛人”。正文下面附了一段沒有具名的故事——“2008年,L先生帶著8萬元本金,開始了自己獨(dú)立的量化交易之路。2015年,經(jīng)歷過7年熊市牛市大輪回的L先生,以每年超過100%的復(fù)合收益率邁入了億元富豪的隊(duì)伍。這個(gè)行業(yè)里最先富起來的L先生認(rèn)為,中國(guó)的量化交易將從'單兵游俠’的時(shí)代轉(zhuǎn)向極客匯聚的私募基金時(shí)代。他和IT圈的朋友創(chuàng)辦了自己的公司,希望能打造一支世界一流的量化私募團(tuán)隊(duì)。他們給自己的公司取名'幻方科技’……'幻方’取自于中國(guó)古代洛書《九宮圖》,是一種特殊的矩陣,是科學(xué)的結(jié)晶與吉祥的象征。L先生的理想是有朝一日能夠與世界級(jí)的量化交易泰斗——西蒙斯的文藝復(fù)興公司相媲美?!?/span>
2021年,幻方科技的資產(chǎn)管理規(guī)模突破千億大關(guān),躋身國(guó)內(nèi)量化私募領(lǐng)域的“四大天王”之列。
梁文鋒因此被稱為量化天才、量化之王。
深度探索之路
梁文鋒受到高度關(guān)注,源于DeepSeek(深度求索)橫空出世。
今年1月20日,DeepSeek的推理模型DeepSeek-R1發(fā)布,開源、免費(fèi)、可驗(yàn)證,在全球科技界引起巨大震動(dòng)。全球芯片巨頭英偉達(dá)因此市值一度蒸發(fā)6000億美元。
DeepSeek創(chuàng)立于2023年7月,這是梁文鋒正式宣布進(jìn)軍通用人工智能領(lǐng)域,專注于做真正人類級(jí)別的人工智能。
梁文鋒說,“我們經(jīng)常說中國(guó)AI和美國(guó)有一兩年差距,但真實(shí)的gap(差距、差別)是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的。隨著經(jīng)濟(jì)發(fā)展,中國(guó)也要逐步成為貢獻(xiàn)者,而不是一直搭便車?!?/span>
談及AI,梁文鋒曾說,幻方某種程度上增強(qiáng)了他對(duì)技術(shù)驅(qū)動(dòng)型創(chuàng)新的信心,但也不都是坦途。和很多新技術(shù)一樣,量化投資剛出現(xiàn)的時(shí)候也是被嘲笑的對(duì)象,沒有人相信計(jì)算機(jī)可以像人類一樣進(jìn)行投資。他也經(jīng)歷了一個(gè)漫長(zhǎng)的積累過程。外部看到的是幻方2015年后的部分,但其實(shí)他已經(jīng)做了16年。
2016年是幻方科技的重要轉(zhuǎn)折點(diǎn),當(dāng)年,公司推出首個(gè)基于深度學(xué)習(xí)交易模型,實(shí)現(xiàn)所有量化策略的AI化轉(zhuǎn)型。2018年,幻方科技正式確立了以AI為核心的發(fā)展戰(zhàn)略。
為解決計(jì)算資源不足問題,2019年,梁文鋒帶領(lǐng)團(tuán)隊(duì)自主研發(fā)了“螢火一號(hào)”訓(xùn)練平臺(tái),總投資近2億元,搭載了1100塊GPU。兩年后,“螢火二號(hào)”的投入增加到10億元,搭載了約1萬張英偉達(dá)A100顯卡。
這些動(dòng)作,是梁文鋒在AI領(lǐng)域應(yīng)用的探索。
有了前期的基礎(chǔ),DeepSeek的研發(fā)成果不斷涌現(xiàn)。2024年5月,DeepSeek發(fā)布了DeepSeek-V2,同年12月27日,DeepSeek-V3面世,今年1月20日DeepSeek-R1發(fā)布。這款性能優(yōu)越且性價(jià)比極高的大語言模型,被硅谷同行譽(yù)為“來自東方的神秘力量”。
梁文鋒說,在這波AI浪潮中,DeepSeek的出發(fā)點(diǎn)是走到技術(shù)前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。他們只負(fù)責(zé)基礎(chǔ)模型和前沿的創(chuàng)新,其他公司在DeepSeek的基礎(chǔ)上構(gòu)建toB、toC的業(yè)務(wù)。
AI顛覆之路
梁文鋒及DeepSeek讓全球科技界震驚,是因其顛覆性。
DeepSeek的走紅,源于業(yè)內(nèi)一場(chǎng)殘酷的大模型價(jià)格戰(zhàn)。
2024年5月初,DeepSeek宣布,其開源模型DeepSeek-V2的推理成本被降到每百萬token僅1元錢,約等于GPT-4 Turbo的七十分之一。隨后,智譜、豆包、通義千問、文心一言等國(guó)內(nèi)排名靠前的大模型先后跟進(jìn),最高降幅甚至高達(dá)97%。
此番戰(zhàn)役,DeepSeek獲得了一個(gè)頭銜——“AI界的拼多多”。
根據(jù)公開報(bào)道,梁文鋒開發(fā)的DeepSeek-V3訓(xùn)練成本僅557.6萬美元,而OpenAI訓(xùn)練ChatGPT-4o所花費(fèi)的成本高達(dá)7800萬美元甚至是1億美元。OpenAI募集了143億美元,花了十年時(shí)間,而DeepSeek僅僅用了一年多時(shí)間。
DeepSeek的員工規(guī)模大約150人 ,不及OpenAI的1/5,研發(fā)工程師以及深度學(xué)習(xí)方面的研究人員大約70人,主要在北京分部,其余人在杭州總部,多為前端、產(chǎn)品以及商務(wù)人員。
而且,DeepSeek并沒有外界猜測(cè)高深莫測(cè)的奇才。梁文鋒曾透露,員工都是一些Top高校的應(yīng)屆畢業(yè)生、沒畢業(yè)的博四、博五實(shí)習(xí)生。
DeepSeek大模型在“數(shù)學(xué)、代碼和推理任務(wù)”方面的表現(xiàn)可與OpenAI的o1模型相媲美,同時(shí)僅使用一小部分計(jì)算能力。極致低成本,性能與OpenAI媲美,開源、免費(fèi),DeekSeek顛覆了全球AI的競(jìng)爭(zhēng)格局。
DeekSeek的影響持續(xù)發(fā)酵。英偉達(dá)、微軟、亞馬遜、華為等全球科技巨頭紛紛接入DeekSeek大模型。
最新消息是,2月8日,工信部披露,中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通三家基礎(chǔ)電信企業(yè)均全面接入DeepSeek開源大模型。
據(jù)AI產(chǎn)品榜,今年1月20日DeepSeek-R1模型發(fā)布后,1月DeepSeek用戶增長(zhǎng)達(dá)1.25億,實(shí)現(xiàn)了7天完成1億用戶增長(zhǎng)。而ChatGPT用時(shí)2個(gè)月。
瘦削、低調(diào),架一副深度眼鏡,典型的技術(shù)男形象,梁文鋒被稱為極致的技術(shù)理想主義者。DeepSeek堅(jiān)持開源路線,主動(dòng)向全球開發(fā)者分享核心技術(shù)成果。
梁文鋒說,在顛覆性的技術(shù)面前,閉源形成的護(hù)城河是短暫的。即使OpenAI閉源,也無法阻止被別人趕超?!伴_源更像一個(gè)文化行為,而非商業(yè)行為。給予其實(shí)是一種額外的榮譽(yù)。一個(gè)公司這么做也會(huì)有文化的吸引力?!?/span>
梁文鋒說,中國(guó)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整,會(huì)更依賴硬核技術(shù)的創(chuàng)新。當(dāng)很多人發(fā)現(xiàn)過去賺快錢很可能來自時(shí)代運(yùn)氣,就會(huì)更愿意俯身去做真正的創(chuàng)新。
梁文鋒顛覆了全球AI競(jìng)爭(zhēng)格局,中國(guó)的硬核創(chuàng)新將成為一種生態(tài),助力科技崛起。
聯(lián)系客服