百度科技園(來源:鈦媒體App編輯拍攝)
內(nèi)容生產(chǎn),特別是創(chuàng)意工作,一向被認為是人類的專屬和智能的體現(xiàn)。
曾參與開發(fā)谷歌“AlphaGo”項目的牛津大學計算機學院院長邁克爾·伍爾德里奇(Michael Wooldridge),在其2019年著作《人工智能全傳》一書中提到,“撰寫有趣的故事”是 AI “遠未實現(xiàn)”的任務之一。
如今,AI 技術(shù)正大步邁入數(shù)字內(nèi)容生產(chǎn)領(lǐng)域。生成式人工智能(AIGC)技術(shù)不僅在寫作、繪畫、作曲多項領(lǐng)域達到“類人”表現(xiàn),更展示出在大數(shù)據(jù)學習基礎(chǔ)上的非凡創(chuàng)意潛能。
無論是60天月活超1億、上知天文下知地理的ChatGPT,還是其背后考試接近滿分、隨手畫個草圖就能做出同款網(wǎng)頁的生成式預訓練模型GPT系列技術(shù),美國OpenAI公司讓人類離通用人工智能(AGI)更近了一步,并引爆了全球科技巨頭與 AI 行業(yè)的新一輪大模型軍備競賽。
正如科學技術(shù)部部長王志剛所說,ChatGPT證明了 AI 是大方向。
隨著ChatGPT和 AIGC 技術(shù)風靡全球,中國亟待需要符合本土的AI Chat GPT大模型。而今天,作為“全村的希望”、全球第一個做出對標ChatGPT產(chǎn)品科技大廠,百度集團最先發(fā)力,展示中國 AI 技術(shù)實力新力量。
北京時間3月16日下午,百度大模型新項目“文心一言”(ERNIE Bot)邀請測試”。
百度稱,文心一言某種程度上具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性都逐漸接近人類水平。
百度表示,3月16日起,首批用戶即可通過邀請測試碼,在文心一言官網(wǎng)體驗產(chǎn)品,后續(xù)將陸續(xù)開放給更多用戶。此外,百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務。3月16日起正式開放預約,搜索“百度智能云”進入官網(wǎng),可申請加入文心一言云服務測試。
百度集團創(chuàng)始人、董事長、CEO李彥宏在演講中指出,百度在過去十幾年當中,一直堅持 AI 技術(shù)研發(fā)投入,而文心大模型早在2019年就發(fā)布了第一個版本。所以從這個意義上說,“文心一言”只是百度過去多年努力的一個延續(xù)。
“未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強,文心一言的多模態(tài)生成能力也會不斷提升?!崩顝┖暧H臨現(xiàn)場演講。這是繼2018年為自動駕駛平臺“蘿卜快跑”和智能視頻音箱“小度在家”后,李彥宏時隔五年親臨活動現(xiàn)場,為單個產(chǎn)品站臺。
在新一波 AI 熱潮下,李彥宏下場,百度頂住了壓力,盡管產(chǎn)品有諸多不完美的地方,但充分展現(xiàn)了百度作為一家互聯(lián)網(wǎng)科技企業(yè),在中國式現(xiàn)代化理念下的核心創(chuàng)新能力。
剛剛過去的2022年,對于百度來說是不平凡的一年。
2月22日百度發(fā)布的2022年四季度及全年財報中,2022年百度實現(xiàn)營收1236.8億元,歸屬百度的凈利潤為206.8億元,同比增長了10%。其中,四季度百度營收330.8億元,凈利潤49.53億元,同比大漲189%,凈利潤率為19%。
在外部環(huán)境多變下,百度去年整體營收超市場預期。據(jù)了解,這是百度2022年連續(xù)四個季度核心業(yè)績超市場預期,加上凈利潤的大幅增加,百度隨后宣布了50億美元的股票回購計劃,意味著管理層對于百度未來發(fā)展的重要信心。
此次財報中,百度最大的看點還是百度智能云業(yè)務。財報顯示,2022年前三季度,百度智能云營收127億元,同比增長31%,在百度核心(Baidu Core)中占比18%,而該業(yè)務在百度總營收占比持續(xù)成長。
百度智能云業(yè)務的突出表現(xiàn),與百度將 AI 技術(shù)與云計算相融合的理念有密切關(guān)系。其中,百度 AI 領(lǐng)域近幾年主打的產(chǎn)品——大語言模型“文心一言”,已經(jīng)成為行業(yè)關(guān)注的焦點。此前2月7日百度官宣“文心一言”,并隨后宣布將通過百度智能云對外提供服務。
事實上,自1956年“達特茅斯”會議創(chuàng)造 AI 這個術(shù)語以來,全球共經(jīng)歷了三次 AI 浪潮。前兩次 AI 浪潮中,不管是芯片“摩爾定律”速度跟不上 AI 的算力要求,還是數(shù)據(jù)量不夠、算法不強、商業(yè)化不如預期,整個 AI 技術(shù)并未呈現(xiàn)機器特性。
直到2016年,谷歌DeepMind的“阿爾法狗”(AlphaGo)擊敗了韓國圍棋世界冠軍李世乭,以及機器學習、Transformer框架等新技術(shù)的誕生,讓 AI 算法、算力、數(shù)據(jù)“三駕馬車”獲得突破性技術(shù)進展,標志著 AI 技術(shù)的爆發(fā)拐點。
如今,ChatGPT的誕生,使得 AI 技術(shù)迎來了新的“奇點”。ChatGPT不僅僅是新形態(tài)的搜索引擎工具、語音助手這些功能性產(chǎn)品,它還讓 AI 技術(shù)帶來新的發(fā)展路徑,距離通用人工智能(AGI)越來越近。
那么,大模型究竟強在哪里?
從技術(shù)突破來說,利用Transformer框架機制,GPT的互聯(lián)網(wǎng)海量數(shù)據(jù)訓練,涌現(xiàn)出通用學習能力;從本質(zhì)上來說,GPT使得全人類群體能力,替代了個體能力。目前,大數(shù)據(jù)、大算力、大模型已經(jīng)成為 AI 行業(yè)發(fā)展的基本共識。
中國科學院院士鄂維南2月25日提到,ChatGPT沒有太多底層的創(chuàng)新,更多是工程式的成功;開放原子基金會TOC副主席譚中意則直言,在 AI 工程化方面,ChatGPT對全球 AI 業(yè)是一個巨大的利好,它從各個底層給大家?guī)砭薮蟮男判模蜷_了巨大的用戶市場。
作為中國領(lǐng)先的 AI 技術(shù)公司,百度十幾年間一直堅持進行 AI 大模型技術(shù)研發(fā),厚積薄發(fā),形成了如今的“文心一言”。
資料顯示,早在2010年初,百度就對通用智能技術(shù)NLP(自然語言處理)進行了梳理與規(guī)劃,并成立了自然語言處理部。2019年3月,百度推出的文心大模型ERNIE 1.0,首次突破90分大關(guān),登頂全球權(quán)威數(shù)據(jù)集GLUE榜單,刷新榜單歷史。
2021年9月,百度發(fā)布了全球首個百億參數(shù)的對話大模型PLATO-XL,一舉超過Facebook Blender、谷歌Meena和微軟DialoGPT,成為全球首個百億參數(shù)中英文對話預訓練生成模型,再次刷新了開放域?qū)υ捫Ч蜷_了對話模型的想象空間。
在2022第四季度財報電話會上,李彥宏也表示:“百度的文心大模型,是中國市場非常本土化的大語言模型,這意味著百度現(xiàn)在正在研發(fā)的文心一言,將比國外開發(fā)的模型更適合中文和中國市場?!?/p>
“文心一言”技術(shù)負責人、百度首席技術(shù)官王海峰表示,文心一言,是新一代知識增強大語言模型,是在ERNIE及PLATO系列模型的基礎(chǔ)上研發(fā)的。它的關(guān)鍵技術(shù)包括有監(jiān)督精調(diào)、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強,文心一言未來會越來越強大。
李彥宏指出:“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成?!?/p>
“文心一言確實不能講叫做完美,但是為什么今天要展示?因為有市場需求,因為百度的各個產(chǎn)品線,從搜索到智能云、到自動駕駛、到小度,大家都在等著要用這樣的技術(shù)。更重要的是我們的客戶、我們的合作伙伴在等著用這樣的技術(shù)。我們需要盡早的把它展示出來。當然,大語言模型這種產(chǎn)品一旦展示出來,它就會獲得真實的用戶反饋,它的迭代速度、能力提升就會非????!崩顝┖晏寡?,“文心一言”將盡快成長,能夠盡早的給用戶和客戶帶來價值,讓所有的人都從中受益。
華爾街日報報道稱,OpenAI 最新估值達290億美元,預計2023年收入2億美元。而百度現(xiàn)在的市值,大約為487億美元。如果以O(shè)penAI的估值對標文心一言,百度的市值上升空間極大。
可見,“文心一言”的推出已成為了百度商業(yè)模式升級、企業(yè)形象重塑、公司價值重估的重要機會,也是百度重新站回市場領(lǐng)先地位的重要起點。
目前,百度是國內(nèi)大廠中第一個做出對標ChatGPT產(chǎn)品的企業(yè)。
3月16日現(xiàn)場,李彥宏展示了“文心一言”在文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力。
其中在文學創(chuàng)作場景中,文心一言根據(jù)對話問題將知名科幻小說《三體》的核心內(nèi)容進行了總結(jié),并提出了五個續(xù)寫《三體》的建議角度,并回答了很多事實性問題,解決了GPT的很多“胡編亂造”情況,大幅度提升了事實性問題的準確率,并體現(xiàn)出“文心一言”對話問答、總結(jié)分析、內(nèi)容創(chuàng)作生成的綜合能力。
在商業(yè)文案創(chuàng)作場景中,文心一言順利完成了給公司起名、寫新聞稿的創(chuàng)作任務,既能準確理解人類意圖,又能清晰地表達,這是基于龐大數(shù)據(jù)規(guī)模而發(fā)生的“智能涌現(xiàn)”。文心一言大模型的訓練數(shù)據(jù)包括萬億級網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實的知識圖譜等。
多模態(tài)生成方面,李彥宏現(xiàn)場展示了文心一言生成文本、圖片、音頻和視頻的能力,比如輸入“貓”得到不同類型的幾個反饋。其中,文心一言的視頻生成能力則因成本較高,現(xiàn)階段還未對所有用戶開放,未來會逐步接入。
“多模態(tài)是生成式 AI 一個明確的發(fā)展趨勢,”李彥宏表示。
實際上,無論是多模態(tài)生成,還是文學創(chuàng)作場景,底層進化是此輪 AIGC 浪潮中的核心。也就是說,2017年谷歌發(fā)布的Transformer框架是 AI 實現(xiàn)對自然語言“理解”和“運用”能力飛躍的原點。
簡單來說,Transformer框架拋棄了傳統(tǒng)的CNN(卷積神經(jīng)網(wǎng)絡)和RNN(循環(huán)神經(jīng)網(wǎng)絡),使整個網(wǎng)絡結(jié)構(gòu)完全由Attention機制組成,從而讓機器同時學習大量的文字,訓練速度效率大大提升。它的核心點是模型和參數(shù)數(shù)量。
后續(xù)的GPT、BERT等語言模型突飛猛進,不僅質(zhì)量高、效率高,還能以大數(shù)據(jù)預訓練+小數(shù)據(jù)微調(diào)的方式,擺脫了對大量人工調(diào)參的依賴,在手寫、語音和圖像識別、語言理解方面的表現(xiàn)大幅突破,所生成的內(nèi)容也越來越準確和自然。
但這種大模型,意味著極高的研究和使用門檻。例如,GPT-3有 1750 億參數(shù)量,需要大算力集群。而根據(jù)媒體報道,運行ChatGPT至少需要1萬枚英偉達的A100芯片。然而,GPU芯片持有量超過1萬枚的企業(yè)不超過5家。那么,云計算提供了強大、彈性擴展的計算資源,這對于GPT的訓練和生成文本過程是至關(guān)重要的。
作為國內(nèi)最大的云計算廠商之一,據(jù)了解,百度已經(jīng)連續(xù)多日進行持續(xù)到凌晨的壓力測試,為了支持“文心一言”,亞洲目前最大的單體智算中心山西陽泉百度智算中心,已經(jīng)將算力提升到每秒可以完成400億億次浮點運算,將與百度在江蘇鹽城等地的其他幾座智算中心一起,為“文心一言”提供算力支持。
李彥宏表示,大模型時代將產(chǎn)生三大產(chǎn)業(yè)機會:
第一類是新型云計算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS(模型即服務);
第二類是進行行業(yè)模型精調(diào)的公司,這是通用大模型和企業(yè)之間的中間層,為行業(yè)客戶提供解決方案,目前文心大模型已經(jīng)在電力、金融、媒體等領(lǐng)域,發(fā)布了10多個行業(yè)大模型;
第三類是基于大模型底座進行應用開發(fā)的公司,即應用服務提供商?;谖谋旧伞D像生成、音頻生成、視頻生成、數(shù)字人、3D等場景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司,可能就是未來的新巨頭。
相對于其他科技巨頭來說,百度是中國最具前沿技術(shù)能力、最具價值潛力的 AI 技術(shù)企業(yè)。在全球范圍內(nèi),很少有像百度這種擁有AI全棧布局的企業(yè),能夠在應用層、模型層、框架層、芯片層四層均有布局,這是百度非常獨特的優(yōu)勢。
而文心一言位于模型層,后續(xù),芯片、框架、大模型和終端應用場景可以形成高效的反饋閉環(huán),幫助大模型不斷調(diào)優(yōu)迭代,從而升級用戶體驗。
李彥宏認為,百度 AI 全棧布局的優(yōu)勢在于,可以在技術(shù)棧的四層架構(gòu)中實現(xiàn)端到端優(yōu)化,大幅提升效率。尤其是框架層和模型層之間,有很強的協(xié)同作用,可以幫助構(gòu)建更高效的模型,并顯著降低成本。
基于強大的技術(shù)能力。自2月份百度官宣“文心一言”以來,已有超過650家企業(yè)宣布接入文心一言生態(tài)。這意味著很多企業(yè)已經(jīng)理解到,文心一言和生成式AI代表了一個新的技術(shù)范式,它會影響到每一家公司。
百度表示,文心一言將通過百度智能云對外提供服務,幫助企業(yè)構(gòu)建自己的模型和應用,農(nóng)業(yè)、工業(yè)、金融、教育、醫(yī)療、交通、能源等重點領(lǐng)域。李彥宏預告稱,百度智能云將于近期公布圍繞文心一言的云服務和應用產(chǎn)品,既有公有云服務和也可以做私有化部署。
國際歐亞科學院院士李世鵬認為,百度從“芯片”到“基礎(chǔ)軟件”的技術(shù)架構(gòu),有效地擴展了人工智能技術(shù)的通用性,使得 AI 技術(shù)的開發(fā)和應用門檻不斷降低。透過百度等頭部公司的努力與取得的成果,大家看到了更多國產(chǎn)基礎(chǔ)軟件努力向上的動作。
十月懷胎,一朝分娩?!拔男囊谎浴敝皇前俣茸分?AI 星辰大海之夢的起點。
鈦媒體App此前了解到,此次“文心一言邀請測試”只是一個小小的時間點,是中國市場類ChatGPT產(chǎn)品空白的填充,今年4月、5月還會有下一個版本或者新功能的公布,后續(xù)以月或雙月的頻率展示“文心一言”新功能或新版本。
隨著技術(shù)的不斷演進、數(shù)據(jù)和算力的不斷充實,“文心一言”將會呈現(xiàn)出更強大的 AI 能力,是值得大家期待的。
李彥宏表示,“我們大家都希望,'文心一言’能夠快一點成長,能夠盡早的給用戶和客戶帶來價值,讓所有的人都從中受益?!?/p>
目前,百度各業(yè)務都有 AI 應用。在搜索方面,自2019年3月以來,文心大模型在改進搜索結(jié)果方面發(fā)揮了重要作用,帶來排名改進和多模態(tài)搜索能力。在云方面,AI 專業(yè)知識為傳統(tǒng)行業(yè)(如制造、能源和公用事業(yè))提供特定AI解決方案和應用。智能駕駛業(yè)務是百度 AI 能力護城河又一證明,一項自動駕駛產(chǎn)業(yè)排名中,百度位居全球領(lǐng)導者之列,是中國唯一上榜企業(yè)。
通用人工智能(AGI)被認為是 AI 領(lǐng)域研究的主要目標,也是科幻小說和未來研究中的共同話題。
一些研究人員將通用人工智能稱為強 AI 或者完全AI,或稱機器具有執(zhí)行通用智能行為能力。與弱 AI 相比,強 AI 可以嘗試執(zhí)行全方位的人類認知能力。
創(chuàng)造ChatGPT的OpenAI公司內(nèi)部有一個堂吉訶德式的使命,即開發(fā) AGI。公司CEO 山姆·阿爾特曼(Sam Altman)表示,“AGI 是人類生存必不可少的。我們面臨的問題極其嚴峻,如果沒有更好的工具將無法解決?!?/p>
無論是OpenAI、谷歌、微軟,還是百度這類涉足 AI 技術(shù)的大型科技公司,都在不斷發(fā)力 AI 的未來發(fā)展。在這其中,百度不僅有芯片、云計算、開源框架、軟件,還有量子計算、量子云、醫(yī)療與新藥研發(fā)等領(lǐng)域的全棧性布局,在全球通用 AI 技術(shù)目標競爭中擁有明顯優(yōu)勢。
財報顯示,2022年百度核心研發(fā)費用達214.16億元,占百度核心收入比例達到22.4%。近十年,累計研發(fā)投入超過1000億元。百度堅持壓強式、馬拉松式的研發(fā)投入,如此高的研發(fā)投入,在大廠中鳳毛麟角。
美國貝爾實驗室的Walter H. Brattain,于1947年在一個塑料支架上,放置了一個銅塊,上面又安裝了一大塊半導體鍺(Germanium)——誕生了世界上第一個晶體管,當時一顆芯片內(nèi)部的晶體管只有個位數(shù)。而如今,晶體管全然不同,蘋果最新發(fā)布的M2 Max芯片內(nèi)部集成了670億只晶體管。
那么,從ChatGPT來說,去年11月公布時的回答情況與現(xiàn)在已迥然不同,出現(xiàn)了明顯的進步。因此,“文心一言”未來的發(fā)展成長值得期待。
“我們相信,AI 會徹底改變我們今天的每一個行業(yè)。AI 的長期價值,對各行各業(yè)的顛覆性改變,才剛剛開始。未來,將會有更多的殺手級應用、現(xiàn)象級產(chǎn)品出現(xiàn),將會有更多的里程碑事件發(fā)生。”李彥宏說道。
(本文首發(fā)鈦媒體App,作者|林志佳)