“chatGPT 被認(rèn)為是通用人工智能的起點(diǎn),它具有什么樣的能力?未來(lái)能發(fā)展到什么程度?這篇文章希望能夠繞過一些復(fù)雜的概念,讓你能夠直觀的感受到這一點(diǎn)。”
chatGPT 有什么能力
chatGPT 是由 openAI 推出的一款聊天機(jī)器人,它能夠模擬人類的語(yǔ)言行為,與用戶進(jìn)行自然的交互,相比以往的 AI,它有以下幾個(gè)重要能力:
- 知識(shí)儲(chǔ)備:chatGPT 是一個(gè)大型自然語(yǔ)言內(nèi)容生成模型,含有至少千億級(jí)的參數(shù),模型在訓(xùn)練時(shí)學(xué)習(xí)了大量的知識(shí),訓(xùn)練的數(shù)據(jù)質(zhì)量高、多樣性高,同時(shí)橫跨多個(gè)語(yǔ)種,因此知識(shí)儲(chǔ)備很全面。
- 理解能力:chatGPT 利用基于人類反饋的強(qiáng)化學(xué)習(xí)式指令微調(diào)(RLHF)進(jìn)行模型精調(diào),在響應(yīng)各類人類提示時(shí),可以給出貼合人類預(yù)期的回復(fù),這些回復(fù)盡管不一定都正確,但基本都能準(zhǔn)確領(lǐng)會(huì)人類意圖。
- chatGPT 可以響應(yīng)從沒有見過的提示,可以通過小樣本甚至零樣本學(xué)習(xí)解鎖新的能力,因此可以適應(yīng)各種開放性任務(wù)。
- 語(yǔ)言生成能力:chatGPT 具備完備的語(yǔ)言運(yùn)用能力,面對(duì)一個(gè)提問、一段文字、一個(gè)關(guān)鍵詞、一項(xiàng)任務(wù)、一篇文章、一段代碼、一個(gè)腦洞等人類提示時(shí),可以生成一個(gè)答案、一個(gè)建議、一個(gè)修訂、一個(gè)方案、一個(gè)摘要、一個(gè)表格、一段代碼、一個(gè)客串等,因此它能夠參與各種具體的任務(wù)事項(xiàng)。
- 邏輯推理能力:ChatGPT 能夠基于思維鏈進(jìn)行復(fù)雜的邏輯推理,這種能力雖然還缺乏足夠的深度,但已經(jīng)可以應(yīng)付很多應(yīng)用的需求。
- 上下文連續(xù)對(duì)話能力:chatGPT 可以記住單輪對(duì)話的上下文內(nèi)容,能夠準(zhǔn)確記住會(huì)話中的各類指稱,同時(shí)還可以隨著對(duì)話的持續(xù)推進(jìn),一步步優(yōu)化響應(yīng)的質(zhì)量。
- 升級(jí)潛力:chatGPT 在技術(shù)和工程實(shí)踐上都具有可預(yù)期的、廣泛的提升空間。
一些專業(yè)概念可以先忽略,下面是幾個(gè)與 chatGPT (以 New Bing 為例)交互的小例子,能夠讓我們一窺它的實(shí)力:這個(gè)問題(也就是所謂的提示) New Bing 回答的很好,因?yàn)椋?/span>- 提示本身并不蘊(yùn)含最終的答案,同時(shí)提示文本與答案文本的關(guān)聯(lián)度也不高,AI 要理解并解決這個(gè)問題必須依賴于其他知識(shí);
- 這是個(gè)很無(wú)聊的問題,在搜索引擎上至少目前還沒有找到類似的問答,因此 AI 不大可能輕易獲得答案;
- 鍵盤的字母順序通過現(xiàn)有知識(shí)或許比較容易獲得,但語(yǔ)料給出的鍵盤字符順序一般都是自左向右的,如果單純基于鍵盤的語(yǔ)料知識(shí),要做出正確的回答,就需要 AI 首先能夠克服這種“定勢(shì)思維”,而這一點(diǎn)通常是很難的;
- chatGPT 能夠真正響應(yīng)這個(gè)問題而不是回應(yīng)一些相關(guān)但無(wú)用的句子,觀察 New Bing 的回答,可以發(fā)現(xiàn)它在這個(gè)問題中沒有給出任何參考資料,說明這個(gè)響應(yīng)來(lái)自于模型自身的能力。最為重要的是它不僅返回了答案,還生成了一段解讀,通過這段解讀大體能夠看到這樣的一個(gè)解答過程:明確這個(gè)問題和鍵盤的類型和設(shè)置有關(guān)—>明確什么是一般情況—>從指令中確定了起始位—>將滑動(dòng)這個(gè)動(dòng)作拆解為一步步從右向左的“觸碰”并記錄每次觸碰到的按鍵—>明確最后一個(gè)按鍵—>返回答案,這種將復(fù)雜問題拆解為一個(gè)個(gè)小步驟,然后逐步推理進(jìn)而獲得結(jié)果的方式,是 AI 解決未知問題的關(guān)鍵, chatGPT 是在完全開放的問題中展現(xiàn)出了這種能力,它的通用潛力可見一斑。
如果覺得這是個(gè)偶然,我們可以再試幾個(gè):邏輯流淌在語(yǔ)言之上,推理過程已經(jīng)非常清晰。chatGPT 并不是第一個(gè)能聽懂人話,并能說好人話的 AI,在此之前就有“微軟小冰” 這樣的高情商機(jī)器人化身人精與網(wǎng)友嗨聊,但要做到這般言之有物,并能真正觸碰到人類思維這頂王冠,就是另外一個(gè)維度的事情了。提示的重要性
我們通過提示與 chatGPT 進(jìn)行交互,為了最大限度的激發(fā)這類 AI 蘊(yùn)藏的能力,目前甚至還衍生出了一種叫“提示工程師”的全新職業(yè),諸如“讓我們一步一步解決這個(gè)問題...”、“”請(qǐng)化身化學(xué)教授...”這些魔法提示很多時(shí)候確實(shí)可以讓 chatGPT 能力倍增(這聽起來(lái)有些匪夷所思,但背后折射出來(lái)的正是這類 AI 所固有的一些缺陷),然而 openAI 并不想創(chuàng)造一款需要魔法咒語(yǔ)才能使用的 AI,所以除了使用魔法打敗魔法,準(zhǔn)確而富有層次的提示可以顯著提升 chatGPT 的響應(yīng)質(zhì)量。為了展現(xiàn)這一點(diǎn),這里先從一個(gè)簡(jiǎn)單的任務(wù)開始:使用 chatGPT 將一段圖片 OCR 文本轉(zhuǎn)換成表格。首先將上面的圖片通過 OCR 識(shí)別為文本,然后我們將其組裝成一個(gè)提示:由于提示不夠明確,chatGPT 不知道要拆分出哪些數(shù)據(jù)列,給出的結(jié)果雖然可期,但并不理想。如果提示的意圖能夠進(jìn)一步明確,chatGPT 通常可以完成任務(wù):在此基礎(chǔ)上想進(jìn)一步讓它補(bǔ)充一下文本中難以對(duì)齊的信息,可以通過多次對(duì)話,逐步誘導(dǎo)它完成:
借助額外的兩條提示,最終 chatGPT 成功完成了任務(wù)。仔細(xì)查看這個(gè)過程,會(huì)發(fā)現(xiàn)上圖第一個(gè)提示的回復(fù)其實(shí)并不理想,它甚至搞錯(cuò)了既有數(shù)據(jù)的對(duì)應(yīng)關(guān)系,不過它似乎理解了提示的主要意圖,這種情況不妨先忽視細(xì)節(jié),然后繼續(xù)針對(duì)最終目標(biāo)補(bǔ)充提示,也許驚喜就會(huì)一步步出現(xiàn)。整理表格的任務(wù)對(duì)于 chatGPT 來(lái)說并不屬于困難問題,因此也可以嘗試一步到位,直接通過一個(gè)提示生成最終的表格。但對(duì)于一些更加復(fù)雜的問題,提示的質(zhì)量就會(huì)變得尤為重要。我們?cè)倏匆粋€(gè)更復(fù)雜的任務(wù),橢圓的方程可以寫為:如果有一天我們突然想知道橢圓方程在形式上為什么要寫成這樣,不同的提問可能會(huì)刺激 chatGPT 給出不同深度的響應(yīng)。chatGPT 解釋了公式各項(xiàng)的含義,并給出了一個(gè)簡(jiǎn)單的證明。然而這個(gè)解讀還是不能讓人立馬通透。有一定數(shù)學(xué)思維的人,遇到這個(gè)問題可能會(huì)給出另外一種提問:chatGPT 的回復(fù)不僅驗(yàn)證了提問者對(duì)這個(gè)問題的猜想,點(diǎn)開它的參考鏈接,回復(fù)中還將“防射變換”這個(gè)更深層次的概念給到了提問者:橢圓公式中多出的 a,b 是為了將橢圓從形式上拉回圓形。顯然 chatGPT 對(duì)這個(gè)提問的響應(yīng)要比第一個(gè)更精準(zhǔn)、更本質(zhì)、更有價(jià)值。這兩個(gè)問題所跨越的維度是由人類完成的,這一點(diǎn)傳統(tǒng)搜索引擎做不到,chatGPT 目前也做不到。但是 chatGPT 可以對(duì)不同層次的提示給出不同層次的響應(yīng),而搜索引擎卻不能做到這一點(diǎn)。這里有人可能會(huì)認(rèn)為這兩個(gè)問題即便通過搜索引擎也能獲得類似的支持,其實(shí)這只是因?yàn)橛泻芏嗳嗽诨ヂ?lián)網(wǎng)上問過這個(gè)問題,而如果我們換個(gè)大眾不常參與的問題,比如下面這個(gè):
用搜索來(lái)解決這個(gè)問題,將遠(yuǎn)比上一個(gè)問題困難的多,但 chatGPT 仍然可以給出很有價(jià)值的信息。事實(shí)上,通過文本的相關(guān)性進(jìn)行信息的檢索和排名,傳統(tǒng)搜索引擎已經(jīng)做的很好,但當(dāng)問題的復(fù)雜度逐步提高,問題蘊(yùn)含的信息越來(lái)越抽象,人與傳統(tǒng)搜索引擎之間的巨大鴻溝就會(huì)一下子出現(xiàn),chatGPT 則可以更好的處理這類任務(wù)。一方面它可以準(zhǔn)確理解文本概念之間的關(guān)系并能進(jìn)行一定的推理,另一方面它還可以通過多輪對(duì)話逐步熟悉問題的背景,最終做出更加準(zhǔn)確的回復(fù),比如下面這個(gè)很個(gè)性化的問題(也是經(jīng)常有人問我的問題):一開始他混淆了兩人的關(guān)系,并且還給出了參考資料???但將這個(gè)問題分成遞進(jìn)的三個(gè)問題:
回復(fù)就準(zhǔn)確很多,對(duì)于一些復(fù)雜問題或者比較小眾的問題,不妨嘗試將問題拆分為多個(gè)小問題,沒準(zhǔn)會(huì)有意想不到的效果。從上述的例子中,我們會(huì)發(fā)現(xiàn) chatGPT 會(huì)遇強(qiáng)則強(qiáng),遇弱則弱,不恰當(dāng)?shù)奶崾净蛘哌^于寬泛、模糊、發(fā)散的提示,可能會(huì)獲得不理想甚至胡編亂造的回復(fù),而富有層次、準(zhǔn)確遞進(jìn)的提問可以顯著提高 chatGPT 的響應(yīng)質(zhì)量。chatGPT 不能做什么
chatGPT 從既有的文字、代碼、公式中學(xué)習(xí)到了廣泛的語(yǔ)義概念、語(yǔ)義關(guān)系和語(yǔ)言組織規(guī)律,這種能力經(jīng)過進(jìn)一步的強(qiáng)化和發(fā)掘,不僅可以幫助我們提高效率,也許還可以進(jìn)一步輔助我們發(fā)現(xiàn)一些新的交叉知識(shí),或者產(chǎn)生一些極具創(chuàng)意的表現(xiàn)形式。但 chatGPT 還無(wú)法內(nèi)化那些層次不同、領(lǐng)域不同、表述不同但內(nèi)涵卻趨于一致的概念,比如對(duì)于上面那個(gè)橢圓的例子,chatGPT 其實(shí)并不知道兩個(gè)提問的內(nèi)涵是統(tǒng)一的,也不清楚兩類回答的內(nèi)在邏輯是一體的,所以才會(huì)對(duì)人類的提示如此敏感,事實(shí)上它仍然漂浮于人類文字知識(shí)的表面(圖片、視頻 GPT4 已經(jīng)上道),雖然擅長(zhǎng)表達(dá),有時(shí)也會(huì)靈光一現(xiàn),但還很難將各種散裝的知識(shí)融會(huì)貫通,因此現(xiàn)今還不具備深刻的洞見和深厚的創(chuàng)造力,自然也不會(huì)具有預(yù)見能力。chatGPT 是一種神經(jīng)網(wǎng)絡(luò)模型,它和其他一些大模型一樣涌現(xiàn)出了一些高級(jí)別的能力和特性,這種涌現(xiàn)的內(nèi)在機(jī)理雖然還不甚明了,但生成內(nèi)容本質(zhì)上仍然可以使用概率模型進(jìn)行描述,chatGPT 的 “溫度” 屬性和 New Bing 的精確、平衡、創(chuàng)造力三種模式其實(shí)都是為了調(diào)節(jié)這一點(diǎn)(可以認(rèn)為內(nèi)容生成越發(fā)散,創(chuàng)意越高,準(zhǔn)確性越低),也就是說靠不靠譜是一個(gè)概率問題,我們可以讓它更靠譜,但極難讓它不出錯(cuò),比如對(duì)于常見的提示,它大概率很在行,對(duì)于一些反常的提示,那就很容易入坑:這時(shí)候的 chatGPT 就是典型的人工智障,一連補(bǔ)充了四個(gè)詞,都沒回過神來(lái),而且很多時(shí)候這樣的坑是不可預(yù)期的。反常規(guī)提示帶來(lái)的問題其實(shí)本質(zhì)上來(lái)自于語(yǔ)料訓(xùn)練帶來(lái)的慣性思維,實(shí)際也是一個(gè)概率模型固有的缺陷。目前 chatGPT 更適合具有容錯(cuò)空間的場(chǎng)景,還很難獨(dú)自勝任一些對(duì)準(zhǔn)確性要求比較高的任務(wù),這些任務(wù)如果需要使用 chatGPT,至少應(yīng)該有人類參與監(jiān)督。chatGPT 已經(jīng)具有不錯(cuò)的邏輯推理能力,但是嚴(yán)格的演繹目前確實(shí)比較孱弱,一不小心就會(huì)犯渾:在符號(hào)推理能力上 chatGPT 仍然具有極大的提升空間,但要獲得復(fù)雜演繹的完備,現(xiàn)有的技術(shù)路徑可能很難實(shí)現(xiàn)。但它仍然可以成為人類解決和探索數(shù)學(xué)問題的得力工具,只因?yàn)樗赖膶?shí)在太多了。這個(gè)很好理解,沒有學(xué)過的東西或者沒有學(xué)好的東西自然很難產(chǎn)生高質(zhì)量的輸出,比如我個(gè)人寫的一個(gè)數(shù)據(jù)處理工具包 iPybd 雖然在互聯(lián)網(wǎng)上可查閱,但大概率沒有被作為 chatGPT 的訓(xùn)練數(shù)據(jù),讓它寫個(gè)方法示例,它會(huì)有模有樣的胡編亂造:
結(jié)構(gòu)看起來(lái)很合理,卻是徹頭徹尾的偽代碼,如果不看參考資料,很容易被忽悠。chatGPT 能做什么
雖然 chatGPT 目前的能力仍然還有極大的提升空間,很多時(shí)候還不能完全替代人類獨(dú)當(dāng)一面。但它確實(shí)可能會(huì)替代一部分人的工作,同時(shí)也極有可能會(huì)顛覆很多應(yīng)用場(chǎng)景的現(xiàn)有模式,比如下面一些正在發(fā)生的事情:你可以像搜索引擎一樣去使用它,雖然它還不能替代傳統(tǒng)的搜索引擎(至少把網(wǎng)頁(yè)作為知識(shí)憑證的價(jià)值仍然無(wú)可替代),但是很多時(shí)候,它確實(shí)是一個(gè)優(yōu)秀的向?qū)?,能夠大幅提高信息檢索的效率,未來(lái)搜索引擎應(yīng)該都會(huì)集成類似的智能機(jī)器人。無(wú)論是生存、生活、生智、生產(chǎn)、生娃、身心乃至生死,對(duì)于人生這個(gè)問題 chatGPT 一般都可以應(yīng)付自如chatGPT 正在被整合到 Word 、Excel、PPT、PDF 閱讀器、網(wǎng)頁(yè)瀏覽器、代碼編輯器、日歷、郵件、筆記、出行規(guī)劃、繪圖軟件、視頻創(chuàng)作軟件等一系列應(yīng)用程序之中,然后輔助用戶寫報(bào)告、看數(shù)據(jù)、讀文獻(xiàn)、作翻譯、寫代碼、安排行程、學(xué)習(xí)知識(shí)、創(chuàng)作內(nèi)容...,這些應(yīng)用場(chǎng)景覆蓋了絕大多數(shù)個(gè)體的日常,AI 的介入必然會(huì)成為一個(gè)不可逆的趨勢(shì)。AI 會(huì)被用于寫報(bào)告、寫規(guī)劃、寫指南、寫課題、寫總結(jié)、寫方案、寫水文等垃圾任務(wù),但它會(huì)不會(huì)讓我們更卷,這個(gè)不好說~編碼能力是真正的核心生產(chǎn)力,它有資格成為程序員的強(qiáng)大助手,但目前還不能替代程序員這是目前最有想象空間的應(yīng)用模式。垂直領(lǐng)域在長(zhǎng)期發(fā)展過程中構(gòu)筑起了很高的領(lǐng)域數(shù)據(jù)壁壘,這些壁壘維護(hù)了各個(gè)領(lǐng)域的內(nèi)部生態(tài),也在很大程度上遲滯了外部技術(shù)的流入。之前的各類 AI 如果要遷移到其他領(lǐng)域,人、財(cái)、數(shù)等方面的障礙其實(shí)是很難跨越的,chatGPT 代表的 AI 技術(shù)會(huì)讓這件事情變得簡(jiǎn)單,它可以為各種開放性任務(wù)提供一個(gè)訓(xùn)練基座,然后以很小的代價(jià)獲得或增強(qiáng)特定能力。這首先可能會(huì)導(dǎo)致部分人員失業(yè),比如圍繞某些領(lǐng)域的客服、中介、初級(jí)開發(fā)者等,但也會(huì)為領(lǐng)域的發(fā)展帶來(lái)新的活力,未來(lái)諸如各類醫(yī)療助手、課業(yè)助手、心理助手、藝術(shù)助手、科研助手、博物助手、營(yíng)銷助手、裝修助手、創(chuàng)作助手...將會(huì)層出不窮。chatGPT 未來(lái)能夠達(dá)到什么高度
回看 GPT 的發(fā)展歷史,可以清楚的看到 openAI 對(duì)當(dāng)前 AI 的發(fā)展有著很深刻的理解和洞見,這使得他們的技術(shù)路徑非常的簡(jiǎn)潔務(wù)實(shí),這讓我們可以在一個(gè)統(tǒng)一的視角下去看待 chatGPT 的未來(lái):1)模型的知識(shí)儲(chǔ)備必然會(huì)逐步豐富和增強(qiáng),分布外的知識(shí)會(huì)被逐步補(bǔ)齊;2)模型對(duì)知識(shí)的理解力仍然可以進(jìn)一步挖掘,特別是大量用戶的使用反饋和多模態(tài)的語(yǔ)料訓(xùn)練可以拓展模型對(duì)知識(shí)的理解深度;3)符號(hào)演繹能力還可以大幅提升,目前已經(jīng)有一些初步的研究嘗試結(jié)合 chatGPT 在數(shù)學(xué)問題上進(jìn)一步有所拓展,而 chatGPT 本身的數(shù)學(xué)能力在當(dāng)前技術(shù)路徑下都還有很大的改進(jìn)空間;4)上面三個(gè)能力有所提升,已經(jīng)可以進(jìn)一步提高模型的準(zhǔn)確性,未來(lái)可以進(jìn)一步引入一些針對(duì)性的增強(qiáng)手段,再次提升模型響應(yīng)的準(zhǔn)確性;5)個(gè)性化能力,使其更加擬人會(huì)是個(gè)可實(shí)現(xiàn)的現(xiàn)實(shí)需求。總結(jié)
這段總結(jié),本想讓 chatGPT 來(lái)寫,但是它拒絕了我... chatGPT 所帶來(lái)的突破不僅僅是 AI 發(fā)展歷史的里程碑,更是整個(gè)社會(huì)生產(chǎn)力變革的里程碑。我們期待它的快速迭代,也更希望五星版的 AI 能夠盡快追上并趕超。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。