去年年底,OpenAI創(chuàng)始人奧特曼在OpenAI首屆開發(fā)者大會上預(yù)測,未來各行各業(yè),每一個人都可以擁有一個AI Agent。比爾·蓋茨也為AI Agent撰寫千字博文,稱AI Agent將徹底改變?nèi)藱C交互方式,并顛覆整個軟件行業(yè)。繼大模型密集爆發(fā)之后,AI Agent風(fēng)潮又席卷而來。
近期,國內(nèi)的各科技巨頭也紛紛發(fā)布自家的AI Agent平臺,如:釘釘?shù)腁I PaaS、百度智能云千帆大模型平臺等等。未來已來,隨著AI大模型的不斷“演進”,AI Agent大爆發(fā)的時代大幕,已經(jīng)拉開。
01
AI Agent“寒武紀(jì)”,大爆發(fā)
1、什么是AI Agent?
AI Agent作為新生事物,尚處于從理論到應(yīng)用的探索階段。2023年6月,OpenAI應(yīng)用研究主管LilianWeng提出:
Agent = LLM + 記憶 + 規(guī)劃技能 + 工具使用
2024年在紅杉資本的人工智能峰會上,吳恩達(dá)認(rèn)為Agent 應(yīng)該具備四種主要能力,即:反思(Reflection)、使用工具(Tool use)、規(guī)劃(Planning)以及多智能體協(xié)同(Multi-agent collaboration)。
不難看出,業(yè)內(nèi)大佬專家們對AI的理解還是大致趨同的,所謂Agent,我們可以簡單理解為一種能夠感知環(huán)境、自主決策、執(zhí)行復(fù)雜任務(wù)的智能實體。在當(dāng)前階段,Agent主要以大語言模型(LLM)為核心驅(qū)動力,以記憶、規(guī)劃和工具能力為關(guān)鍵模塊。
2、AI Agent,大爆發(fā)
在距今5.4億年前的寒武紀(jì),地球上絕大多數(shù)的動物“門”,都開始陸續(xù)出現(xiàn)。這一時期持續(xù)了兩三千萬年,并在此過程中出現(xiàn)了大量較高等生物,形成了物種多樣性的基本樣態(tài),成為地球生命的大爆發(fā)時期。類似于寒武紀(jì)生命大爆發(fā),BabyGPT、AutoGPT、Generative Agents等實驗性產(chǎn)品的陸續(xù)問世,讓大模型的下半場出現(xiàn)了類似“寒武紀(jì)”般的Agent大爆發(fā)。所不同的是,寒武紀(jì)的生命是碳基生命,而當(dāng)前的AI Agent(智能體),則是硅基生命。
如同生命的演進,未來的Agent的世界,會有越來越多的應(yīng)用出現(xiàn)在應(yīng)用層上。并且會不斷升級迭代,“進化”出更加復(fù)雜的智能形態(tài)。雖然目前來看,Agent能做的還比較有限,但諸如HuggingGPT,在局部模塊上已經(jīng)展示了其使用工具的能力。相信隨著技術(shù)的不斷成熟和進步,Agent必然會像人類的進化一樣,最終能夠做到思考、執(zhí)行、并自動解決各種問題。
02
中國VS美國,AI Agent發(fā)展現(xiàn)狀
1、中國:巨頭引領(lǐng),初創(chuàng)涌動
投資圈流傳這樣一個說法,“十個AI應(yīng)用里面,五個辦公Agent,三個AIGC”的境況。作為公認(rèn)LLM落地的最佳載體,Agent在國內(nèi)的發(fā)展勢頭,可以說是百舸爭流,熱鬧異常。
首先是巨頭引領(lǐng),率先發(fā)力。前面提到的釘釘?shù)腁I PaaS、百度智能云千帆大模型平臺,是以平臺模式為主,為中小公司提供基建,類似open AI的GPTs。
AI PaaS 中包含模型訓(xùn)練平臺、模型調(diào)度平臺和插件開發(fā)平臺 三個部分。最底層具備AI基礎(chǔ)設(shè)施支撐,第一層開放了各類通用大模型和插件,企業(yè)可以通過大模型調(diào)取進行調(diào)參,打造自己的專屬模型;第二層則是模型調(diào)度平臺,包括上下文記憶、智能規(guī)劃、模板管理、通用能力和提示工具;運用這兩層提供的工具和能力,生態(tài)中的企業(yè)可以開發(fā)出多種多樣的AI應(yīng)用,同時,釘釘還在第三層提供了不同場景應(yīng)用和行業(yè)解決方案。
百度智能云千帆大模型平臺,也是由AI基礎(chǔ)設(shè)施、基礎(chǔ)管控平臺、通用大模型訓(xùn)練、提示工程、模型精調(diào)、Prompt工程等功能構(gòu)成。它和AI PaaS各有千秋。相較而言,百度的大模型平臺的大模型訓(xùn)練,功能更加細(xì)化豐富,釘釘則更加注重流程的簡化,以此降低用戶的使用門檻。
除大廠外,專注應(yīng)用層的創(chuàng)業(yè)公司也都盯緊了Agent。它們往往船小好掉頭,尤其是專注垂直領(lǐng)域的企業(yè),更有機會快速創(chuàng)新并推出對應(yīng)賽道的產(chǎn)品與解決方案。
比如,面壁智能就推出了三款A(yù)I Agent產(chǎn)品:XAgent是能夠自行拆解復(fù)雜任務(wù)的超強AI智能體應(yīng)用框架;AgentVerse是Agent扮演角色彼此互動的通用平臺;ChatDev則是一個基于群體智能的AI原生應(yīng)用智能軟件開發(fā)平臺。再比如,至簡天成在2023年推出的1024Code。是以1024PaaS(至簡天成全棧自研的云端編程環(huán)境)為核心,通用大模型為基座,耗時近1年,所構(gòu)建的一套自主決策鏈AI Agent,可以做到編程環(huán)境感知,代碼編輯,Shell、Console的自主閱讀,運行與自主Debug。
2、美國:先發(fā)優(yōu)勢明顯,場景大爆發(fā)
在整個AI領(lǐng)域,美國都擁有明顯的先發(fā)優(yōu)勢,Agent也是如此,他們不光在技術(shù)上更領(lǐng)先一步,在應(yīng)用場景上也明顯更為豐富。比如微軟的AutoGen、OpenAI的GPTs,編程的Devin、客服的Agent4、零售的Regie.AI等。
AutoGen允許多個 LLM 智能體通過聊天來解決任務(wù)。LLM 智能體可以扮演各種角色,如程序員、設(shè)計師,或者是各種角色的組合,對話過程就把任務(wù)解決了。
OpenAI的GPTs允許任何人創(chuàng)建一個定制版本的ChatGPT,它可以幫助你學(xué)習(xí)任何棋盤游戲的規(guī)則,幫助教你的孩子數(shù)學(xué),或者設(shè)計貼紙。任何人都可以輕松地構(gòu)建自己的GPT,而無需編碼知識。
Devin能夠規(guī)劃并執(zhí)行涉及數(shù)千個決策的復(fù)雜工程任務(wù),在每一步中都能回憶起相關(guān)上下文,并能隨時間推移學(xué)習(xí)并糾正錯誤,它不僅能夠自動完成任務(wù),甚至在幾分鐘內(nèi)就能自行編寫整個應(yīng)用程序。
Agent4可以理解自然語言,與用戶進行流暢的對話,根據(jù)用戶的需求和偏好,提供個性化的服務(wù)??梢越勇牳髌放萍寄茉拕?wù),能夠按照知識庫及時準(zhǔn)確回答客戶,為客戶提供標(biāo)準(zhǔn)服務(wù),還能夠快速掌握公司的新政策、新業(yè)務(wù)。
Regie.AI可以創(chuàng)建自定義銷售序列,編寫高度個性化的電子郵件,并存儲相關(guān)的銷售內(nèi)容。它還與領(lǐng)先的銷售參與平臺(如 Outreach.io、SalesLoft和Hubspot)集成,減少了將消息傳遞到市場并初顯成效所需的時間。Regie.AI可以很好地用于零售和電子商務(wù),為用戶塑造與核心零售目標(biāo)和目標(biāo)相一致的定制且數(shù)據(jù)豐富的購物體驗。
03
AI Agent離我們還有多遠(yuǎn)?
1、“大腦”還不完善
在AI領(lǐng)域,大模型被視為Agent的大腦,“多模態(tài)大模型+Agent”也被認(rèn)為是通往AGI的可行路徑。Agent可以通過不斷學(xué)習(xí),來適應(yīng)處于變化狀態(tài)的應(yīng)用環(huán)境,既能勝任已知多模態(tài)任務(wù),還可以快速應(yīng)對未知的多模態(tài)任務(wù)。但與此同時,人們還對Agent抱有更高的預(yù)期,希望它能具有真正意義上的的創(chuàng)造性,通過對環(huán)境的自主探索,發(fā)現(xiàn)新的策略和解決方案。
但現(xiàn)實是,目前的大模型“大腦”并沒有非常完善,還不足以支撐Agent更大程度的發(fā)揮。這也是大模型尚未實現(xiàn)AGI(通用人工智能);多模態(tài)(圖片、視頻的識別和生成)還在發(fā)展之中(如sora等文生視頻大模型,還不夠完善)的最大Bug。其主要原因有兩點:第一,模型的更新迭代,遠(yuǎn)比想象的復(fù)雜,需要持續(xù)大量財力人力的支持,而且更新周期會比較長;第二,數(shù)據(jù)限制,大模型的訓(xùn)練需要持續(xù)不斷的獲得大量新數(shù)據(jù)、新知識。但目前大模型的訓(xùn)練,數(shù)據(jù)主要來源于自有數(shù)據(jù),想獲得更多外部數(shù)據(jù)會面臨諸多實際困難,這些都會直接或間接的影響大模型的發(fā)展。
2、“手腳”還不夠強壯
現(xiàn)有網(wǎng)站、App的接口,好比Agent的手腳,一個健康的API生態(tài)對于AI Agent的發(fā)展至關(guān)重要。如果有足夠多的網(wǎng)站和App提供了公開的API,并且這些API的設(shè)計和使用都遵循一定的標(biāo)準(zhǔn),那么AI Agent就可以利用這些API來擴展它們的功能和應(yīng)用范圍。例如,一個AI Agent可以通過調(diào)用各種API來獲取各種類型的信息,從而提供更豐富和個性化的服務(wù)。
但遺憾的是目前API生態(tài)尚未完善。一方面,許多網(wǎng)站和App并沒有提供公開的API,或者提供的API的功能有限,如攜程定機票酒店的接口、美團訂外賣的接口、滴滴打車的接口等等,能夠開放給Agent的接口不夠豐富,從而限制了AI Agent的功能和應(yīng)用范圍。另一方面,即使有些網(wǎng)站和App提供了API,但由于缺乏統(tǒng)一的標(biāo)準(zhǔn),使得AI Agent在使用這些API時,需要花費大量的時間和精力,來適應(yīng)不同的API設(shè)計和使用方式。
3、缺乏Agent通用外部框架
統(tǒng)一的底層開發(fā)框架,可以為AI Agent提供共享服務(wù)和功能,包括各種工具和庫,如用于處理數(shù)據(jù)的工具,用于訓(xùn)練和測試模型的庫,以及用于部署和監(jiān)控AI Agent的工具等。它可以幫助開發(fā)者快速開發(fā)和部署AI Agent,而無需從頭開始構(gòu)建所有的基礎(chǔ)設(shè)施和功能。
如果沒有這樣一個統(tǒng)一的底層開發(fā)框架,那么開發(fā)者在開發(fā)每一個AI Agent時,都需要從頭開始,這就大大增加了開發(fā)的工作量和復(fù)雜性,從而導(dǎo)致開發(fā)成本的提高。例如,開發(fā)者需要自己設(shè)計和實現(xiàn)AI Agent的各種功能,如理解能力、推理能力、決策能力和學(xué)習(xí)能力等,這些都需要耗費大量的時間和精力。
4、百花齊放才是春天
在AI Agent的開發(fā)領(lǐng)域,目前有一些國內(nèi)外的大型的平臺和公司,已經(jīng)在進行有效研發(fā)并不斷推出應(yīng)用,如國內(nèi)的釘釘、百度,國外的微軟、OpenAI等。但相對于“一(幾)枝獨秀”來說,形成“百花齊放”的AI Agent健康生態(tài),無疑更為重要。這在客觀上需要更多中小型軟件服務(wù)商參與進來,共襄盛舉。
中小型軟件服務(wù)商由于對特定業(yè)務(wù)場景的深入理解,他們開發(fā)的AI Agent往往能更好地滿足用戶的需求,從而提高AI Agent的質(zhì)量。比如,一家專注于電商領(lǐng)域的軟件服務(wù)商,可能會開發(fā)出一個可以根據(jù)用戶的購物歷史和喜好,提供個性化推薦的AI Agent。此外,中小型軟件服務(wù)商由于規(guī)模相對較小,他們在開發(fā)AI Agent時,往往能更快地嘗試新的技術(shù)和方法,從而推動AI Agent技術(shù)的創(chuàng)新。
04
AI Agent,革了toB軟件的命
1、toB軟件生態(tài)革命來了
AI Agent正在慢慢改變面向企業(yè)(toB)的軟件行業(yè)。未來的企業(yè),將更多地依賴于集成化的平臺,如釘釘、飛書、企業(yè)微信等,這些平臺提供了一站式的解決方案,包括打卡、考勤、業(yè)務(wù)流程審批、OA、ERP、CRM等功能。這些功能都“長在”平臺上,也就是說,它們都集成在同一個應(yīng)用或平臺中,用戶無需離開這個平臺就可以完成所有的工作。這樣的設(shè)計使得用戶體驗更加流暢,成本更低,效率更高。而這一優(yōu)勢,必然會導(dǎo)致未來獨立入口的toB軟件越來越少。畢竟,沒誰愿意在多個軟件之間來回切換,低效、費時又費錢。
2、AI Agent 加速淘汰toB軟件
這些加速淘汰的toB軟件包括:簡單數(shù)據(jù)分析、標(biāo)準(zhǔn)流程類(OA、業(yè)務(wù)、營銷、財務(wù)等)、執(zhí)行自動類(RPA軟件)、輕咨詢、傳統(tǒng)教育。
1)數(shù)據(jù)分析類
這類軟件可以對企業(yè)內(nèi)部和外部的海量數(shù)據(jù)進行處理、分析和可視化,幫助企業(yè)做出更明智的決策。但隨著大模型技術(shù)的不斷發(fā)展,一些AI平臺就可以開始提供更加智能化的數(shù)據(jù)分析和預(yù)測服務(wù),從而讓這類toB軟件相形見絀,面臨被取代的窘境。
2)標(biāo)準(zhǔn)流程類
大模型強悍的數(shù)據(jù)處理和學(xué)習(xí)能力,可以通過對大量辦公數(shù)據(jù)的學(xué)習(xí)和分析,自動化處理那些重復(fù)性高、規(guī)則明確的任務(wù),以此省去簡單重復(fù)但是耗時耗力的人工處理。因此,跟所有標(biāo)準(zhǔn)化程度高的職業(yè)一樣,OA(辦公自動化)、業(yè)務(wù)審批流和營銷自動化等標(biāo)準(zhǔn)流程類軟件同樣面臨著被取代的風(fēng)險。
3)執(zhí)行自動化類
這一類工具(RPA)的主要優(yōu)勢在于能夠模擬人類在電腦上的操作,從而在各種重復(fù)性高、規(guī)則明確的任務(wù)中取代人力。例如,在財務(wù)領(lǐng)域,RPA可以自動執(zhí)行賬務(wù)處理、數(shù)據(jù)錄入、發(fā)票驗證等任務(wù);在客服領(lǐng)域,RPA可以通過自然語言處理技術(shù)實現(xiàn)自動回復(fù)客戶郵件、處理投訴等任務(wù)。但其缺點也很明顯,比如無法處理復(fù)雜和高度變化的流程,需要人類進行決策和判斷的任務(wù)也不太適合使用RPA。此外,RPA需要配置和編程,因此可能需要較高的技術(shù)門檻和成本。而基于自然語言處理和機器學(xué)習(xí)技術(shù)AutoGPT,可以完美避開這些問題,自動地理解、學(xué)習(xí)和模仿人類工作,因此可以替代部分RPA產(chǎn)品的功能,并讓這一類的自動執(zhí)行機器人逐漸“失寵”。
4)輕咨詢服務(wù)軟件
這類軟件可以幫助企業(yè)了解行業(yè)動態(tài)、市場趨勢和競爭狀況,提供決策支持。但隨著AI技術(shù)的發(fā)展,大模型提供智能化的行業(yè)分析和咨詢服務(wù)其實更勝一籌,也更加便利。因此在未來,不只軟件甚至整個輕咨詢行業(yè),都會受到AI大模型的巨大影響。
5)傳統(tǒng)教育軟件
與傳統(tǒng)的線上教育軟件,如編程教育、英語陪練等相比,AI具有更明顯的優(yōu)勢,比如AI大模型可以自動生成教學(xué)方案,提供更加個性化、精準(zhǔn)的教學(xué)內(nèi)容,從而減少對人工教學(xué)的依賴。
3、三類軟件,會越來越好
這三類軟件是:復(fù)雜業(yè)務(wù)管理、擁有稀缺數(shù)據(jù)的、行業(yè)管理軟件。
1)復(fù)雜業(yè)務(wù)管理軟件
ERP、WMS和TMS等復(fù)雜業(yè)務(wù)管理軟件在企業(yè)中發(fā)揮著重要的作用,它們可以幫助企業(yè)實現(xiàn)資源的優(yōu)化配置、進銷存的管理和運輸過程的監(jiān)控。但是,復(fù)雜業(yè)務(wù)管理軟件往往需要處理大量的數(shù)據(jù)和復(fù)雜的流程,并且需要結(jié)合企業(yè)的實際情況進行定制化開發(fā)。AI技術(shù)可以在一定程度上提供輔助功能,但想要做到完全取代,還是很難的。
2)擁有稀缺數(shù)據(jù)的軟件
一些行業(yè)類的軟件,如精密制造、離散制造等工業(yè)類軟件,以及新藥研發(fā)管理軟件、設(shè)備生產(chǎn)管理軟件等行業(yè)管理軟件,通常需要處理大量的數(shù)據(jù)和復(fù)雜的算法。這些軟件中的數(shù)據(jù)和算法往往是稀缺資源,只有少數(shù)企業(yè)能夠擁有。加上在處理高度專業(yè)化的數(shù)據(jù)和知識方面,人類的專業(yè)知識和經(jīng)驗仍然具有重要作用,因此它的門檻相對較高,也難以被AI大模型完全取代。
3)行業(yè)管理軟件
設(shè)備生產(chǎn)管理軟件、新藥研發(fā)管理軟件、等行業(yè)管理軟件,在某些特定行業(yè)發(fā)揮著重要的作用。這類軟件可以幫助企業(yè)實現(xiàn)研發(fā)、生產(chǎn)、質(zhì)量、物料等管理的規(guī)范化、流程化和標(biāo)準(zhǔn)化。由于不同行業(yè)的業(yè)務(wù)和管理模式差異很大,而且這些軟件通常需要處理復(fù)雜的行業(yè)規(guī)則和知識。所以,AI技術(shù)很難針對每個行業(yè)開發(fā)出通用的行業(yè)管理軟件。
05
toB軟件,不出眾就出局
1、不出眾,就出局
AI大模型正在一步步鯨吞蠶食to B軟件的市場份額,這是一個越來越明顯的現(xiàn)實。但也并不代表toB軟件只能坐以待斃。由于對行業(yè)的深入理解,toB軟件公司可以根據(jù)行業(yè)的特性和需求,定制開發(fā)AI Agent。這些AI Agent可以更好地滿足行業(yè)的特定需求(醫(yī)療、金融等),提供更加精準(zhǔn)和有效的服務(wù)。比如,一家服務(wù)于醫(yī)療行業(yè)的軟件公司,可能會開發(fā)一個能夠幫助醫(yī)生分析病歷,提供診斷建議AI Agent,而這是其他“外行”很難做到的。
相比之下,科技巨頭如Google、Amazon等,雖然在AI技術(shù)上有著強大的實力,但基于時間成本和資源投入成本的考量,他們無法或不愿意深入到每一個特定的行業(yè),去理解該行業(yè)的特性、滿足該行業(yè)的特定需求。而這也正是toB軟件行業(yè)向死而生的關(guān)鍵路徑。
2、打不過就加入
AI發(fā)展到今天,有遠(yuǎn)見的toB軟件從業(yè)者,一定要樹立抱大腿、找大哥的意識。要有打不過就加入的“眼力勁兒”,要充分發(fā)揮拿來主義,管你是釘釘AI PaaS,還是百度智能云千帆大模型平臺,都要“為我所用”,在這些平臺上選擇適合自己的模型和算法,快速開發(fā)和部署AI Agent,還無需關(guān)心底層的基礎(chǔ)設(shè)施和運維問題。而且這些toB軟件,還可以通過服務(wù)從平臺上獲得更多的客戶,既增加了營收,還收集了更多的數(shù)據(jù),怎么算都合適。世事維艱,生存不易,這樣的羊毛薅起來,一點都不丟人。
喬布斯曾經(jīng)說過:“人們不知道他們想要什么,直到你向他們展示它。” AI Agent正在向越來越多的世人、向各行各業(yè)的潛在用戶們,展示它們難以匹敵的能力和效率。toB軟件行業(yè)以及業(yè)內(nèi)人士們,是時候準(zhǔn)備做點什么了,與時俱進,薅AI時代的羊毛;或者調(diào)整方向,另做選擇,都可能是明智之舉,總之,大家該動起來,做點什么了。您覺得呢?
號主簡介