本文深入探討了AI Agent的概念、構(gòu)成、以及如何通過coze平臺實現(xiàn)其功能和應(yīng)用場景。從基礎(chǔ)理論到實操教程,我們將一起探索如何利用AI Agent提升效率和解決實際問題,開啟AI應(yīng)用的新篇章。
已經(jīng)有了AI,為什么又要冒出個AI Agent,這是刻意裝逼顯得厲害搞出來的概念嗎?
列舉個案例:
當你要讓大模型(AI)幫你整理一篇文章,假設(shè)你這樣問AI:
請你幫我生成一篇100萬字的言情小說
這個時候,AI給你什么答案!是不是寫不出這么多字,也給不出你想要的答案?
為什么會出現(xiàn)這種問題?是AI不夠厲害?還是AI就是偽概念?
假設(shè)這件事是我們?nèi)祟悂碜?,我們會有哪些動作?/p>
1)上網(wǎng)查閱相關(guān)內(nèi)容;
2)規(guī)劃大綱;
3)分步整理;
4)審核和檢查;
通過上述步驟,我們是不是就能完成這個任務(wù)!
思考一下,完成這個任務(wù),你用到了哪些操作?
1)上網(wǎng)查詢;
2)分解任務(wù);
3)逐步規(guī)劃;
4)排查;
這里面涉及到工具,思考過程,完成過程,復(fù)盤等操作,還用到大腦,手,電腦或者助手等“工具”。
那AI是什么?
AI在這個過程中只充當了大腦的角色,他沒有額外的工具或者步驟,因此這個任務(wù)交給它,它是無法單獨完成的。
為了讓AI能夠真正實現(xiàn)工作,我們得給他配備上網(wǎng)查詢能力,使用工具能力,分解任務(wù)能力等等。
這就是AI Agent的價值,讓AI不僅是一個大腦,而是能使用“工具”的類人智能體。
在舉個例子:
假設(shè)你讓普通AI幫你寫日報,能不能行?
可以,但是你的操作會很復(fù)雜。
Agent寫日報就不同了,設(shè)定好格式,語氣,任務(wù)等關(guān)鍵信息,你只需要口語化告訴它做了什么,剩下的事他會幫你整理。
假設(shè)你讓普通AI幫你做寫篇軟文,能不能行?
可以,但是操作同樣復(fù)雜,來來回回折騰幾遍可能還不滿意。
Agent寫就不同了,提前設(shè)定好標題,開頭,內(nèi)容和語氣等關(guān)鍵信息,你只需要告訴Agent你要寫什么主題內(nèi)容,它就能按照設(shè)定一步一步幫你整理。
假設(shè)你去旅游,讓AI給你介紹景點信息,能不能行?
可以,但是每次你都要問,還不一定回答是否正確。
Agent就不同了,按照景點情況設(shè)定好Agent,你走到哪,他就告訴你什么,你問他WC在哪,它還可以根據(jù)你的位置給你指定最近的WC。
通過上面這些小案例,你是不是理解了Agent和AI到底有什么不同了,簡單說,AI相當于可以咨詢的大腦,Agent相當于能干活的機器。
首先先看這張圖:
AI Agent = LLM(大模型) + Planning(規(guī)劃) + Memory(記憶) + Tools(工具)+Action(行動)
這張圖代表著Agent的構(gòu)成,類似人的大腦、四肢、思考、執(zhí)行。
有這些能力,是不是和上文說的類人智能體靠近了!
接下來我們看看Agent的具體定義:
AI Agent 就是一種能代替人類執(zhí)行任務(wù)的智能助手。它集成了感知、學(xué)習(xí)、推理、決策、內(nèi)容生成等多種 AI 能力,可以與人進行自然語言交互,根據(jù)人的需求提供個性化、多樣化的服務(wù)。
讓我們分別講解一下這些名詞的具體含義:
1)規(guī)劃
子目標和分解:Agent 將大型任務(wù)分解為更小的、可管理的子目標,從而能夠有效處理復(fù)雜的任務(wù),以開個餐館為例,任務(wù)開一家餐館,分解就是把開餐館這件事劃分成不同的步驟或者任務(wù),比如取名、選址、裝修、備貨、營業(yè),分解越細工作就越簡單越容易達成目標。
反思和完善:Agent 可以對過去的行為進行自我批評和自我反思,從錯誤中吸取教訓(xùn),并針對未來的步驟進行完善,從而提高最終結(jié)果的質(zhì)量。
思維鏈:讓Agent 像人類一樣一步一步思考,比如計算數(shù)學(xué)題,一步一步推理計算,保證最后的答案正確性,這點在高效使用AI上非常常見,比如不要AI直接給出最后的答案,而是讓AI把推理過程一起寫出來。
2)記憶
短期記憶:我們與朋友溝通過程中,是不是要記住溝通上下文,但是時間久遠的一次對話,我們是不是又不會記住對話過程?
短期記憶就類似于對話現(xiàn)場記下來的內(nèi)容。
長期記憶:長期記憶類似于把久遠的聊天整理成一個記憶點,隨時讓能夠回憶當時說了什么重要的事。
3)工具使用
讓AI能夠使用外部工具,比如上網(wǎng)查詢信息,代碼執(zhí)行等能力。在coze中表現(xiàn)為插件等工具的使用。
前文我們了解到,單獨的AI能力很強大,但是面對復(fù)雜任務(wù)時,他需要“助手”幫忙,有“助手”的幫忙,AI能夠?qū)崿F(xiàn)解決實際問題的能力,小俠認為:“ AI要融入場景,解決實際問題為目的”,因此探索AI Agent也是我們最為核心的一個探索研究方向。
AI Agent可以把它想象為“超級助理”,AI相當于大學(xué)剛畢業(yè)的學(xué)生,Agent相當于去企業(yè)上班后要完成的工作任務(wù),一個學(xué)生能變成什么崗位的精英,在于崗位對他的培養(yǎng)和實踐,比如:
還有很多,可以說只有你想不到,沒有AI做不到!
那為什么企業(yè)很少用AI Agent來工作解決問題?
以下是我對Agent的一點看法:
首先,22年到23年主流方向是訓(xùn)練出一個更高智能的AI本體,這是主流趨勢,AI應(yīng)用的前提還是得有個靠譜的“大腦”。
23年到24年開始關(guān)注Agent方向,也就是AI應(yīng)用場景,市場上開始完善Agent開發(fā)配套培訓(xùn),比如coze、dify等,這些平臺的完善加上基礎(chǔ)AI能力的提升,才有可能將Agent變成現(xiàn)實。
那為什么現(xiàn)在要開始研究學(xué)習(xí)Agent了?
因為過去半年時間coze、dify等平臺功能逐步完善,已經(jīng)有開發(fā)Agent的軟硬件條件,因此今年下半年一定是Agent起步的元年。
這點你還別不信,看看海外版coze平臺開始收費,國內(nèi)上架專業(yè)版coze平臺等等信息,你就不難發(fā)現(xiàn),Agent平民化開發(fā)平臺已經(jīng)顯現(xiàn)。
本文下篇會分享“弼小俠AI基地-學(xué)些助理bot”的實操教程,這個bot(Agent)也是我們用于服務(wù)粉絲和解決學(xué)習(xí)問題的AI學(xué)習(xí)助理,你在弼小俠AI基地遇到的任何問題,都可以通過這個AI助理幫你解決。
簡單說一下這個bot的功能:
總之,你在弼小俠AI基地遇到的問題,都可以借助這個Agent幫你解決,這既是一個實操案例,也是一個解決實際工作問題的Agent。
coze中文又名扣子,由字節(jié)跳動推出的AI大模型智能體開發(fā)平臺,在coze里,智能體稱之為bot。
coze是集成插件(工具使用)、知識庫(數(shù)據(jù)源)、數(shù)據(jù)庫、記憶、工作流(圖像流、工作流)等多功能為一體的Agent開發(fā)平臺。
大家別被開發(fā)平臺給嚇著了!Agent開發(fā)和傳統(tǒng)軟件開發(fā)不是一回事,直白點說就是不管之前是否是程序員,面對Agent開發(fā),大家都是新手,都是零基礎(chǔ),都是同一起跑線。
Agent開發(fā)比傳統(tǒng)軟件開發(fā),更看重的不是軟件編程能力,而是考驗綜合規(guī)劃理解能力,下篇實操商用AI客服學(xué)習(xí),大家就能明白為什么軟件編程能力不是優(yōu)先考核項,反而是規(guī)劃理解能力為第一考核項的原因。
因此,對于非技術(shù)出身的伙伴,不要被開發(fā)平臺嚇怕了,我們?nèi)粘:芏喙ぷ髌鋵嵍际且?guī)劃理解能力,這方面有優(yōu)勢,開發(fā)Agent就簡單許多。
沒有規(guī)劃理解能力也沒關(guān)系,這個咱們可以培養(yǎng),一步一步來,也不是過不去的坎。
接下來簡單介紹一下coze平臺比較重要的組成部分。
平臺特點介紹:
接下來,我們一點點入門了解coze各個功能的具體作用和能力。
1)插件
插件,相當AI使用的工具或者技能,比如上網(wǎng)查詢文章,要用到搜索插件(工具),查詢頭條熱點,要用到頭條查詢等等,coze平臺插件目前對外稱超過1萬+,算國內(nèi)外插件數(shù)量最多的Agent開發(fā)平臺,總的說插件越多,能做的事就越多。
coze的插件涵蓋范圍及廣,有圖像類,文本類,搜索類、數(shù)據(jù)分析、語音識別等等,開發(fā)者可以根據(jù)實際需求選擇不同插件,滿足不同的業(yè)務(wù)場景。
除此之外,coze還支持定制化插件開發(fā),有些企業(yè)自己內(nèi)部有系統(tǒng)或者網(wǎng)站,個人可能有自己的博客等等,都可以打包成各自插件用于自己的業(yè)務(wù)。
意想不到的是,插件商店還有便利生活插件,像私人AI助理,幫我們查快遞,查地圖,查房價等等,都可以調(diào)用這些插件實現(xiàn),真正做到AI幫我們打點日常生活和工作。
還有很多,我就不一一例舉,有興趣的伙伴,自己到coze平臺查看。
以上插件,適用于定制開發(fā)私人Agent助理,可以想象一下,如果你身邊有這樣一個AI助理,是不是很多App你都不用打開就能使用,想想都是一種樂趣。
對于動手能力強或者企業(yè)主,上面的插件可能滿足不了企業(yè)的需求,coze也貼心的為大家開通了自定義插件功能,具體操作如下圖:
2)知識庫
先問大家一個問題:AI有沒有短板?
有,還很多!不過最大的短板就是它不屬于我,學(xué)習(xí)的知識也未必是最新的,比如剛剛發(fā)生的事,你問AI,它就回答不出來。
那怎么解決這個短板?
答案就是:知識庫。
coze平臺集成了知識庫功能,用來儲存外部知識,并且還提供了RAG(不清楚的伙伴可以在弼小俠AI基地學(xué)習(xí))的能力,那知識庫能用來干嘛?
先看看知識庫功能包含哪些!
可以看到知識庫里包含文本格式,表格格式,圖片類型,也就是說文本類和圖片類的數(shù)據(jù),都可以儲存在知識庫里面,隨時讓AI調(diào)用,舉個簡單例子:
假設(shè)你要創(chuàng)建一個AI客服,介紹公司和產(chǎn)品,我們就可以用到知識庫的能力。
首先,梳理公司和產(chǎn)品的介紹,形成FAQ。
其次,上傳到知識庫中。
最后將知識庫配置到bot里,讓bot可以調(diào)用這個知識庫的內(nèi)容作為回復(fù)。
以上步驟完成,當用戶咨詢AI有關(guān)公司或者產(chǎn)品的問題時,AI就會根據(jù)FAQ的內(nèi)容進行回答。
這里提一下,傳統(tǒng)的機器人客服,只能硬套FAQ,不懂變通。
Agent客服,它是根據(jù)RAG的能力,優(yōu)化了回答的方式,并且還融合了bot本身的人設(shè)和目標進行回答,直白點就是Agent客服,感覺更像真人客服,不是呆板的機器。
在知識庫的創(chuàng)建時,我們需要注意RAG技術(shù)檢索分析數(shù)據(jù)的特點,我們上傳一份文件到知識庫,這份文件并不是單純的儲存,而是會將內(nèi)容進行切片,切片后的內(nèi)容更有助于AI檢索信息,提升了AI回答內(nèi)容的關(guān)聯(lián)性。
這里也順帶再說一遍前面說的為什么現(xiàn)在可以學(xué)習(xí)Agent的原因,23年之前,都是在搞大模型,像RAG這樣的配套工具都不完善,因此23年之前你想讓AI給你干活,是非常難的一件事。
但是隨著項目的發(fā)展,AI配套的工具越來越多,并且投入的研發(fā)成本越來越高,可商用的Agent就越來越近,如果你還停留在去年的思維,還認為AI只是可以聊聊天沒其他用途,那還是蠻危險的。
3)數(shù)據(jù)庫
很多小伙伴在面對數(shù)據(jù)庫和知識庫的時候會迷糊,小俠今天一次給你講清楚,讓你不迷糊。
感覺小俠分享還不錯的,點贊,關(guān)注,評論一鍵三連,支持一下。
傳統(tǒng)軟件開發(fā)所說的數(shù)據(jù)庫是一門專業(yè)的學(xué)科,比如:Oracle、MySQL、SQL Server等,如果放在過去,普通人想利用數(shù)據(jù)庫解決數(shù)據(jù)管理問題,可以說是不可能的事。
但是coze在AI加持下,數(shù)據(jù)就不再是難事了!
上面提到的各種數(shù)據(jù)庫,都可以不用懂,我們只需要用自然語言(口語化)告訴AI要記錄什么,他就能幫你轉(zhuǎn)換成數(shù)據(jù)庫的語言進行記錄,里面到底怎么運行的,不用管。
那數(shù)據(jù)庫和知識庫有啥區(qū)別?
通過這樣的類比,我們就清楚他們的使用場景和區(qū)別,數(shù)據(jù)庫類似電腦內(nèi)存,知識庫類似電腦硬盤,都是用來存儲,一個是電腦可以自己更新,一個是只能人為更新。
coze數(shù)據(jù)有以下特點:
4)圖像流
coze圖像流可玩性非常高,上手門檻也很低,只需簡單的拖拉拽操作,就能快速整理出一個具有確定圖像目標的圖片處理工具,操作界面類似ComfyUI 工作流,不過上手難度簡單許多。
它的功能包括:
有伙伴可能會說,這些功能很多App不是都有嗎?干嘛還要coze里面學(xué)一遍?
這里就說兩個點,大家自行體會:
(1)coze中的圖像處理是基于AI能力實現(xiàn),與傳統(tǒng)的圖像處理原理有所不同,AI基礎(chǔ)能力越強,它的效果就越好,可能當前有些能力不能與設(shè)計師相提并論,但是AI的迭代速度不是人能跟得上的,因此要學(xué)會接受新事物。
(2)coze圖像流是集成到coze平臺,創(chuàng)建bot的時候,你可以讓bot引用圖像流,實現(xiàn)bot圖像處理的能力,舉個例子:
假設(shè)某連鎖品牌,旗下門店要做個主題活動,需要一張宣傳海報。
傳統(tǒng)方法要完成這件事,門店要么申報總部,讓總部設(shè)計部門設(shè)計下發(fā),或者門店自己去打印店出錢設(shè)計。
如果是用coze Agent來實現(xiàn),門店只需要告訴bot要什么海報,內(nèi)容是什么,bot就能按照預(yù)設(shè)的流程,風(fēng)格等信息,自動生成一張宣傳海報給門店。
過程中不僅不需要人工干預(yù),還能確保設(shè)計標準符合總部要求。
5)工作流
與圖像流類似,工作流更加適用于更多復(fù)雜場景的任務(wù),可以說coze如果沒有工作流,那coze的價值將直接降低80分。
AI要實現(xiàn)真實世界工作問題,不僅需要強大的大腦,還需要強大的分解任務(wù)能力。
一個任務(wù)往往包含非常多的子任務(wù),如果AI不具備一步一步拆解并分步完成任務(wù)的能力,那這個AI只能作為閑聊的百科全書。
coze因為有了工作流這個功能,可以說是質(zhì)的飛躍,也是小俠深入探索,成謎AI的核心原因。
那么到底工作流有什么神奇之處,能夠讓小俠如此稱贊?
先看看工作流的基本配置:
開始節(jié)點:表示一個工作啟動節(jié)點,有了具體需要做的事才有后面產(chǎn)生的結(jié)果。
結(jié)束節(jié)點:一個具體任務(wù)完成后輸出的結(jié)果的地方。
再看看節(jié)點類型:
當下發(fā)一個任務(wù)給AI后,它要完成這個任務(wù),可能需要用到多種工具,紅色框里的節(jié)點相當于不同的工具。我們只需要給AI配置不同的工具,它就能把這個工具用起來。
6)多Agent協(xié)作
在coze平臺上,除了單Agent模式以外,還有多Agent模式,多Agent模式可以更加全面處理更復(fù)雜的工作。
首先,單Agent模式設(shè)定的bot只能單一解決某個一個問題,比如圖片處理bot,你想讓這個bot處理文本,又處理圖片,不是不能實現(xiàn),而是目前的AI會容易出現(xiàn)工作任務(wù)理解不清導(dǎo)致事情做錯的問題。
如何更好解決這種多任務(wù)組合的問題?
答案就是多Agent模式,我們可以先制作多個單Agent,每一個Agent都只負責(zé)某一個具體工作,比如負責(zé)產(chǎn)品介紹的bot,負責(zé)處理售后的bot,負責(zé)品牌宣傳的bot。
將這些bot統(tǒng)統(tǒng)放在多Agent下面,作為一個個獨立的員工,在此基礎(chǔ)上,配置一個管理者bot,讓他根據(jù)用戶提的問題進行判斷,判斷出這個問題到底誰的工作內(nèi)容,誰來服務(wù)客戶還會更好等等。
管理bot識別好任務(wù)后,就能把具體任務(wù)分配給具體bot從而更加高效的完成任務(wù)。
多Agent的優(yōu)勢有以下幾點:
可以說,平臺優(yōu)化的足夠好,多Agent模式就是未來超級AI的基礎(chǔ)。
下篇文章我們會提到弼小俠AI基地-學(xué)習(xí)助理bot,它就是基于多Agent開發(fā)的bot,里面包含客服bot,知識助理bot和學(xué)習(xí)規(guī)劃bot,這些單bot都是由學(xué)習(xí)助理bot統(tǒng)一管理,根據(jù)用戶咨詢的信息分配任務(wù)。
以上是手把手教你用coze打造第一個商用AI客服(上篇)的主要內(nèi)容,本文主要帶大家從零開始認識AI、AI Agent,也認識到Agent的世界價值。
另外也帶大家從零開始認識coze這個平臺,把平臺主要的功能都跟大家講解了一遍,希望大家通過本文閱讀都有所收獲。