作為以AI搜索為主的全能AI助手,天工AI的背后有強(qiáng)大的MoE大模型,能夠越來越精確地獨(dú)立完成規(guī)劃、調(diào)用、組合外部工具及信息;月活躋身國內(nèi)AI獨(dú)立應(yīng)用Top 3,激烈的市場競爭中不斷發(fā)展壯大,為中國用戶將AI“用起來”提供了一個優(yōu)質(zhì)選擇。
全文共 5473 字,閱讀大約需要 15 分鐘
作者 | 王曉玲 羅立璇
AI的技術(shù)和產(chǎn)品演進(jìn)越來越快。Kimi刷完屏,GPT-4o又再次占領(lǐng)聚光燈。但不管是從業(yè)者還是用戶,已經(jīng)不再像以前那么容易激動了。
除非,是能讓用戶親身體驗(yàn)到AI降臨奇跡時刻,真正給用戶帶來實(shí)際幫助的產(chǎn)品。
目前,海外AI領(lǐng)域的當(dāng)紅炸子雞,要數(shù)AI搜索引擎Perplexity,連英偉達(dá)創(chuàng)始人黃仁勛都“每天會用”。自2022年創(chuàng)立至今不到三年,Perplexity的最新估值已經(jīng)接近30億美元,被認(rèn)為是谷歌未來在搜索引擎領(lǐng)域的主導(dǎo)地位的有力挑戰(zhàn)者。
谷歌也確實(shí)在追逐AI搜索這個AI時代新的風(fēng)口,與Perplexity跑在了同一條賽道上。I/O開發(fā)者大會上,谷歌除了宣布對自己的AI多模態(tài)模型Gemini進(jìn)行升級,還對自己的搜索業(yè)務(wù)進(jìn)行了大刀闊斧的AI化改造。
通過融合Gemini大模型的能力,谷歌演示的AI概覽(AI Overviews)能為搜索用戶提供多步驟推理能力。簡單來說,你可以要求谷歌搜索尋找一家評分4.5以上、人均消費(fèi)150元左右、距你公司半小時車程的中餐廳,它會進(jìn)行研究,將符合要求的餐廳呈現(xiàn)在AI概覽中,為答案配上相應(yīng)的圖片,并生成清晰的關(guān)鍵信息對比表格。
就效果而言,雖然谷歌圍繞AI搜索進(jìn)行了一番賣力的輸出,但這些看上去很炸裂的功能,其實(shí)我們中國也有,大可不必去氪金。
不僅在美國有Perplexity,在中國,昆侖萬維也早在2023年8年就上線了中國第一款基于自研大模型和自研搜索引擎的AI搜索產(chǎn)品——天工AI搜索。并且,在此之前,天工AI搜索就具備了與谷歌AI概覽一樣的多步驟推理、對比表格生成、圖文并貌呈現(xiàn)等能力。
與谷歌的AI概覽依托Gemini大模型實(shí)現(xiàn)一樣,天工AI搜索強(qiáng)悍能力的養(yǎng)成,也有賴于采用MoE(混合專家模型)架構(gòu)的千億級參數(shù)開源大模型天工3.0。相比天工2.0,天工3.0不但新增了搜索增強(qiáng)、研究模式、調(diào)用代碼及繪制圖表、多次調(diào)用聯(lián)網(wǎng)搜索等能力,還集成了AI PPT、AI視頻轉(zhuǎn)繪、AI圖片生成、AI漫畫創(chuàng)作、AI音樂生成等多模態(tài)能力。
作為以AI搜索為主的全能AI助手,天工AI的背后有強(qiáng)大的MoE大模型,能夠越來越精確地獨(dú)立完成規(guī)劃、調(diào)用、組合外部工具及信息;月活躋身國內(nèi)AI獨(dú)立應(yīng)用Top 3,激烈的市場競爭中不斷發(fā)展壯大,為中國用戶將AI“用起來”提供了一個優(yōu)質(zhì)選擇。
據(jù)今年3月,QuestMobile發(fā)布的《2024生成式AI及AIGC應(yīng)用洞察報告》,天工AI的月活,已經(jīng)接近千萬,僅次于抖音的豆包百度的文心一言。
一年前,當(dāng)昆侖萬維剛剛發(fā)布天工AI時,大多數(shù)人都不會想到這個結(jié)果。
AGI的遠(yuǎn)大愿景高懸在頭頂,PMF的現(xiàn)實(shí)需求在腳下。朱嘯虎和楊植麟引發(fā)的爭論,讓技術(shù)信仰派和市場信仰派的分歧擺在了臺面上,但這兩者并非不可調(diào)和。在曇花一現(xiàn)的噱頭型產(chǎn)品之外,依然有人在不斷將AI雪球滾大,尋找技術(shù)與市場的最佳契合點(diǎn)。
“一款產(chǎn)品,一站式滿足所有愿望”
對于打工人,這次天工大模型3.0更新帶來的AI助手的體驗(yàn)升級,讓我們看到了原生自中國本土語境的AI助手,已經(jīng)具備將大模型能力的運(yùn)用推進(jìn)到解決現(xiàn)實(shí)工作中的復(fù)雜需求上。
當(dāng)然,能干和會干是完全不同的兩個維度。
即使是全球范圍影響力最大的ChatGPT,也從去年6月開始不得不面臨流量下滑的問題。除了競品變多以外,核心問題是,它不能完全理解人類提出的復(fù)雜問題,給出的回答有時并不靠譜,甚至?xí)a(chǎn)生“幻覺”,在嚴(yán)肅的工作環(huán)境中難以帶來顛覆性地效率提升。
所以,在這次測試天工AI的時候,我就給自己設(shè)定了一個虛擬的工作角色,嘗試處理這個角色日常工作中可能會遇到的一些業(yè)務(wù)問題——一名試圖進(jìn)入短劇行業(yè)的制片人,“我”需要盡快了解這個行業(yè),并且對執(zhí)行層面的工作有框架性的了解,以便有效地安排項(xiàng)目的流程和計劃。
在這個過程中,我需要:
*海量搜索資料
*大量閱讀
*內(nèi)容結(jié)構(gòu)
*文案撰寫
*配圖樣例
*BGM配樂
*最后做成PPT
接下來我們用天工AI一站式完成任務(wù),開始測試。我選擇在手機(jī)端下載安裝APP“天工AI智能助手”進(jìn)行體驗(yàn)。當(dāng)然,你也可以在網(wǎng)頁端點(diǎn)擊www.tiangong.cn,或者在小程序端搜索【天工AI智能助手】,開啟體驗(yàn)。
首先,我肯定需要了解行業(yè)的最新全貌,進(jìn)行一些市場調(diào)查,來確認(rèn)這個方向是否可行。
還給了一些熱門的短劇參考,附帶圖文:
到這里,天工AI很好地完成了工作,并且在具體的數(shù)據(jù)、案例背后,都提供了相應(yīng)的信源參考。對任意一個細(xì)節(jié)存疑的用戶,都可以進(jìn)一步查看相應(yīng)的資料。而且,天工AI的搜索結(jié)果里,在進(jìn)行了條件限定的前提下,提供的都是最新信息,不需要浪費(fèi)更多時間進(jìn)行區(qū)分了。
而且,在總結(jié)完了我需要的答案以后,天工AI還在篇尾進(jìn)一步細(xì)化了我的模糊問題,引導(dǎo)更深入的提問,比如“2024年最熱榜單”“現(xiàn)在什么題材的短劇最火”,來幫助我進(jìn)一步了解短劇行業(yè)的全貌。
在這里,我使用了“增強(qiáng)”模式。在“增強(qiáng)”模式下,天工AI會檢索更多網(wǎng)頁,提供相對全面和個性化的答案,而“研究”模式結(jié)構(gòu)更細(xì)致,內(nèi)容更深入,還能自動總結(jié)大綱和知識圖譜,使得答案更清晰。
但時間緊急,我需要盡快了解情況,所以我回到了簡潔模式,開始進(jìn)行下一步提問。
我對霸總題材格外感興趣,還需要收集相關(guān)具體的資料。
從參考鏈接中可以看到,天工AI不單檢索了文字資料,并且還檢索了視頻內(nèi)容,這正是需要拍攝短劇內(nèi)容的我最需要的。并且可以針對每個搜索落地頁進(jìn)行AI速讀,大大節(jié)省我自己翻江倒海的時間。
之前搜索資料,文字、音頻、視頻等媒體形式,都需要分開檢索,并進(jìn)行閱讀、收聽、觀看,消耗很多時間。而現(xiàn)在一個AI助手,已經(jīng)能同時解決這個問題。
另外,我還想讓天工AI幫我分析一下當(dāng)下最紅的標(biāo)桿案例,爆紅的反套路霸總短劇《我在霸總短劇里當(dāng)保姆》,也順利完成了。
這確實(shí)是我需要的答案。想象一下,如果你是一個公司里的打工人,在開例會的時候,你的老板在早會中隨意發(fā)問,“王媽最近很火???這是怎么回事?”的時候,你只需要在天工AI輸入一個問題,就能有理有據(jù)、頭頭是道地給老板一個靠譜分析,絕對算是一個加分項(xiàng)。
在看完了這些資料以后,作為制片人的我更加確認(rèn)我想拍霸總題材了。這時候,我嘗試讓天工AI嘗試幫我創(chuàng)作劇本大綱,看一下相關(guān)的套路。
我還想了解根據(jù)之前的內(nèi)容,相應(yīng)的分鏡劇本該怎么寫,天工AI也幫我創(chuàng)作了出來。
顯然,我們不能期待AI幫助我們?nèi)祟愒趧?chuàng)意層面無中生有,但天工AI依然給我生成了一個大綱和分鏡頭的模板,讓我的工作有了一個更清晰的推進(jìn)方向。
不過話又說回來了,天工AI編纂出來的劇情,和奈飛以及抖音上的一些流水線“行活兒”相比,也沒有那么難看,一些糊弄事兒的、甚至比不過AI 的編劇可能真的會被淘汰。
天工AI的優(yōu)勢是具備多模態(tài)應(yīng)用,除了文字處理,也能做圖做音樂,作為生產(chǎn)工具,在同一個App內(nèi)切換起來非常方便。有了劇本,我讓天工圖片生成助手幫我畫一個分鏡圖,內(nèi)容分別是:1、艾米麗進(jìn)入莊園 ;2、艾米麗坐在客廳;3、艾米麗在莊園發(fā)現(xiàn)了一間密室;4、艾米麗站在密室門口。
但圖片助手顯然對畫分鏡圖沒有什么經(jīng)驗(yàn)。后來,我降低難度,分別讓它畫了這四個場景。
如果是用來做項(xiàng)目PPT,其中有兩張用來做海報圖也還不錯。
天工3.0發(fā)布同時推出了天工音樂大模型,同樣主打簡單易用。作為制片人,我只要選擇好自己喜歡的參考曲目,并準(zhǔn)備好歌詞,就能創(chuàng)作一首原創(chuàng)歌曲。當(dāng)然,歌詞可以是已有的詩詞作品,也可以交給天工AI進(jìn)行生成。
與此同時,這個新功能甚至還配備了新的智能助理,主打一個高效交互。例如,我用林黛玉的白海棠詩(其實(shí)上傳任何內(nèi)容都可以,甚至菜譜也行)完成了一支古風(fēng)歌曲后,想把它分享到微信群。當(dāng)我在對話框里,問了關(guān)于這首歌如何分享的問題后,天工AI立即就為我推薦了專門的音樂分享小管家。
作為第一次嘗試的低成本制作,這首歌已經(jīng)可以直接用到我的短劇中,沒有版權(quán)問題。
與此同時,制片人當(dāng)然還有一份最重要的工作,那就是找錢。我又讓天工AI幫我找了找可能會對短劇項(xiàng)目感興趣的投資人。
誠然,在現(xiàn)實(shí)的場景里,當(dāng)然有很多項(xiàng)目的融資,靠的是人際關(guān)系和小道消息。但是,至少先了解公開層面里,誰對短劇項(xiàng)目感興趣、愿意投入,背后的資源能夠和項(xiàng)目相結(jié)合,已經(jīng)算是做好了基礎(chǔ)的市場調(diào)查工作。
另外,天工AI在研究模式下還能幫我生成思維導(dǎo)圖和大綱,并能夠?qū)⑺阉鞯降拇鸢敢绘I轉(zhuǎn)化為帶有示意圖和圖表的PPT,以便我更好地向投資人說明行業(yè)潛力。
可以看到,在“我”的每一步工作里,都已經(jīng)能很好地和AI助手協(xié)作,并且產(chǎn)生有意義的結(jié)果。
集成多模態(tài)能力的AI助手
站在用戶角度看,簡捷有用,才是生產(chǎn)力工具的硬核實(shí)力。大多數(shù)需要用AI來幫忙完成的工作,無論是AI搜索還是AI助理,我們都希望它是一個全能同事,幫忙寫文案的后,也能幫忙配圖、生成圖表。
因此,天工AI搜索在研究模式中,會支持搜索結(jié)果的多模態(tài)呈現(xiàn)。像前文演示的那樣,在搜索結(jié)果出來后,既能輸出大綱,形成PPT,方便我在會議上分享,也能畫出思維導(dǎo)圖,方便作為資料保存。
多種實(shí)用功能聚集,就是天工3.0的最大特色。官方資料顯示,天工3.0是全球首個多模態(tài)“超級模型”(Super Model),其集成了AI搜索、AI寫作、AI長文本閱讀、AI對話、AI語音合成、AI圖片生成、AI漫畫創(chuàng)作、AI圖片識別、AI音樂生成、AI代碼寫作、AI表格生成等多項(xiàng)能力,是大模型時代的“超級應(yīng)用”。
“超級模型”背后,天工AI從2.0版本就開始采用MoE 混合專家模型,相比Transformer大模型,前者計算效率更高、計算速度更快,能夠在不大幅增加算力成本的同時,有效增加模型容量,甚至能達(dá)到萬億參數(shù)級別。
同時,MoE大模型中的各個專家模型基于不同數(shù)據(jù)分布和構(gòu)建模式搭建,能支持針對特定領(lǐng)域進(jìn)行優(yōu)化。通過調(diào)整專家模型的數(shù)量、類型和組合方式,可以多樣化構(gòu)建、擴(kuò)展MoE大模型,使其可以靈活地應(yīng)對各種復(fù)雜任務(wù)。
這也是目前大模型發(fā)展的重要方向。天工3.0發(fā)布一個月后,OpenAI發(fā)布了新一代旗艦生成模型GPT-4o,產(chǎn)品新增了文本、語音、圖像三種模態(tài)的理解能力。比OpenAI晚一天,谷歌推出了擁有強(qiáng)大多模態(tài)理解能力和實(shí)時對話功能的未來AI助手Project Astra,并且發(fā)布了文生圖模型Imagen 3、文生視頻模型Veo,以及音樂創(chuàng)作大模型Music AI Sandbox。
幾天后的上海創(chuàng)新創(chuàng)業(yè)青年50人論壇上,Moonshot AI月之暗面創(chuàng)始人楊植麟談到,自己也關(guān)注到了GPT-4o的多模態(tài)能力,“這個也是我們持續(xù)重點(diǎn)投入的方向?!?/p>
而在昆侖萬維董事長兼CEO方漢看來,GPT-4o展示了超級個人助理的交互新形式。從共同選擇布局大模型多模態(tài)能力來看,GPT-4o和Project Astra展示出來的能力,同樣也是天工AI正在逐漸接近的下一代超級個人助理的終極交互形態(tài)。
不難發(fā)現(xiàn),雖然天工AI整體定位于生產(chǎn)力增強(qiáng)工具,卻也是目前市面上AI對話App中,相對C端友好型產(chǎn)品。
新用戶習(xí)慣使用的天工AI網(wǎng)頁版界面干凈簡潔。用戶打開之后默認(rèn)進(jìn)入AI搜索界面,主頁面中央的搜索框,是我們再熟悉不過的,左邊的邊欄上半部分排例著天工3.0對話助手、AI文檔分析、AI圖片生成、AI音樂等一應(yīng)功能,下半部分則列有口語練習(xí),豆瓣推薦,旅游規(guī)劃師等實(shí)用小助手,甚至還有熱梗百科,每天更新網(wǎng)絡(luò)熱點(diǎn),也方便吃瓜群眾使用AI搜索這種高階工具深度追蹤熱事件。
“買時生產(chǎn)力,買后愛奇藝”是大家對于平板使用的自嘲,實(shí)際上AIGC產(chǎn)品也同樣如此,目前市面上的AIGC App卸載率都在30-40%左右,甚至ChatGPT也有用戶留存率不高的問題。
讓用戶在摸索用大模型提升生產(chǎn)力的同時,娛樂應(yīng)用提供的情緒價值,或許是提高留存率的好辦法。
為什么是昆侖萬維
在將人工智能列為公司未來十年的發(fā)展戰(zhàn)略后,昆侖萬維在這個方向上能夠堅持下占得一席之地的原因不僅是具備先發(fā)優(yōu)勢,還有在先發(fā)之后,快速在垂直領(lǐng)域形成了技術(shù)領(lǐng)先,并利用領(lǐng)先的技術(shù)和產(chǎn)品的創(chuàng)新,促成了用戶體量的增長。
正如方漢所說,在當(dāng)前的AI領(lǐng)域,討論產(chǎn)品開發(fā)和商業(yè)邏輯時,技術(shù)驅(qū)動無疑是核心動力。而技術(shù)紅利當(dāng)下在這個領(lǐng)域中發(fā)揮著重要的作用。例如,OpenAI的文本大模型一鳴驚人,一舉奠定了自己在大模型領(lǐng)域的地位,當(dāng)然也吸引了全球海量用戶。
在5月15日的一次演講中,方漢透露,一個月前發(fā)布的天工音樂大模型的評分已經(jīng)達(dá)到SOTA水平。SOTA(State of the art)是指目前能夠?qū)崿F(xiàn)的最佳結(jié)果,也就是“最新技術(shù)”的最佳狀態(tài)。
“在評分對比上,我們與全球領(lǐng)先的Suno模型進(jìn)行了對比。結(jié)果顯示,我們大概在三項(xiàng)指標(biāo)(人聲&BGM音質(zhì)、人聲自然度、發(fā)音可懂度)上領(lǐng)先,而在另外三項(xiàng)上稍顯落后。但總的來說,我們的評分已經(jīng)達(dá)到全球最頂尖的SOTA水平。”方漢說。
作為國內(nèi)AI搜索產(chǎn)品的鼻祖,天工AI搜索的產(chǎn)品體驗(yàn)和用戶規(guī)模提升,也依賴于昆侖萬維技術(shù)積累。在天工3.0支撐實(shí)現(xiàn)的AI搜索升級中,昆侖萬維引入了檢索增強(qiáng)生成技術(shù)RAG(Retrieval-Augmented Generation),針對用戶的復(fù)雜Query進(jìn)行拆解、細(xì)化、并進(jìn)行追問、信息理解與補(bǔ)全,然后發(fā)放給對應(yīng)的專家模型處理。
依靠RAG技術(shù)與MoE大模型的結(jié)合,天工AI搜索得以減少“幻覺”,完成包括產(chǎn)業(yè)研究、產(chǎn)品橫評、信息分析、圖片生成、圖表繪制等多種復(fù)雜用戶需求,拉開與傳統(tǒng)搜索的差距,將搜索結(jié)果的獲取時間從3-10分鐘,壓縮到5-10秒,在AI搜索領(lǐng)域收獲技術(shù)紅利。
這個優(yōu)勢的取得是搜索引擎+大模型自研經(jīng)驗(yàn)積累的結(jié)果。昆侖萬維旗下?lián)碛星f級DAU、面向全球十余種語言市場的新聞推薦產(chǎn)品Opera News,已經(jīng)是非洲用戶規(guī)模最大的新聞客戶端。昆侖萬維已經(jīng)通過Opera News產(chǎn)品,在數(shù)據(jù)抓取、數(shù)據(jù)清理等搜索引擎技術(shù)上擁有了5年的技術(shù)積累。
2020年,昆侖萬維建立團(tuán)隊(duì)立項(xiàng)大模型研發(fā)時,確定了自研路線。5年搜索引擎再加上3年的大模型研發(fā)的積累,昆侖萬維才有了做AI搜索的底氣。AI搜索從產(chǎn)品立項(xiàng)到完成僅花費(fèi)了半年時間。經(jīng)過一年時間的迭代,天工AI搜索已經(jīng)在一定程度上走在了國外同行的前面。
接下來,天工AI還準(zhǔn)備在小說、漫畫、音樂、視頻等AIGC垂直領(lǐng)域內(nèi),繼續(xù)達(dá)到SOTA水平,進(jìn)一步加強(qiáng)技術(shù)紅利,從C端獲取更多用戶。也因?yàn)樵贑端上有長期積累,天工AI的產(chǎn)品開發(fā)和商業(yè)邏輯才能持續(xù)聚焦C端市場,養(yǎng)成獨(dú)特的競爭力。
《這屆年輕人,能整頓頂流水果嗎》