字節(jié)跳動(dòng)以性?xún)r(jià)比策略切入市場(chǎng),掀起價(jià)格競(jìng)爭(zhēng),但高性能模型仍保持付費(fèi)門(mén)檻。B端市場(chǎng)對(duì)豆包視頻大模型的接納度有待觀察,其商業(yè)變現(xiàn)與用戶(hù)場(chǎng)景適配性成為主要考驗(yàn)。
@科技新知 原創(chuàng)
作者丨蕭維 編輯丨蕨影
一場(chǎng)由Sora引發(fā)的AI視頻生成競(jìng)賽,如今迎來(lái)新的競(jìng)爭(zhēng)者!
9月24日,2024火山引擎AI創(chuàng)新巡展深圳站上,字節(jié)跳動(dòng)的兩款A(yù)I視頻模型—豆包視頻生成-PixelDance、豆包視頻生成-Seaweed發(fā)布,并面向企業(yè)市場(chǎng)開(kāi)啟邀測(cè)。
距離Sora已經(jīng)橫空出世已經(jīng)超過(guò)7個(gè)月,這段時(shí)間國(guó)產(chǎn)視頻大模型的發(fā)布此起彼伏,圍剿Sora在商業(yè)語(yǔ)境中似乎成為參與玩家的共有使命。
字節(jié)在七個(gè)月之后,才選擇正式蹚入這條沸騰之河,而此時(shí)在其面前,不止有Sora,一眾國(guó)產(chǎn)大模型弄潮兒,還有一個(gè)抖音眼熟的名字—快手。
老對(duì)手,新領(lǐng)域,可靈AI的影響力正在被加速釋放,在這一點(diǎn)上,字節(jié)如坐針氈,畢竟強(qiáng)如Sora,仍是外敵,而快手AI,早已殺到城下。
追逐使命還是修筑護(hù)城河,囊外還是安內(nèi),答案藏在視頻大模型里—字節(jié)不做選擇題。
Part.1
字節(jié)殺入,Sora遭遇圍堵
無(wú)論戰(zhàn)局多么復(fù)雜,源頭都能追溯到Sora。
2024年2月,OpenAI公布的Sora AI視頻生成模型成為全世界的焦點(diǎn),憑借提供提示詞描述或者靜態(tài)圖片,Sora就能生成超高畫(huà)質(zhì)、質(zhì)感直逼電影的畫(huà)面,最高能達(dá)到1分鐘視頻的體量,直接震撼了國(guó)產(chǎn)大模型行業(yè)。
隨后,國(guó)產(chǎn)廠(chǎng)商集體發(fā)力視頻大模型,才有圍堵Sora的大趨勢(shì)?!渡墒紸I商業(yè)落地白皮書(shū)》顯示,當(dāng)前有53%的中國(guó)企業(yè)已開(kāi)始有組織地進(jìn)行生成式AI布局。這意味著,很多中國(guó)企業(yè)已意識(shí)到生成式AI技術(shù)對(duì)于自身發(fā)展的重要性,并將在其中投入資源和精力。而自今年5月起,國(guó)內(nèi)達(dá)到類(lèi)Sora級(jí)別的 AI 視頻模型技術(shù)陸續(xù)公布,生數(shù)、智象未來(lái)(HiDream.ai)等腰部企業(yè)輪番登場(chǎng),智譜AI推出視頻生成模型“清影”、愛(ài)詩(shī)科技發(fā)布視頻生成產(chǎn)品PixVerse V2、生數(shù)科技上線(xiàn)視頻生成模型Vidu扎堆七月亮相,整個(gè)賽道熱鬧非凡。
但一眾視頻大模型追趕Sora的過(guò)程,有一家的產(chǎn)品可謂一鳴驚人,它就是6月6日開(kāi)啟邀測(cè)的快手可靈 AI 視頻生成模型。
快手可靈剛一推出,就憑借參數(shù)博得了市場(chǎng)的關(guān)注:視頻分辨率高達(dá)1080p,時(shí)長(zhǎng)最高可達(dá)2分鐘(幀率30fps),單次文生視頻時(shí)長(zhǎng)已增至10秒,指標(biāo)全部位于業(yè)績(jī)前列。
工具從來(lái)都是輔助,而快手可靈俘獲用戶(hù)的速度之快,讓人始料不及。在快手光合創(chuàng)作者大會(huì)上,官方透露的數(shù)據(jù)為:超過(guò) 160 萬(wàn)人使用過(guò)快手的視頻生成大模型可靈AI,累計(jì)生成超 1600 萬(wàn)條視頻。
口碑、熱度、性能俱佳,可靈AI成為目前國(guó)內(nèi)排名最高的視頻生成類(lèi)AI應(yīng)用,自然是水到渠成。
對(duì)手收獲掌聲,字節(jié)五味雜陳。實(shí)際上,字節(jié)在AI大模型的布局比快手還早。2023年8月,該公司上線(xiàn)首個(gè)大語(yǔ)言模型“豆包”及多模態(tài)大模型BuboGPT。其抖音云雀大模型通過(guò)首批《生成式人工智能服務(wù)管理暫行辦法》備案,面向公眾開(kāi)放;字節(jié)跳動(dòng)基礎(chǔ)模型發(fā)力語(yǔ)言和圖像兩種模態(tài)方向。而在AI應(yīng)用層,字節(jié)跳動(dòng)不僅已去年11月成立新AI部門(mén)Flow,還已推出三款A(yù)I對(duì)話(huà)類(lèi)產(chǎn)品,包括豆包、扣子和Cici。
但是,需要注意的是,字節(jié)AI產(chǎn)品對(duì)平臺(tái)內(nèi)容的加持是否得到市場(chǎng)認(rèn)可,還需要進(jìn)一步驗(yàn)證,而在B站等內(nèi)容平臺(tái)中,用AI二創(chuàng)視頻已經(jīng)成為賽道,同時(shí)也降低了創(chuàng)作者門(mén)檻,為平臺(tái)擴(kuò)充內(nèi)容提供了有力支撐。
抖快之爭(zhēng)向來(lái)是短視頻賽道的焦點(diǎn),而當(dāng)對(duì)手手握超級(jí)武器后,字節(jié)自然如坐針氈,本次隆重推出的兩款視頻模型,既是與Sora一爭(zhēng)高下,更是與快手的軍備競(jìng)賽,攘外安內(nèi)的字節(jié),接下來(lái)勢(shì)必動(dòng)作頻頻。
Part.2
不拼參數(shù)拼場(chǎng)景,誰(shuí)來(lái)買(mǎi)單?
當(dāng)前,視頻大模型最能直觀打動(dòng)人,就是參數(shù),但本次字節(jié)推出視頻大模型,卻反其道而行之,到目前為止字節(jié)仍未透露兩款產(chǎn)品可以生成的最大時(shí)間長(zhǎng)度。
如此重要的內(nèi)容沒(méi)有公布,原因可能只有一個(gè):還有其他更重要的東西需要被市場(chǎng)了解。字節(jié)相關(guān)人士在介紹本次模型的特點(diǎn)時(shí),多次強(qiáng)調(diào)其為多場(chǎng)景而生,其中三個(gè)核心功能更是頗為驚艷。
精準(zhǔn)語(yǔ)義理解上,豆包AI視頻生成能夠遵從復(fù)雜的用戶(hù)提示詞,形成多個(gè)主體、人、物之間的互動(dòng)畫(huà)面。
畫(huà)面展現(xiàn)上,豆包AI視頻具有逼真的動(dòng)態(tài)與絲滑的運(yùn)鏡,并具備變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多鏡頭語(yǔ)言能力,靈活控制視角,同時(shí)保持主體、風(fēng)格和氛圍的一致性。
畫(huà)質(zhì)上,大模型支持包括黑白、3D 動(dòng)畫(huà)、2D 動(dòng)畫(huà)、國(guó)畫(huà)等多種風(fēng)格,包含1:1、3:4、4:3、16:9、9:16、21:9 六個(gè)比例,適配于各種終端,以及電影、手機(jī)豎屏等不同畫(huà)幅,質(zhì)感優(yōu)秀,格調(diào)出眾。
實(shí)際上,豆包視頻大模型在多場(chǎng)景上的發(fā)力,也正是字節(jié)大模型商業(yè)化的設(shè)計(jì)構(gòu)想,電商、城市文旅、音樂(lè) MV、微電影、短劇等應(yīng)用場(chǎng)景,都是豆包·視頻生成模型助力客戶(hù)實(shí)現(xiàn)降本提效和創(chuàng)意合規(guī)的主戰(zhàn)場(chǎng)。
可以說(shuō),豆包視頻大模型聚焦To B業(yè)務(wù)的商業(yè)邏輯十分清晰,而下一步則是依靠?jī)r(jià)格殺出重圍。早在今年 5 月,火山引擎推出的豆包大模型把價(jià)格降至最低每千 token 低于一厘錢(qián),比行業(yè)便宜99.3%,燃起了大模型廠(chǎng)商的價(jià)格戰(zhàn)。
字節(jié)視頻大模型相關(guān)人士曾透露當(dāng)下價(jià)格與市場(chǎng)份額之間的關(guān)系:價(jià)格降十分之一,量就可能漲十倍。這種量?jī)r(jià)關(guān)系下,對(duì)于先期獲得市場(chǎng)的大模型廠(chǎng)商來(lái)說(shuō),勢(shì)必要跟進(jìn)低價(jià)策略。
以豆包語(yǔ)言模型為例,據(jù)官方披露,截至 9 月,豆包語(yǔ)言模型的日均 tokens 使用量超過(guò) 1.3 萬(wàn)億,多模態(tài)數(shù)據(jù)處理量也分別達(dá)到每天 5000 萬(wàn)張圖片和 85 萬(wàn)小時(shí)語(yǔ)音。
這就是低價(jià)的魔力,但需要注意的是,慘烈的價(jià)格戰(zhàn)中,各方拿出手的基本是偏輕量化的模型版本,壓箱底的高性能模型并沒(méi)有參與,這多少說(shuō)明了大模型廠(chǎng)商的態(tài)度:給點(diǎn)甜頭嘗嘗,但要好的,得買(mǎi)單。
B端會(huì)不會(huì)為豆包視頻大模型買(mǎi)單,還需要觀察。但從以往大模型的落地來(lái)看,B端市場(chǎng)的需求適配用時(shí)并不會(huì)太短,而降本增效的核心訴求如何滿(mǎn)足,考驗(yàn)的不僅是廠(chǎng)商大模型的能力,更是用戶(hù)自身對(duì)業(yè)務(wù)邏輯梳理打磨的能力。換言之,大模型這份收入,很難掙。
Part.3
AI驅(qū)動(dòng),打破版權(quán)壁壘
抖音的長(zhǎng)視頻野望,可以靠AI視頻大模型內(nèi)容生成來(lái)作為支撐。
隨著流量進(jìn)入存量周期,短視頻平臺(tái)用內(nèi)容留存用戶(hù),成了當(dāng)務(wù)之急,2018年短視頻用戶(hù)規(guī)模增長(zhǎng)率為107.0%,2020迅速降低到15.2%,而抖音DAU破6億后,出現(xiàn)了增長(zhǎng)放緩的態(tài)勢(shì)。
老對(duì)手快手的情況更為明顯,據(jù)快手2024年一季度財(cái)報(bào)顯示,快手實(shí)際月活人數(shù)為6.97億,較上一季度環(huán)比下降0.4%,呈現(xiàn)流失趨勢(shì),二季度平均月活為6.92億,再次下探。
這可能才是視頻大模型最需要解決的問(wèn)題:內(nèi)容創(chuàng)作賦能,保住用戶(hù)規(guī)模基本盤(pán)。
在豆包視頻大模型發(fā)布前,《山海奇鏡之劈波斬浪》和《三星堆:未來(lái)啟示錄》就是抖音和快手在AI內(nèi)容領(lǐng)域的官方嘗試,前者屬于AI科幻短劇,后者則是AI奇幻短劇。
官方作品具有引導(dǎo)意義,但要想撬動(dòng)更多內(nèi)容創(chuàng)作者加入賽道,還需要更多行動(dòng)。
不過(guò),AI內(nèi)容創(chuàng)作這一點(diǎn)上,抖音與快手態(tài)度趨同:鼓勵(lì),但反對(duì)低質(zhì)。今年6月,快手電商發(fā)布了使用AIGC能力直播的倡議公告,鼓勵(lì)商家/達(dá)人和老鐵們進(jìn)行良好互動(dòng),但明確了流量不會(huì)傾斜,避免低質(zhì)內(nèi)容。來(lái)到9 月 8 日,抖音則公布了關(guān)于“發(fā)布特定內(nèi)容需主動(dòng)添加標(biāo)識(shí)”的公告,鼓勵(lì)創(chuàng)作者尊重事實(shí)、發(fā)布客觀真實(shí)信息,同時(shí)對(duì)于特定信息,應(yīng)以“內(nèi)容標(biāo)識(shí)”的形式提供充分的說(shuō)明,降低用戶(hù)的理解成本。
但事實(shí)上,創(chuàng)作者和用戶(hù)顯然更關(guān)注AI創(chuàng)作帶來(lái)的娛樂(lè)性,“容嬤嬤喂紫薇吃香腸”“唐僧啃雞腿、吃漢堡”“悟空掏手槍”“爾康失態(tài)”等無(wú)腦爆改短視頻風(fēng)靡全網(wǎng),以腦洞、爆笑等元素獲得了粉絲的關(guān)注,抖音上,相關(guān)話(huà)題“當(dāng)AI擴(kuò)圖卷土重來(lái)”登上熱榜,截至目前共有3.9億次播放。
對(duì)于抖音來(lái)說(shuō),這是個(gè)不錯(cuò)的開(kāi)始,內(nèi)容拓展后,粉絲粘性提高、收入提升、制作成本下降,都是AI視頻大模型帶來(lái)的優(yōu)勢(shì),當(dāng)然抖音更大的期待,還包括規(guī)避版權(quán)費(fèi)風(fēng)險(xiǎn)。
聯(lián)系客服