你好,我是王煜全,這里是王煜全要聞評(píng)論。
GPT-4剛推出時(shí)就火爆了全網(wǎng),但一直只能生成文本信息,不過很快就可以用來畫畫了。
9月21日,OpenAI在官網(wǎng)上公布了最新版的AI工具DALL·E 3,與市面上各種AI繪畫工具相似,你只需要輸入文字信息,它就會(huì)根據(jù)自己的理解畫出相應(yīng)的圖像。
其實(shí),DALL·E原本就是OpenAI在GPT-4之外的主打產(chǎn)品,都是基于Transformer架構(gòu)開發(fā)出來的,只是用途和功能有所不同,就像特長(zhǎng)不同的兩兄弟,一個(gè)擅長(zhǎng)繪畫,一個(gè)擅長(zhǎng)寫字。
這次推出的DALL·E 3在前代產(chǎn)品的基礎(chǔ)上做了升級(jí),有了更強(qiáng)大的繪圖能力,畫面細(xì)節(jié)、清晰度、合理性都有提升,明顯比DALL·E 2的畫技精湛了不少。
但最重要的是,OpenAI直接把DALL·E整合到GPT里面了,10月份產(chǎn)品正式上線之后,GPT plus用戶和企業(yè)用戶就可以一邊和GPT聊天一邊畫畫了。
那么,OpenAI這樣做有什么意義呢?表面上看,這只是一次產(chǎn)品更新,但卻會(huì)帶來兩種截然不同的影響,可以說是有人歡喜有人愁。
愁的是誰呢?自然是很多的AIGC應(yīng)用,比如Midjourney、Adobe Firefly等AI繪畫應(yīng)用,以及Runway這樣的AI生成視頻應(yīng)用。
如果從OpenAI展示的效果圖來看,還不如Midjourney生成的圖片驚艷,而且主要以漫畫風(fēng)為主,沒有展示寫實(shí)類的圖片,而Midjourney生成的寫實(shí)圖片已經(jīng)可以媲美照片的效果了,
但是,這并不代表OpenAI會(huì)一直落后,它其實(shí)有著巨大的發(fā)展?jié)摿Γ苡锌赡軐?shí)現(xiàn)趕超。
一方面,他們的用戶基數(shù)足夠龐大,8月份訪問量達(dá)到14.3億次,獨(dú)立訪客量1.8億,而Midjourney社區(qū)用戶只有1400萬。
對(duì)生成式AI來說,用戶反饋是迭代更新的重要因素,用戶基數(shù)越大,交互越頻繁,所能收集的反饋數(shù)據(jù)越多,模型迭代和優(yōu)化的速度也就越快,這對(duì)眾多AI繪畫工具來說都是巨大威脅。
另一方面,AI繪畫的關(guān)鍵環(huán)節(jié)是人類輸入的提示詞,而GPT-4有一個(gè)巨大的優(yōu)勢(shì),就是理解人類命令的能力更強(qiáng),反饋出的圖像也就更加精準(zhǔn),但有些AI工具卻容易忽略部分文字表述,或者曲解用戶意圖。
比如,OpenAI在DALL·E 3公告中發(fā)了一張圖,內(nèi)容是一個(gè)藏著宇宙的心形玻璃容器,還附帶了完整的提示詞,我們用同樣的提示詞讓Midjourney也畫了一下,結(jié)果Midjourney就忽視了藏著的宇宙。雖然Midjourney經(jīng)過調(diào)整之后也可能畫出相應(yīng)的內(nèi)容,但這仍然展現(xiàn)出了DALL·E 3的理解能力。
另外,從宣傳片上看,DALL·E 3還展現(xiàn)出了不錯(cuò)的一致性,畫面中的一只小刺猬在不同的場(chǎng)景中,仍然能夠保留核心角色特征。
而一致性的下一步就是形成連續(xù)的畫面,最終形成視頻,這就代表,OpenAI可以順其自然地推出AI生成視頻工具,技術(shù)上并沒有跨越不了的門檻,剩下的可能只是時(shí)間問題。
這就意味著,Runway等AI生成視頻應(yīng)用,也會(huì)面臨與Midjourney一樣的挑戰(zhàn)。
其實(shí),幾個(gè)月前我就提出,如果只在大模型平臺(tái)的能力范圍內(nèi)做微創(chuàng)新,那么很容易被平臺(tái)整合甚至吞噬,以往是AI寫作、AI編程,現(xiàn)在就會(huì)輪到AI繪畫、AI視頻,GPT整合DALL·E 3的繪畫功能,就是一個(gè)佐證。
那么,除了有人愁之外,有誰會(huì)因此受益呢?
可以預(yù)見,最大的受益群體可能是內(nèi)容創(chuàng)意工作者,因?yàn)?,大模型從文字走向圖像視頻兼?zhèn)涞亩嗄B(tài)之后,很可能帶來內(nèi)容創(chuàng)意的大爆發(fā)。
其實(shí),原本就有人使用DALL·E 2制作過影視作品。比如,底特律的一家廣告制作公司W(wǎng)aymark就用AI工具制作了12分鐘的微電影《The Frost》,他們用GPT-4寫劇本,DALL·E 2生成畫面,再導(dǎo)入到名為D-ID的“圖生視頻”工具中,做成了完整的視頻。
除了公司之外,一些個(gè)人創(chuàng)作者也用上了AI創(chuàng)作工具,比如,B站博主“數(shù)字生命卡茲克”就用Midjourney和Runway Gen-2制作了《流浪地球3》的預(yù)告片,還獲得了原作導(dǎo)演郭帆的稱贊。
不過,人們對(duì)這些AI生成作品的態(tài)度卻是褒貶不一,有人認(rèn)為畫面質(zhì)量太差,人物行為怪異,甚至有點(diǎn)恐怖,但也有人認(rèn)為,怪異的畫面反而是激發(fā)靈感的素材,能夠借此創(chuàng)造更多以往難以想象出來的場(chǎng)景。
實(shí)際上,AI工具給內(nèi)容創(chuàng)作者來帶來的好處,不只是提升工作效率,還增加了一個(gè)新的創(chuàng)作維度。
就像電影從默片時(shí)代走向有聲電影時(shí)代一樣,增加了聲音維度,而AI為人們?cè)黾恿巳四X之外的創(chuàng)意維度,AI生成的更有想象力的乃至怪異的畫面,恰恰是拓展了認(rèn)知邊界。
也就是說,人與AI的合作,是一個(gè)相互啟發(fā)、協(xié)同創(chuàng)作的過程,所以,很可能會(huì)帶來內(nèi)容創(chuàng)意的大爆發(fā)。
更進(jìn)一步說,當(dāng)AI創(chuàng)意大繁榮之時(shí),真正有價(jià)值的也就不是AIGC,而是AIGS了。這是因?yàn)?,AI很容易學(xué)會(huì)各種既定風(fēng)格,快速生產(chǎn)出符合相應(yīng)風(fēng)格的內(nèi)容創(chuàng)意產(chǎn)品,而人類在內(nèi)容創(chuàng)意上的最大價(jià)值將是創(chuàng)造新風(fēng)格,之后在AI的輔助下提供持續(xù)的服務(wù),這才是未來內(nèi)容創(chuàng)意的大機(jī)遇。
聯(lián)系客服