輸入一句話,AI就能為有志于從事藝術(shù)創(chuàng)作的任何人,生成一幅創(chuàng)意畫作,不管創(chuàng)作者此前是否接受過(guò)專業(yè)的藝術(shù)訓(xùn)練。
近兩年,海外用戶借助Disco Diffusion、MidJourney等AI繪畫軟件來(lái)進(jìn)行藝術(shù)創(chuàng)作,逐漸成為一種風(fēng)潮。在國(guó)內(nèi),也有了諸如百度文心一格、TIAMAT等這類適用于中文描述語(yǔ)輸入、更能理解中國(guó)文化審美的AI藝術(shù)和創(chuàng)意輔助平臺(tái)誕生。
對(duì)專業(yè)者而言,這類AI繪畫輔助工具是一個(gè)很好的創(chuàng)意助手。而一些素人則利用這些工具,發(fā)展出了自己的斜桿事業(yè),在抖音上做壁紙?zhí)?,在閑魚上賣描述語(yǔ),有的還將自己的作品賣給了包裝廠或數(shù)字藏品業(yè)者,賺到些許零花錢。
#01
AI式創(chuàng)作自由
吳先生本職工作是一位醫(yī)生,他愛(ài)玩抖音,閑暇之時(shí)常想著在抖音上做點(diǎn)什么來(lái)掙錢。
2個(gè)月前,他看到不少創(chuàng)作者在抖音上做壁紙?zhí)?,也就是?chuàng)作者會(huì)發(fā)布一些好看的照片或圖片,用戶可以下載拿去當(dāng)電腦或手機(jī)桌面。下載時(shí)用戶需要看一段平臺(tái)廣告,創(chuàng)作者則能從廣告播放中獲得平臺(tái)分成。
據(jù)吳先生的觀察,壁紙?zhí)柸θ詫傩”姡χ幸灿?、30萬(wàn)粉絲的創(chuàng)作者,通過(guò)向用戶輸送風(fēng)景、人物、汽車等這類美照,月入上萬(wàn)。
吳先生本身是風(fēng)景照愛(ài)好者,也想做一個(gè)風(fēng)景類的壁紙?zhí)?,但苦于沒(méi)有多少素材。正發(fā)愁時(shí),他接觸到了AI繪畫,發(fā)現(xiàn)只需要在AI繪畫軟件里輸入相關(guān)描述語(yǔ),就能生成好看的圖片,這解決了他素材缺乏的難題。
吳先生下載了兩款海外的AI繪畫產(chǎn)品,一款是Disco Diffusion,一款是MidJourney,在抖音上注冊(cè)了一個(gè)賬號(hào),名為“AI美圖”,便開始作畫。
Disco Diffusion每天有3小時(shí)可免費(fèi)使用,MidJourney吳先生則充了會(huì)員費(fèi),每月30美元。每張圖平均幾分鐘就能生成的創(chuàng)作效率,足以支撐起吳先生做賬號(hào)的素材需要。
在吳先生看來(lái),這兩款軟件擅長(zhǎng)的重點(diǎn)各有不同。Disco Diffusion擅長(zhǎng)畫場(chǎng)景,MidJourney擅長(zhǎng)畫人物或動(dòng)物之類的近景。
在有了這兩款軟件的加持后,身為醫(yī)生的吳先生實(shí)現(xiàn)了創(chuàng)作自由。
他通過(guò)輸入各種描述語(yǔ),來(lái)不斷試錯(cuò),一天能夠發(fā)布7到8張作品。雖然后來(lái)吳先生發(fā)現(xiàn),因?yàn)橛脩羧ψ犹?,并不需要每日在抖音上傳這么多。
更難能可貴的是,雖然沒(méi)有藝術(shù)積淀,但并不妨礙吳先生創(chuàng)作出可賣出價(jià)格的作品。
據(jù)介紹,吳先生創(chuàng)作的一幅賽博朋克機(jī)器人,其背后的描述語(yǔ),被一位從事數(shù)字藏品交易的人士以數(shù)十元價(jià)格買去,這讓吳先生驚訝不已。
爾后,這位人士又請(qǐng)吳先生創(chuàng)作了一組十二生肖圖片,用作數(shù)字藏品開發(fā)。吳先生用AI為每組生肖創(chuàng)作了3張圖片備選,最后這一組圖片背后的描述語(yǔ),以數(shù)百元的價(jià)格售出。
這給了吳先生以啟發(fā)。由于吳先生的抖音號(hào)粉絲才200多人,難以通過(guò)廣告分成的方式掙到錢,他索性決定專門去賣描述語(yǔ)。
百條描述語(yǔ)標(biāo)價(jià)20元,拿到抖音、閑魚上去賣,有印刷商前來(lái)購(gòu)買,這形成了吳先生的零花錢收入。
與吳先生經(jīng)歷類似的還有小紅書博主土味牛仔,攝影專業(yè)出身的他,今年6月起開始嘗試用MidJourney來(lái)進(jìn)行AI繪畫。
土味牛仔的AI繪畫作品多以牛仔為主題,風(fēng)格涵蓋東方元素、未來(lái)感、科幻感等,點(diǎn)贊量高的達(dá)數(shù)千,他習(xí)慣把攝影時(shí)無(wú)法實(shí)現(xiàn)的腦洞告訴AI,讓AI幫他實(shí)現(xiàn)。
4個(gè)月的時(shí)間里,土味牛仔一共在小紅書發(fā)布了117張AI繪畫作品,其中每張作品背后平均的生成次數(shù)為50次,可謂精益求精。
創(chuàng)作者在學(xué)習(xí),AI也在學(xué)習(xí)。目前,MidJourney里共記錄了土味牛仔的10000多次生成記錄?,F(xiàn)在土味牛仔只要一輸入相關(guān)詞匯,AI就能生成相關(guān)額外的聯(lián)想。有時(shí)土味牛仔會(huì)懷念“不太聽人話”、更具備天馬行空創(chuàng)意的AI,而不是對(duì)人類思維偏好越來(lái)越貼近的圓滑AI。
在小紅書上發(fā)布AI繪畫作品以后,土味牛仔說(shuō)他接到過(guò)幾次約稿,也有人找上門想直接購(gòu)買原圖留作NFT收藏,但這樣的人屈指可數(shù)。目前他在AI繪畫作品上的收入還不足以支付他在MidJourney上的投入。
據(jù)土味牛仔在圈子里的觀察,大家使用AI繪畫的原因各不相同。有插畫師朋友會(huì)用AI生成作品的草稿,以此為基礎(chǔ)進(jìn)行創(chuàng)意和修改。做建筑設(shè)計(jì)的朋友則會(huì)利用AI來(lái)進(jìn)行頭腦風(fēng)暴。但更多素人就是圖一個(gè)新鮮,就是想要看“超人跟鋼鐵俠合在一起是什么樣子”。
在用戶們的推動(dòng)下,B站、抖音上等介紹AI繪畫軟件和教程的視頻越來(lái)越多,小紅書則成了AI繪畫作品的一個(gè)重要展示平臺(tái),閑魚則扮演了一個(gè)銷售描述語(yǔ)的平臺(tái)角色。
#02
AI繪畫技術(shù)的迭代
AI繪畫的源頭可以追溯到上世紀(jì)70年代。
計(jì)算機(jī)問(wèn)世后的10年,就有藝術(shù)家打造電腦程序AARON來(lái)進(jìn)行繪畫創(chuàng)作,其主要原理是控制機(jī)械臂來(lái)作畫,但當(dāng)時(shí)的技術(shù)成本比較高,且只能得到抽象的結(jié)果。
而現(xiàn)代意義的AI繪畫,主要是指AI從海量圖文對(duì)應(yīng)的數(shù)據(jù)中學(xué)習(xí)“語(yǔ)言描述”與“藝術(shù)畫面”的關(guān)聯(lián),以隨機(jī)化的起點(diǎn)開始,不斷修正畫作,最終形成在審美上與人類經(jīng)驗(yàn)與知識(shí)高度一致的成品。
據(jù)百度文心一格相關(guān)負(fù)責(zé)人介紹,現(xiàn)代意義AI繪畫技術(shù)的雛形,主要出現(xiàn)在上一個(gè)十年中。
彼時(shí)的技術(shù)可以批量完成由文本信息指定的畫面生成,技術(shù)上包括風(fēng)格遷移、元素拼接和對(duì)抗生成網(wǎng)絡(luò)(GAN—Generative Adverserial Network)等。
從生成的畫面質(zhì)量來(lái)看,雖然這些技術(shù)使AI繪畫的水平有了明顯進(jìn)展,并且在比較強(qiáng)烈的風(fēng)格上有了初步的應(yīng)用可能性,但與人類作畫質(zhì)量依然存在差距。
AI繪畫最近的一次技術(shù)爆發(fā)是2022年對(duì)擴(kuò)散生成模型的引入,這類模型用于文生圖后,能夠在更短的時(shí)間內(nèi),像素級(jí)建模并生成分辨率顯著提升的繪畫,并且在美感、細(xì)節(jié)精細(xì)度有非常顯著的提升,一些AI繪畫的成品已經(jīng)和人類作畫的質(zhì)量不相上下。
行業(yè)里普遍認(rèn)為,從2021年到2022年,是AI文生圖技術(shù)發(fā)展最快的兩年,諸多新的學(xué)習(xí)模型或產(chǎn)品誕生,AI繪畫的風(fēng)潮也開始發(fā)展。
一是Open AI于2021年初發(fā)布的深度學(xué)習(xí)模型 CLIP(Contrastive Language-Image Pre-Training)。
Open AI是一家于2015年12月成立于美國(guó)的人工智能研究公司,它用 CLIP先后創(chuàng)建了DALL-E 和DALL·E 2兩個(gè)AI系統(tǒng),為用戶構(gòu)建了可以根據(jù)文字描述創(chuàng)建更逼真、更準(zhǔn)確圖像的能力。
二是于今年2月初開始出現(xiàn)并流行的開源繪畫程序Disco Diffusion,它是一個(gè)由谷歌推出的AI,開發(fā)者是藝術(shù)家兼程序開發(fā)員的Somnai_dreams 。
Disco Diffusion的特點(diǎn)是能夠高效合成視覺(jué)數(shù)據(jù),圖片生成的質(zhì)量直接擊敗了GAN模型。但缺陷仍然存在,主要表現(xiàn)在AI繪畫欠缺細(xì)節(jié),渲染的時(shí)間過(guò)長(zhǎng),內(nèi)存資源消耗巨大。今年7月開始測(cè)試的Stable Diffusion程序,則很快改進(jìn)了以上缺點(diǎn)。
三是今年6月推出的MidJourney,它是一個(gè)富有創(chuàng)造性的AI,用它生成的圖片質(zhì)量得到了大幅度的提升,且以月費(fèi)為方式的商業(yè)化做得比較成功。目前公開資料顯示MidJourney的用戶成員已經(jīng)超過(guò)了240萬(wàn)人。
在國(guó)內(nèi),AI繪畫也開始逐漸有了熱度。
像Stable Diffusion、MidJourney這類模型,主要是針對(duì)英文世界的用戶,語(yǔ)言和文化的差異形成了國(guó)內(nèi)用戶使用海外AI繪畫軟件的阻礙。國(guó)內(nèi)用戶呼喚中文世界的文生圖產(chǎn)品,這形成了一定的市場(chǎng)需求。
TIAMAT成立于2021年、被稱為是國(guó)內(nèi)首批AI生成式平臺(tái)。今年上半年,TIAMAT開始在小紅書、抖音等社交媒體上發(fā)布中文文生圖的產(chǎn)品,趕上了AI繪畫的第一波熱潮。
圖 | 小紅書上的AI繪畫
圖 | 閑魚上的AI繪畫
TIAMAT致力于為個(gè)人用戶和企業(yè)客戶提供創(chuàng)意生產(chǎn)、廣告、數(shù)字藏品等場(chǎng)景形式下的服務(wù)。日前,TIAMAT已宣布完成數(shù)百萬(wàn)美元天使輪融資,投資方為DCM。
今年8月,百度發(fā)布了AI藝術(shù)和創(chuàng)意輔助平臺(tái)文心一格,它使用了百度自主研發(fā)的產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型—文心大模型,通過(guò)語(yǔ)義理解+多畫作風(fēng)格適配+結(jié)果優(yōu)化排序,讓用戶只需要輸入一句話,就能完成畫作,包括意向、具象等多種類型和風(fēng)格。
文心一格被認(rèn)為有效地解決了中文世界中,需求描述困難、多樣化需求強(qiáng)、模型生成結(jié)果篩選難的困難,降低了中文世界用戶使用AI繪畫的難度。
基于文心一格平臺(tái),由百度數(shù)字人度曉曉創(chuàng)作的“無(wú)界”系列畫作,已被專業(yè)美院教授評(píng)價(jià)為“已經(jīng)達(dá)到了本科美術(shù)生的基本要求”。
業(yè)內(nèi)人士指出,對(duì)于AI繪畫而言,如何讓AI準(zhǔn)確理解中英文語(yǔ)境中的描述語(yǔ)至關(guān)重要。描述語(yǔ)不僅有中英文上的語(yǔ)言差異,也有語(yǔ)言承載的文化差異,從而影響到AI繪畫技術(shù)的研發(fā)。
例如“龍”對(duì)于英文環(huán)境基本沒(méi)有歧義,但在中文環(huán)境中則有東方龍和西方龍的形象差異,且東方龍和西方龍作為文化符號(hào)的意義也完全不同,這對(duì)AI繪畫技術(shù)提出了很大的挑戰(zhàn)。
從當(dāng)下來(lái)看,如何處理好語(yǔ)言、文化的差異,AI繪畫還有很長(zhǎng)的路要走。
#03
AI繪畫的爭(zhēng)議點(diǎn)和未來(lái)發(fā)展
AI繪畫誕生后,市場(chǎng)上存在的一個(gè)爭(zhēng)議點(diǎn)主要圍繞版權(quán)展開。
AI繪畫平臺(tái)的底層邏輯是融合各創(chuàng)作者的作品以及現(xiàn)有的互聯(lián)網(wǎng)圖片生成的作品,提取原作的筆觸、用色、構(gòu)圖等元素而進(jìn)行的“二次創(chuàng)作”,至于版權(quán)是歸原作者、平臺(tái)方,還是現(xiàn)在的創(chuàng)作者,目前尚難以界定。
據(jù)使用過(guò)Disco Diffusion和MidJourney的用戶介紹,用Disco Diffusion生成的圖片版權(quán)屬于創(chuàng)作者自己所有,而使用MidJourney生成的圖片版權(quán)則屬于創(chuàng)作者與平臺(tái)共有。
百度文心一格相關(guān)負(fù)責(zé)人認(rèn)為,AI技術(shù)生成的圖片并不是既有圖片的拼湊,而是類似人類經(jīng)過(guò)長(zhǎng)期繪畫訓(xùn)練后的再創(chuàng)作,既有繼承,也有自己的特色。
不過(guò)基于版權(quán)問(wèn)題,行業(yè)仍在討論中,為了避免可能的風(fēng)險(xiǎn)以及解決可能發(fā)生的糾紛,百度文心一格方面就表示,未來(lái)如果平臺(tái)開放出來(lái)的生成圖片侵犯到原作者權(quán)益,會(huì)提供投訴反饋通道,為相關(guān)權(quán)利人提供權(quán)利救濟(jì)渠道,迅速處理。
據(jù)了解,目前國(guó)內(nèi)還無(wú)相關(guān)具體的法律案例能夠用來(lái)作參考。
圖 | 在文心一格中輸入“人工智能畫面、超現(xiàn)實(shí)主義”生成的圖片
關(guān)于AI繪畫的發(fā)展方向,本質(zhì)是AIGC(人工智能自主生成內(nèi)容)技術(shù)的發(fā)展,它是一種繼PGC、UGC之后全新的內(nèi)容生產(chǎn)方式,被認(rèn)為能夠刺激內(nèi)容產(chǎn)業(yè)進(jìn)一步發(fā)展。
公開數(shù)據(jù)顯示,全球庫(kù)存圖片市場(chǎng)規(guī)模接近3000億美元。但目前主流的圖片市場(chǎng)是平臺(tái)有什么用戶用什么,而不是用戶想要什么就有什么。內(nèi)容生產(chǎn)者仍然受限于生產(chǎn)的想象力,傳統(tǒng)圖片行業(yè)還處于“數(shù)字手工業(yè)”階段。
相較之下,AIGC的發(fā)展正好順應(yīng)了內(nèi)容創(chuàng)作者對(duì)生產(chǎn)想象力的延伸。以前AI只是輔助內(nèi)容創(chuàng)作的工具,現(xiàn)在AI已經(jīng)能夠獨(dú)立完成寫作、設(shè)計(jì)、繪畫、作曲等創(chuàng)意性工作。
這里需要注意的一點(diǎn)是,AIGC 聽上去時(shí)髦,但自動(dòng)化內(nèi)容生成并不是一個(gè)很新的概念。
利用計(jì)算機(jī)輔助人類進(jìn)行內(nèi)容生產(chǎn)早已經(jīng)出現(xiàn),比如在計(jì)算機(jī)編程領(lǐng)域 IDE 的代碼提示、使用 Office Word 編輯內(nèi)容的錯(cuò)誤修正,再到后來(lái)利用 NLG 自動(dòng)化文本生成等都可以算在這個(gè)范圍里。
關(guān)于目前的AIGC技術(shù)處于哪個(gè)發(fā)展階段, 百度CEO李彥宏在2022年百度世界大會(huì)上有一個(gè)論述。
他將AIGC分為三個(gè)發(fā)展階段:第一階段是助手階段,AIGC 輔助人類進(jìn)行內(nèi)容生產(chǎn);第二階段是協(xié)作階段,AIGC 以虛實(shí)并存的虛擬人形態(tài)出現(xiàn),形成人機(jī)共生的局面;第三階段是原創(chuàng)階段,AIGC 將獨(dú)立完成內(nèi)容創(chuàng)作。
從目前AI在作文、繪畫、寫歌等各個(gè)領(lǐng)域的發(fā)展來(lái)看,AIGC已經(jīng)進(jìn)入助手階段,但總體處于發(fā)展早期。
未來(lái)AI作畫是否會(huì)取代設(shè)計(jì)師、原畫師等,這個(gè)還說(shuō)不定。但從目前人們的反應(yīng)來(lái)看,人們顯然還沒(méi)有那么憂慮。
聯(lián)系客服