隨著人工智能進(jìn)入藝術(shù)設(shè)計(jì)領(lǐng)域成為主流,2022年可能會載入史冊。
基于不同模型的人工智能(AI)工具的爆炸性增長,使任何擁有智能手機(jī)和互聯(lián)網(wǎng)連接的人都可以使用AI藝術(shù)類的工具了。這些工具目前是使用人工智能模型將文本輸入轉(zhuǎn)換為圖像輸出。
這里有五個(gè)AI工具可以生成圖片,為了比較他們,我給了他們同樣的輸入:“A person and a robot standing beside a large oak tree on a hill with clouds in the sky.”(一個(gè)人和一個(gè)機(jī)器人站在山上的一棵大橡樹旁,天空中有云。)
DALL-E 2
OpenAI成立于2015年,隨著2020年自然語言模型GPT-3的發(fā)布成為頭條新聞。DALL-E數(shù)字圖像模型隨后于2021年1月推出,后來演變?yōu)镈ALL-E 2。OpenAI的模型為各種風(fēng)格提供了出色的圖像輸出。
DALL-E 2現(xiàn)在通過OpenAI的網(wǎng)站(https://openai.com/dall-e-2/)向所有人開放,對于那些好奇的人來說是最好的工具。它以明顯的優(yōu)勢擊敗了我嘗試過的其他網(wǎng)站,而且網(wǎng)站很容易導(dǎo)航。它一次提供四個(gè)結(jié)果,通常以非常不同的樣式,這減少了您需要重新運(yùn)行提示的頻率。DALL-E2的結(jié)果也很好。這是唯一一個(gè)同時(shí)描繪人和機(jī)器人的AI模型。但它是收費(fèi)的。
Stable Diffusion / Dream Studio
Stable Diffusion,來自于Stability AI(https://stability.ai/),與DALL-E 2一樣受歡迎,它能提供快速、高效,并且可以從各種提示中生成可用的圖片。
任何人都可以通過Stable Diffusion的演示頁面(https://huggingface.co/spaces/stabilityai/stable-diffusion)免費(fèi)使用。它雖然不如DALL-E 2快,但通常能在30秒或更短的時(shí)間內(nèi)提供結(jié)果圖片。它還同時(shí)提供四種變體,就像DALL-E 2一樣。
Stable Diffusion的模型是開源的,因此我們可以通過修改源碼來調(diào)整其工作原理,這一點(diǎn)就很吸引人。
Stability AI還有一個(gè)基于Stable Diffusion的商業(yè)版叫Dream Studio。可以試用,但之后是需要付費(fèi)的。在操作上,用戶可以通過滑塊來調(diào)整模型的輸出結(jié)果。
此前一名參賽者在科羅拉多州博覽會上使用Midjourney生成的圖片幫他贏得了數(shù)字藝術(shù)獎(jiǎng)——之前沒有透露圖像的創(chuàng)作方法,所以引起了些爭議。該工具擅長生動、空靈、超現(xiàn)實(shí)的圖像,用戶群已經(jīng)接受了它的風(fēng)格。
該工具只能通過Discord平臺訪問。以輸入聊天文字的方式來訪問Midjourney。
Midjourney是商業(yè)產(chǎn)品,與其他商業(yè)AI藝術(shù)生成工具一樣是要花錢使用的,同樣支持在線支付。
Craiyon
Craiyon(https://www.craiyon.com/)最初名為DALL-E Mini,但與OpenAI并無關(guān)系,其創(chuàng)建者免費(fèi)提供該工具。生成結(jié)果最多可能需要2分鐘,分辨率很低,但同時(shí)會出現(xiàn)9個(gè)結(jié)果。
Craiyon的不同在于在使用未經(jīng)過濾的數(shù)據(jù),沒有做出任何具體努力來完善、訓(xùn)練或糾正結(jié)果。與其他工具相比,結(jié)果通常不咋的,并且難以處理精細(xì)的細(xì)節(jié)。例如,根本就看不清人臉。
VQGAN+CLIP
AI圖像生成器最近的流行產(chǎn)生了數(shù)百種工具,這些工具將高級AI模型與裸接口配對,在Google的Colaboratory notebook中運(yùn)行的VQGAN+CLIP就是這樣一個(gè)工具。
它之所以值得一提,是因?yàn)樗€算易于使用,我們可以在調(diào)試中觀察該工具實(shí)時(shí)迭代的變化。雖然可以在Colaboratory notebook中訪問,但該模型也可以在本地機(jī)器上運(yùn)行。從一點(diǎn)一點(diǎn)開始給出文本提示,然后慢慢變成可用的圖像。
該工具的結(jié)果通常不是很好,因?yàn)樗俣忍?,一次只能提供一種圖片,并且會消耗了大量的內(nèi)存。但它是完全免費(fèi)的,不包含廣告,所以如果有時(shí)間,這是一個(gè)不錯(cuò)的選擇。
參考:
OpenAI:https://openai.com/
DALL-E 2:https://openai.com/dall-e-2/
Stability AI:https://stability.ai/
Stable Diffusion:
https://huggingface.co/spaces/stabilityai/stable-diffusion
Dream Studio:
https://beta.dreamstudio.ai/dream
Craiyon:https://www.craiyon.com/
VQGAN+CLIP:
https://colab.research.google.com/drive/1Tz8Kh19r-GreZnuGrzz6Il4Nxn5DeSxE