四月初,我看到 CG 大佬 @瘋景CrazyJN 展示了一組科幻插畫,它們構(gòu)圖巧妙,畫面精美,乍一看像某位概念設計大師的作品。
有意思的是,這些都是 AI 畫出來的。他用的工具是 Disco Diffusion,一個僅靠文字就能生成畫作的 AI。
我?guī)е蓡柡推诖?,直奔電腦,隨手搜了一個快速入門教程。簡單來說,我只要打開瀏覽器,在網(wǎng)頁上寫好描述目標畫作的關鍵詞,然后就等著云端算力(對計算機硬件無要求)幫我渲染、生成,接著就能收圖了。而這些圖,往往還都是杰作。
對著教程,我開始想描述語句。我想象力有限,那時只能想到梵高的《星空》《向日葵》這兩幅名畫,“如果它們?nèi)诤铣梢环嫞瑫鞘裁礃??”于是,我在描述框里輸入:星空下的向日葵花?!?/span>
之后,渲染框一幀一幀地變清晰,畫面一幀一幀地逐漸“離譜”。
成品并非是《星空》和《向日葵》的生硬拼接:巨大的向日葵就開在山后,背后是萬星璀璨的星空。
我意識到:一個新的時代已經(jīng)悄然而至。夸張點說,這個工具出現(xiàn)后,人們“用嘴就能畫畫”。
我忙著在設計師圈里奔走相告,而 Disco Diffusion 這位 AI 畫師又勤勤懇懇地給我畫了好幾張圖。
我很感動,于是一口氣又讓它幫我畫了大半個月……
我?guī)缀趺刻於荚跍y試描述詞、調(diào)教機器人,踩了很多坑,翻了不少車,現(xiàn)在想以新手視角寫一篇入門教程。放心,即使你沒有代碼基礎也能看懂。
Disco Diffusion 是一個直接運行在谷歌云端電腦(Google Colab)的程序,所以對你的電腦配置沒有任何要求,有瀏覽器就能運行。對了,前提是你已經(jīng)有一個谷歌賬號。
接下來,復制https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb到瀏覽器,開始 AI 繪畫之旅。
先別慌,我一開始也差點被這滿屏的英文和代碼勸退,但咬牙刷了幾個入門教程后我就膨脹了:原來設置參數(shù)也就幾分鐘的事兒。
下面,我繼續(xù)教你,手把手,保姆級。
第一步:保存一份副本
由于原程序是公開給所有人使用的,沒有開放編輯權(quán)限,因此需要先保存一份副本到你的谷歌硬盤,操作如下:文件 → 在云端硬盤中保存一份副本。
第二步:設置參數(shù)
初次使用的話,建議大部分參數(shù)保持默認,你可以等操作熟練了再繼續(xù)摸索。到這里,你先修改下面六個參數(shù)。
首先,直接滑到【3. Settings】,修改這三個基礎參數(shù):
然后,到【Extra Settings】修改這個參數(shù):
最后,到【4. Diffuse!】里修改這兩個參數(shù):
至此,六個基本參數(shù)設置完畢。接下來,就是最重要的描述詞環(huán)節(jié)了。
第三步:撰寫描述詞
描述詞(Prompts)寫對了,Disco Diffusion 才能輸出越接近你預期的畫作。所以,撰寫描述詞這一步非常關鍵。
如果你是初次使用,我建議你先在官方示例描述詞的基礎上修改,先別著急照抄網(wǎng)上現(xiàn)成的描述詞。
舉個例子,官方示例描述詞是“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme”
官方示例描述詞生成圖丨Disco Diffusion
簡單分析一下,你會發(fā)現(xiàn)這段在描述一個燈塔的畫面時,還附加了很多特殊的關鍵詞:
這些關鍵詞都會直接影響生成結(jié)果的畫風。于是,我有樣學樣地修改了一些字眼:把“燈塔”替換成“星夜”,把“動蕩的血?!备某伞跋蛉湛ê!?,藝術(shù)家替換成“James Gurney”。
“A beautiful painting of a starry night, shining its light across a sunflower seaby James Gurney, Trending on artstation.”
開篇提到的向日葵花海,就是由這段描述詞生成。
關于描述詞的更多注意事項,我會在后面的進階篇細講,這里先把流程跑通再說。
第四步:點擊運行
你已經(jīng)完成了所有配置,直接運行吧!依次點擊:代碼執(zhí)行程序 → 全部運行
在程序運行過程中,會詢問你是否允許訪問谷歌硬盤,點擊【連接】。然后,就等著收圖吧!
最終生成結(jié)果以及過程圖,都會存放在谷歌硬盤的【images_out】文件夾里:
以上,就是使用 Disco Diffusion 的整個流程。
為了讓 AI 能聽懂我的話,過去的大半個月我都在跟 Disco Diffusion“吵架”,積累了不少經(jīng)驗,下面分享 8 個小竅門:
1. 英文不好沒關系,機翻可能更對機器人的口味。
2. 不建議生成生物,尤其是人類。同理,也不建議加入常畫人物的藝術(shù)家為關鍵詞。否則你會得到一堆扭曲的肉,為了保住大家的“san 值”,我就不放圖了。
3. 酌情加入 Unreal Engine, C4D, 3dMax, Maya, V-Ray 等關鍵詞,它們都可以讓 AI 模仿主流 3D 引擎的渲染效果。
以這個異形場景為例,加入“Unreal Engine“前,畫面有點平,像作者的手稿
加入“Unreal Engine“后,我能清楚地感受到輝光、景深以及金屬光澤,這讓畫面更有電影質(zhì)感
4. 加入能讓畫面更高清的關鍵詞,比如:high detailed, detailed, 8k, intricate, elaborate 等。
我在生成達芬奇手稿時做了對比測試,能感受到明顯的精細度變化。
“animal skull sketch, by Leonardo davinci journal”
“detailed animal skull sketch, by Leonardo davinci journal”
5. 加入可以幫 AI 去掉作者本人照片的關鍵詞:human:-2。
有時候,AI 會把藝術(shù)家本人照片當成是藝術(shù)風格之一融入到生成圖中,尤其是一些有自畫像的作者。此時,你可以在描述詞中強行把人類權(quán)重降低。還是以達芬奇手稿為例:
“a time machine blueprint, by Leonardo da vinci journal”
“a time machine blueprint, by Leonardo da vinci journal”, “human:-2”
6. 加入可以去掉煩人景深的關鍵詞:blur:-2, depth of field:-2。
AI 給畫面加入的景深是隨機的,有時候甚至會反噬畫面,如果你不想被隨機景深影響,也可以強行把景深的權(quán)重降低,看下面這組對比:
“Mount Fuji, Sakura, by Phil Greenwood”
“Mount Fuji, Sakura, by Phil Greenwood”, “depth of field:-2”
7. 給 AI 多點提示,用上關鍵詞組合:名畫名字 + 作者名字。
比如很多非英語地區(qū)的名畫,其英文譯名都是后加的,AI 并不能很好地識別出來,不能被準確識別的關鍵詞,也就是無效的關鍵詞。
舉例,日本的《神奈川沖浪里》的英文名是“the Great Wave”,如果你只在描述詞中寫這個英文名,AI 可能只會幫你畫一個普通的大浪,請看下面這組對比:
不加原作者,AI 就按他的理解給我畫了一個驚濤駭浪
加上名畫作者葛飾北齋的名字后,AI 就能精準還原原作的一些特征了
8. 巧用一些特殊畫風關鍵詞。
Disco Diffusion 能模仿的遠不止 Artstation 上的流行藝術(shù)家,它還能畫水墨畫和異形主題畫。我列舉一些用過的特殊畫風關鍵詞:
水墨風關鍵詞:Chinese ink painting, Chinese Shanshui
莫比斯風格關鍵詞:moebius, m?bius, Jean Giraud(莫比斯本名)
異形主題關鍵詞:Alien, H. R. Giger(異形之父)
更多有趣的關鍵詞,可以關注這份由網(wǎng)友 proximasan 和 sureailabs 整理出來的畫風詞典:https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist-studies/。他們用同一組描述詞,測試了 70 多位藝術(shù)家的畫風在 Disco Diffusion 上的表現(xiàn),并制作了非常直觀的對比圖。
如果你還不滿足,強烈建議到 Disco Diffusion 的 Discord 社區(qū)逛一逛:discord.gg/QFjmfjXE。在那里,來自全世界的高級玩家不間斷地討論著同一個話題:如何生成出更好的效果?信息量大到即使你偶爾瞄一眼,都能獲得很多實用小技巧。
如你所見,關于“如何寫好描述詞”,是沒有天花板的??傆心銢]見過的風格,總有你學不完的參數(shù)設置。
在用 AI 生成畫作的這大半個月,我越發(fā)驚嘆人類藝術(shù)家的造詣。那些擁有自己成熟畫風的藝術(shù)家是多么的偉大,試想,這每個名字背后得濃縮多少才華和心血才能達到影響 AI 畫風的程度呢?
人類還沒輸。
“AI 超越人類”的新聞沒有停過,人們擔心自己會因此失業(yè)。但我想,面對一項新技術(shù),消除焦慮最好的方法就是先學會它。
AI 不會讓我失業(yè),它大概率能讓我早點下班。它有著更“脫韁”的想象力,能毫不費力地產(chǎn)出大量天馬行空的畫面,規(guī)則之外的構(gòu)圖,想都不敢想的混搭。有一些藝術(shù)家開始嘗試在 Disco Diffusion 生成圖的基礎上再加工,再創(chuàng)作。
我用 Disco Diffusion 生成了一段視頻
還有人擔心它存在版權(quán)風險。Disco Diffusion 生成圖理論上可以商用,其程序基于 MIT 開源協(xié)議,所有互聯(lián)網(wǎng)用戶可以免費使用、復制、修改甚至出售生成圖。但我覺得還是存有風險。風險主要來源于你的描述詞會引來畫風抄襲的爭議。
當你使用了風格鮮明的藝術(shù)家(尤其是在世的藝術(shù)家),以及某部商業(yè)作品作為關鍵詞時,都請不要直接拿來商用。