本文昨天其實就已經(jīng)發(fā)過一次了,但是由于一些圖片和文字描述不太符合管理規(guī)定,因此今天是修改過后的~
要說上周哪個圖最出圈,莫屬下面這幾組圖片,各位朋友猜猜是哪位COSER——
各位猜到是哪位了嗎?
然而上圖里的美女,均由AI生成,是不是很牛逼?這技術(shù)估計得讓一眾Model和攝影師下崗了吧?同樣還可以生產(chǎn)下面這樣的“超真實”大片
這些以假亂真的妹(lao)子(po)們都是怎么生成的?那就是Stable Diffusion這款軟件。老今天手把手來教你兩種方法進(jìn)行AI繪圖~
Google COLAB線上使用
優(yōu)點:簡單快捷,不需要安裝復(fù)雜的各種軟件,只需要魔法上網(wǎng)即可;硬盤占用?。豢梢允褂妹赓M的GPU資源進(jìn)行繪畫;
缺點:極其依賴網(wǎng)絡(luò)環(huán)境;所有的模型每次都需要在線預(yù)讀下載,對于限流的魔法水管來說很痛苦;版本偏老,有些最新的功能無法使用。
配置環(huán)境建議:
1、Google Chrome
2、需要科學(xué)上網(wǎng)
首先你需要打開下面這個網(wǎng)站:
https://github.com/camenduru/stable-diffusion-webui-colab
這就是本次的主角Stable Diffusion在Github上的開源,下拉到如下圖的位置,點擊箭頭指向的鏈接——
然后你就會進(jìn)入到Colab為你提供的Python環(huán)境——
然后點擊“代碼執(zhí)行程序”,在下拉菜單中點選“更改運行時類型”——
在彈窗中點選“硬件加速器”下方的小箭頭,選擇“GPU”,然后點右下角的“保存”——
保存設(shè)置以后,點擊代碼窗口左上角的這個“Play”標(biāo)簽,然后無視Google的警告點擊“仍然運行”——
接下來就是耐心的等待Colab運行程序獲取等過程,視網(wǎng)絡(luò)環(huán)境需等待2-10分鐘不等,一直到代碼窗口運行到彈出下面圖里有個IP地址的時候就算結(jié)束——
反鍵點擊這個數(shù)字的IP地址(如果數(shù)字IP地址打不開就點擊下面的那個地址),然后在新窗口打開——
如果你成功打開了上面這個圖片的窗口,你已經(jīng)成功在線上打開了Stable Diffusion。然后打開下面這個網(wǎng)站——
civitai.com
是一個專門下載各種模型的網(wǎng)站,但是網(wǎng)站最近用的人太多服務(wù)器壓力特別大,會遇見打不開的情況,如果打不開就換個時段再用就行(有能力的話建議注冊Google Account,資源就更“人性化”)
接下來選擇你喜歡的風(fēng)格,例如Civitai首頁排名最高的模型Deliberate(支持搜索,點擊右上角的放大鏡即可)
這里請注意箭頭上所指的兩個關(guān)鍵點:左上角箭頭指向的Deliberate是模型名字,右邊箭頭指向的是模型種類。知道這兩個重要信息以后,返回Stable Diffusion頁面,點擊上方的CivitAi,既然需要下載的Deliberate歸屬在Checkpoint那就需要在標(biāo)簽下方的Content Type里面點選“Checkpoint”,然后勾選下方的“Serch by term”,再點擊“Get list”就可以獲取到需要尋找的模型對應(yīng)的下拉菜單。
本次以Deliberate為例子,那我們點擊下拉菜單內(nèi)的“Deliberate”,下方自動會彈出模型風(fēng)格預(yù)覽,可以往下翻一翻,如果是你想要找的那個風(fēng)格,那就點“4th Download Model”——
找到想要的模型就點這個
此時就是漫長的等待,這種大類的模型動輒幾個G,小水管承受不起- -你可以返回Colab頁面查看下載進(jìn)度
等待Colab頁面提示xxx(這里是你下載的模型名字)successfully downloaded那么恭喜你,下載完畢——
這時,你已經(jīng)可以開始著手生成你喜歡的老婆形象~以常用的“txt2img”方式舉例,這是一個通過“關(guān)鍵詞”來描述你心目中老婆形象的方法生成——
由于AI生成目前還有一定的瑕疵,比如生成的畫面容易出現(xiàn)多指、多手、四只眼睛等情況,則需要在“不希望出現(xiàn)的負(fù)面描述”里面輸入相應(yīng)的規(guī)則標(biāo)簽來規(guī)避上述“崩壞”情況的發(fā)生,因此建議打開一個“中譯英”的翻譯網(wǎng)站進(jìn)行翻譯,查看其他大神對這些“fewer fingers”或者“double hands”到底是什么意思。
這里老A用抄作業(yè)的方式來生成一個作品試試,使用的模型對象如下——
直接復(fù)制紅圈文本里的內(nèi)容到txt2img里面,這里需要注意幾個參數(shù):
CFG scale——指的是“隨機或貼合程度值”,值越小生成的圖片離你的Tags描述的內(nèi)容差距越大,但是越符合邏輯,反之值越大越容易貼合你所描述的Tags但也容易出現(xiàn)崩壞問題;
Sampling Steps——采樣步驟,數(shù)字越大完成度越高,數(shù)字越小完成度越小,但是請注意,完成的步驟越多也意味著越容易出問題,不是越多越好;
Seed——可以簡單理解為特征碼,不同的特征碼決定圖片初始擴散的基礎(chǔ),隨機即可(但是改動這個數(shù)字會很大程度上改變生成的結(jié)果)
Width和height——圖片精度,數(shù)字越大需要占用的顯存越多,建議都設(shè)置在1000以內(nèi),如果都設(shè)置在1000以內(nèi)還是無法跑圖就繼續(xù)改小