跳至主要内容

如何用Stable Diffusion產圖?

開始生圖

既然下載完畢,就是時候開始產圖之旅了。在下載完畢後關閉並重啟Stable Diffusion的UI介面,你該可以見到在左上角的checkpoint列表裏多了你剛才下載的AI模型(在這裏以Anything V5為例)。

之後要理解的就是咒文(Prompt)與負面咒文(Negative Prompt)的分別。

咒文 Prompt

咒文即是你希望在圖裏出現的要素,例如,一個穿著校服的女生,就可以寫︰

1girl, school uniform, short sleeves

寫得非常直白就可以,AI未必會明白有複合意思的咒文,例如夏天(summer),我們會知道夏天的人通常穿短袖,夏天也有夏天的校服款式,但AI未必可以拿捏到在中的深層意義。

為了方便AI理解,要把咒文寫得連3歲小孩子都看得懂。

與其寫上summer,超直白地寫上︰

school uniform, short sleeves, skirt, navy collar

這樣AI會比較容易出到你心中的圖。

同理,咒文也可以用來加強圖像質素,像是最常用的咒文︰

masterpiece, top quality, best quality

只要加上這幾個咒文,生出來的圖像質素就會上升囉!

負面咒文 Negative Prompt

負面咒文即是你不想在AI圖裏出現的內容,例如你不知為何想畫一隻貓,但不是貓娘(AI通常會很親切地替你把貓變成一個可愛的貓狼),你可以在負面咒文裏加上︰

girl, human

就可以避免圖裏出現女孩與人類了。

與咒文同樣,負面咒文可以控制圖像的質素。什麼意思呢?即是你在負面咒文裏加上低質素等等的字眼,AI就會盡量給出高質素的圖。

例如把以下的放在負面咒文列︰

worst quality, low quality, blurry

就可以生出比較高質素的圖。

另外,AI最常會合到奇怪的手、有好多手指的手、奇怪形狀的手,把類似咒文放在負面咒文裏,希望可以減輕出怪手的機率。

bad hand, deformed fingers, bad fingers

強調咒文

在Stable Diffusion跟其他畫AI的工具一樣,可以叫AI強調或者忽視某句咒文。例如︰

(navy hair:1.3)
(smile:1.4)

上面那兩行就會有更大機會生出深藍頭髮與正在微笑的少女。

反之亦然,如果你想令AI別這麼在意某咒文,也可以減少在括號裏面的數字。

最有機會用到的就是,你要生出很微妙地複雜的表情,例如angry,這一咒文,根據不同AI模型有機會生出暴怒的女生,但你想要的不是暴怒,而是有少許生氣的傲嬌女孩……在這種情形就會大派用場。

(angry:0.7)

變成這樣後,生成的圖的生氣程度就會減少,是不是很有用呢?

綜合咒文

咒文也可以一次過分組,在咒文同等重要的場合很有用。例如︰

(navy hair, school uniform:1.4)

這樣可以省了打數個符號鍵(笑)。

產圖設定

說完咒文,終於到生圖的設定!

我由於懶得打字決定從簡,唯一要留意的是Sampling methodSampling steps

取樣方法(Sampling method)有很多種,我個人喜歡用Euler或是DPM++ 2M Karras,這兩種合成的速度比較快,就算取樣步驟(Sampling steps)比較低如20,也可以快速生到頗美的圖像。

取樣步驟(Sampling steps)愈多,生成的質素會愈精美,但去到某程度像是50就會對圖像結果沒太大影響。

Seed則是合成出這張圖的關鍵數字。

如你合了一張很合心意的圖,只要你記得你的咒文,還有Seed的數字,就可以重新合回這張圖。同理,你亦可以用同樣的Seed,只是改動咒文,看看可不可以合到同樣的構圖,但不同的表情諸如此類。

另外可以實驗一下的就是CFG Scale,CFG scale愈低就會愈由AI定奪根據咒文畫圖與否。

若CFG scale高的話,咒文的比重就會愈高,但也會更大機會生出奇奇怪怪的圖。個人選用的CFG scale值暫時也是在7-10之間。

合圖時間!

說明了這麼多,什麼圖也沒有就太乏味了,讓我即席嘗試生出一張圖。

咒文
(masterpiece, top quality, best quality:1.4), detailed face, (1girl:1.6), medium hair, (silver hair:1.3), school uniform, (long sleeves:1.4), (white background:1.4), (light particles:1.2), navy scarf, (smile:0.7), wind, oblique projection, from side, looking at viewer, flat color, 
負面咒文
(worst quality, low quality, blurry:1.66), (bad hand:1.6), multiple limbs, (deformed fingers, bad fingers:1.2), (ugly:1.3), bad anatomy, bad limbs, (blurry pupil:1.4), (bad shading), alphabet, words, bad composition, nude,  

AI模型是Anything V5,按下Generate的結果︰

Steps: 20, Sampler: Euler, CFG scale: 7, Seed: 3605957195, Size: 768x1152, Model hash: a1535d0a42, Model: AnythingV5Ink_ink, Version: v1.7.0

如何?滿意嗎?

以我的標準來說還可以,還有不少可以再改善的小地方。像是︰左上角的謎之物體,右下角的手,還有很多奇怪的形狀,但怎樣再能叫AI再畫呢?看下一章。