如何用Stable Diffusion產圖?
開始生圖
既然下載完畢,就是時候開始產圖之旅了。在下載完畢後關閉並重啟Stable Diffusion的UI介面,你該可以見到在左上角的checkpoint
列表裏多了你剛才下載的AI模型(在這裏以Anything V5為例)。
之後要理解的就是咒文(Prompt)與負面咒文(Negative Prompt)的分別。
咒文 Prompt
咒文即是你希望在圖裏出現的要素,例如,一個穿著校服的女生,就可以寫︰
1girl, school uniform, short sleeves
寫得非常直白就可以,AI未必會明白有複合意思的咒文,例如夏天(summer),我們會知道夏天的人通常穿短袖,夏天也有夏天的校服款式,但AI未必可以拿捏到在中的深層意義。
為了方便AI理解,要把咒文寫得連3歲小孩子都看得懂。
與其寫上summer
,超直白地寫上︰
school uniform, short sleeves, skirt, navy collar
這樣AI會比較容易出到你心中的圖。
同理,咒文也可以用來加強圖像質素,像是最常用的咒文︰
masterpiece, top quality, best quality
只要加上這幾個咒文,生出來的圖像質素就會上升囉!
負面咒文 Negative Prompt
負面咒文即是你不想在AI圖裏出現的內容,例如你不知為何想畫一隻貓,但不是貓娘(AI通常會很親切地替你把貓變成一個可愛的貓狼),你可以在負面咒文裏加上︰
girl, human
就可以避免圖裏出現女孩與人類了。
與咒文同樣,負面咒文可以控制圖像的質素。什麼意思呢?即是你在負面咒文裏加上低質素等等的字眼,AI就會盡量給出高質素的圖。
例如把以下的放在負面咒文列︰
worst quality, low quality, blurry
就可以生出比較高質素的圖。
另外,AI最常會合到奇怪的手、有好多手指的手、奇怪形狀的手,把類似咒文放在負面咒文裏,希望可以減輕出怪手的機率。
bad hand, deformed fingers, bad fingers
強調咒文
在Stable Diffusion跟其他畫AI的工具一樣,可以叫AI強調或者忽視某句咒文。例如︰
(navy hair:1.3)
(smile:1.4)
上面那兩行就會有更大機會生出深藍頭髮與正在微笑的少女。
反之亦然,如果你想令AI別這麼在意某咒文,也可以減少在括號裏面的數字。
最有機會用到的就是,你要生出很微妙地複雜的表情,例如angry,這一咒文,根據不同AI模型有機會生出暴怒的女生,但你想要的不是暴怒,而是有少許生氣的傲嬌女孩……在這種情形就會大派用場。
(angry:0.7)
變成這樣後,生成的圖的生氣程度就會減少,是不是很有用呢?
綜合咒文
咒文也可以一次過分組,在咒文同等重要的場合很有用。例如︰
(navy hair, school uniform:1.4)
這樣可以省了打數個符號鍵(笑)。
產圖設定
說完咒文,終於到生圖的設定!
我由於懶得打字決定從簡,唯一要留意的是Sampling method
與Sampling steps
。
取樣方法(Sampling method)有很多種,我個人喜歡用Euler
或是DPM++ 2M Karras
,這兩種合成的速度比較快,就算取樣步驟(Sampling steps)比較低如20,也可以快速生到頗美的圖像。
取樣步驟(Sampling steps)愈多,生成的質素會愈精美,但去到某程度像是50就會對圖像結果沒太大影響。
Seed
則是合成出這張圖的關鍵數字。
如你合了一張很合心意的圖,只要你記得你的咒文,還有Seed的數字,就可以重新合回這張圖。同理,你亦可以用同樣的Seed,只是改動咒文,看看可不可以合到同樣的構圖,但不同的表情諸如此類。
另外可以實驗一下的就是CFG Scale
,CFG scale愈低就會愈由AI定奪根據咒文畫圖與否。
若CFG scale高的話,咒文的比重就會愈高,但也會更大機會生出奇奇怪怪的圖。個人選用的CFG scale值暫時也是在7-10之間。
合圖時間!
說明了這麼多,什麼圖也沒有就太乏味了,讓我即席嘗試生出一張圖。
(masterpiece, top quality, best quality:1.4), detailed face, (1girl:1.6), medium hair, (silver hair:1.3), school uniform, (long sleeves:1.4), (white background:1.4), (light particles:1.2), navy scarf, (smile:0.7), wind, oblique projection, from side, looking at viewer, flat color,
(worst quality, low quality, blurry:1.66), (bad hand:1.6), multiple limbs, (deformed fingers, bad fingers:1.2), (ugly:1.3), bad anatomy, bad limbs, (blurry pupil:1.4), (bad shading), alphabet, words, bad composition, nude,
AI模型是Anything V5,按下Generate的結果︰
Steps: 20, Sampler: Euler, CFG scale: 7, Seed: 3605957195, Size: 768x1152, Model hash: a1535d0a42, Model: AnythingV5Ink_ink, Version: v1.7.0
如何?滿意嗎?
以我的標準來說還可以,還有不少可以再改善的小地方。像是︰左上角的謎之物體,右下角的手,還有很 多奇怪的形狀,但怎樣再能叫AI再畫呢?看下一章。