如何用Stable Diffusion產圖？

開始生圖

既然下載完畢，就是時候開始產圖之旅了。在下載完畢後關閉並重啟Stable Diffusion的UI介面，你該可以見到在左上角的checkpoint列表裏多了你剛才下載的AI模型(在這裏以Anything V5為例)。

之後要理解的就是咒文(Prompt)與負面咒文(Negative Prompt)的分別。

咒文 Prompt

咒文即是你希望在圖裏出現的要素，例如，一個穿著校服的女生，就可以寫︰

1girl, school uniform, short sleeves

寫得非常直白就可以，AI未必會明白有複合意思的咒文，例如夏天(summer)，我們會知道夏天的人通常穿短袖，夏天也有夏天的校服款式，但AI未必可以拿捏到在中的深層意義。

為了方便AI理解，要把咒文寫得連3歲小孩子都看得懂。

與其寫上summer，超直白地寫上︰

school uniform, short sleeves, skirt, navy collar

這樣AI會比較容易出到你心中的圖。

同理，咒文也可以用來加強圖像質素，像是最常用的咒文︰

masterpiece, top quality, best quality

只要加上這幾個咒文，生出來的圖像質素就會上升囉！

負面咒文 Negative Prompt

負面咒文即是你不想在AI圖裏出現的內容，例如你不知為何想畫一隻貓，但不是貓娘(AI通常會很親切地替你把貓變成一個可愛的貓狼)，你可以在負面咒文裏加上︰

girl, human

就可以避免圖裏出現女孩與人類了。

與咒文同樣，負面咒文可以控制圖像的質素。什麼意思呢？即是你在負面咒文裏加上低質素等等的字眼，AI就會盡量給出高質素的圖。

例如把以下的放在負面咒文列︰

worst quality, low quality, blurry

就可以生出比較高質素的圖。

另外，AI最常會合到奇怪的手、有好多手指的手、奇怪形狀的手，把類似咒文放在負面咒文裏，希望可以減輕出怪手的機率。

bad hand, deformed fingers, bad fingers

強調咒文

在Stable Diffusion跟其他畫AI的工具一樣，可以叫AI強調或者忽視某句咒文。例如︰

(navy hair:1.3)
(smile:1.4)

上面那兩行就會有更大機會生出深藍頭髮與正在微笑的少女。

反之亦然，如果你想令AI別這麼在意某咒文，也可以減少在括號裏面的數字。

最有機會用到的就是，你要生出很微妙地複雜的表情，例如angry，這一咒文，根據不同AI模型有機會生出暴怒的女生，但你想要的不是暴怒，而是有少許生氣的傲嬌女孩……在這種情形就會大派用場。

(angry:0.7)

變成這樣後，生成的圖的生氣程度就會減少，是不是很有用呢？

綜合咒文

咒文也可以一次過分組，在咒文同等重要的場合很有用。例如︰

(navy hair, school uniform:1.4)

這樣可以省了打數個符號鍵(笑)。

產圖設定

說完咒文，終於到生圖的設定！

我由於懶得打字決定從簡，唯一要留意的是Sampling method與Sampling steps。

取樣方法(Sampling method)有很多種，我個人喜歡用Euler或是DPM++ 2M Karras，這兩種合成的速度比較快，就算取樣步驟(Sampling steps)比較低如20，也可以快速生到頗美的圖像。

取樣步驟(Sampling steps)愈多，生成的質素會愈精美，但去到某程度像是50就會對圖像結果沒太大影響。

Seed則是合成出這張圖的關鍵數字。

如你合了一張很合心意的圖，只要你記得你的咒文，還有Seed的數字，就可以重新合回這張圖。同理，你亦可以用同樣的Seed，只是改動咒文，看看可不可以合到同樣的構圖，但不同的表情諸如此類。

另外可以實驗一下的就是CFG Scale，CFG scale愈低就會愈由AI定奪根據咒文畫圖與否。

若CFG scale高的話，咒文的比重就會愈高，但也會更大機會生出奇奇怪怪的圖。個人選用的CFG scale值暫時也是在7-10之間。

合圖時間！

說明了這麼多，什麼圖也沒有就太乏味了，讓我即席嘗試生出一張圖。

咒文

(masterpiece, top quality, best quality:1.4), detailed face, (1girl:1.6), medium hair, (silver hair:1.3), school uniform, (long sleeves:1.4), (white background:1.4), (light particles:1.2), navy scarf, (smile:0.7), wind, oblique projection, from side, looking at viewer, flat color,

負面咒文

(worst quality, low quality, blurry:1.66), (bad hand:1.6), multiple limbs, (deformed fingers, bad fingers:1.2), (ugly:1.3), bad anatomy, bad limbs, (blurry pupil:1.4), (bad shading), alphabet, words, bad composition, nude,

AI模型是Anything V5，按下Generate的結果︰

Steps: 20, Sampler: Euler, CFG scale: 7, Seed: 3605957195, Size: 768x1152, Model hash: a1535d0a42, Model: AnythingV5Ink_ink, Version: v1.7.0

如何？滿意嗎？

以我的標準來說還可以，還有不少可以再改善的小地方。像是︰左上角的謎之物體，右下角的手，還有很多奇怪的形狀，但怎樣再能叫AI再畫呢？看下一章。

開始生圖​

咒文 Prompt​

負面咒文 Negative Prompt​

強調咒文​

綜合咒文​

產圖設定​

合圖時間！​