AI - Stable diffusion - Quick Start

Quick Chat

  • ⚠️ 這是一篇新手導向的筆記,目的不在於精準解釋。
  • ⚠️ 環境配置請參考 AI - Stable diffusion - Environment
  • ⚠️ Checkpoint 一般會提供推薦的參數設置,建議依據模型的特性調整,以獲得最佳效果。

Resources

Checkpoint

決定生成圖片的基礎風格。

  • 寫實風格 (Photorealistic)
  • 動漫風 (Anime)
  • 油畫風格 (Painting)
  • 科幻賽博龐克 (Cyberpunk)
  • 像素風格 (Pixel Art)

LoRA

輕量化微調模型可額外載入來增強特定風格或角色。

  • 簡單的比喻來形容 LoRA 模型,那就是「濾鏡」

Embedding

增強對某些 Prompt 的理解。

VAE

提高圖片細節與顏色準確度。

  • 📝 部分 Checkpoints 會內建(Baked)VAE,如使用外部 VAE,請確認是否需要覆蓋內建版本。
  • ⚠️ 如果發現圖片的型都對,但只有顏色壞掉,通常都是 VAE 的問題。

Sampler + Schedule

Sampler 是從雜訊圖到成品的去噪算法

  • 快速收斂 – 能迅速找到解答,適合驗證創意和想法。
  • 高品質收斂 – 需較長時間,但能提供更精確結果。
  • 無固定收斂 – 無明確收斂條件,為創新提供更大空間。

Schedule 是從雜訊圖到成品的去噪程度

📝 常用組合

  • Euler A Automatic
  • DPM++ 2M Karras
  • DPM++ SDE Karras

Steps

從雜訊圖到成品的迭代次數

  • ⚠️ 步數過少可能導致產生的影像品質不佳。
  • ⚠️ 步數過多可能使影像產生過程變得冗長,但未必能提升品質。
  • 📝 建議從較低的步數開始,例如 15 或 20。

CFG Scale

遵循 Prompt 的程度。數值越大,產生的影像與文字提示的相關性越高。

  • ⚠️ 但當數值過大時可能會出現過度飽和或不自然的情況。
  • 📝 建議從較低的 CFG 比例值開始並增加它,直到對結果滿意為止。
  • 📝 沒有最佳值,要根據模型的不同來設定不同的值。
  • 📝 常用區間:3 ~ 7

Seed

用於生成雜訊圖。

  • ⚠️ 當圖片大小改變時所生成的雜訊圖也會有差異(即使比例一樣)。
  • 📝 使用相同的 Seed 可重現相同圖片(前提是設備/環境需一致)。
  • 📝 設為 -1 為隨機。
  • 📝 固定 Seed 進行實驗:在進行圖像生成時,建議固定一個 Seed,然後調整提示詞或其他參數,以便觀察這些變化對最終圖像的影響。

Clip Skip

調整生成圖像過程中對提示詞的處理方式。

  • 📝 現實系建議設為 1。
  • 📝 動畫風建議設為 2。

Prompt

  • 正向 Prompt:描述想要的畫面,例如 a beautiful girl, wearing kimono, sakura background

  • 負向 Prompt:描述不想要的內容,例如 blurry, low quality, deformed

  • BREAK:可用來分隔不同場景或主題。例如:a warrior in armor BREAK a futuristic cityscape

  • 數值控制權重:使用 (word:1.2) 來增加特定詞的影響力,數值越高影響越強。例如:(beautiful:1.5), (dark:0.8) 讓 “beautiful” 更突出,而 “dark” 影響較弱。

  • 從左到右的順序來解析提示詞,越前面的詞影響越大,越後面的詞影響越小。

  • 不同的 Checkpoints 對提示詞的理解會有所不同,選對模型才能產生最好的效果。

  • 提示詞應該從少量開始,逐步增加,這樣才能確保:

    • 確定哪些詞有效
    • 避免無效詞
    • 確保 Prompt 保持清晰,容易控制風格

Settings

  • Saving images > Saving images/grids
    • Images filename pattern : [datetime]-[seed]
    • Add number to filename when saving : 反選
    • 這樣避免整合圖片時發生亂序。

Extras