ネガティブプロンプト解説|仕組みと注意点

ネガティブプロンプト解説|仕組みと注意点

z-image-turboユーザーへの重要な注意

z-image-turboではネガティブプロンプトは機能しません。

z-image-turboはCFG=1.0で動作する蒸留モデルです。ネガティブプロンプトはClassifier-Free Guidance(CFG > 1.0)の仕組みに依存しているため、CFG=1.0ではネガティブプロンプトに何を書いても画像に影響しません。

z-image-turboで画質を上げるには、ネガティブプロンプトではなく正のプロンプトの最適化が有効です。詳しくはプロンプトのベストプラクティスを参照してください。

以下の解説はCFG > 1.0で動作するモデル(Stable Diffusion標準モデル等)向けの一般知識として掲載しています。

ネガティブプロンプトの仕組み

Classifier-Free Guidanceの原理

ネガティブプロンプトはClassifier-Free Diffusion Guidanceの仕組みで動作します。

サンプリング(画像生成)の各ステップで、モデルは2つの予測を行います:

  1. 正のプロンプトに基づく予測(「こちらに近づけ」)
  2. ネガティブプロンプトに基づく予測(「こちらから離れろ」)

最終的なノイズ除去の方向は、この2つの差分をCFG値で増幅して決定されます:

最終方向 = ネガティブ予測 + CFG × (正の予測 − ネガティブ予測)

CFG=1.0の場合、この式はただの「正の予測」になり、ネガティブプロンプトの項が完全に消えます。 これがz-image-turboでネガティブプロンプトが機能しない理由です。

つまり

  • CFG > 1.0のモデル: ネガティブプロンプトは「反発」として機能する
  • CFG = 1.0のモデル(z-image-turbo等): ネガティブプロンプトは無視される

カテゴリ別 定番フレーズ集(CFG > 1.0のモデル向け)

以下はStable Diffusion標準モデルなど、CFG > 1.0で動作するモデルで使える定番フレーズです。

品質系

品質系ネガティブプロンプト
(worst quality, low quality:1.4), blurry, jpeg artifacts, noise, grainy
フレーズ効果
worst quality最低品質の画像を回避
low quality低品質全般を回避
blurryピントが合っていない画像を回避
jpeg artifactsJPEG圧縮によるブロックノイズを回避
noise, grainyノイズ・粒子感を回避

身体系(人物画像の場合)

身体系ネガティブプロンプト
deformed, bad anatomy, bad proportions, extra limbs, missing limbs, extra fingers, missing fingers, fused fingers, too many fingers, long neck, mutated hands
フレーズ効果
deformed全般的な形状崩れを回避
bad anatomy人体構造の誤りを回避
bad proportions体のバランス崩れを回避
extra limbs余分な手足を回避
extra/missing/fused fingers指の本数・結合異常を回避
mutated hands手の形状異常を回避

構図系

構図系ネガティブプロンプト
cropped, out of frame, cut off, bad framing, poorly framed

テキスト・透かし系

テキスト・透かし系ネガティブプロンプト
watermark, text, signature, username, logo, banner, caption

スタイル系(好みに応じて)

スタイル系ネガティブプロンプト(リアル系向け)
illustration, cartoon, anime, drawing, painting, 3d render, cgi

強調構文との組み合わせ(CFG > 1.0のモデル向け)

強調構文はネガティブプロンプトでも使えます。

強調構文を使ったネガティブプロンプト
(worst quality, low quality:1.4), (deformed, bad anatomy:1.3), blurry, extra limbs, missing fingers, watermark, text
  • 品質系は1.4: 最も効かせたい
  • 身体系は1.3: 次に重要
  • その他は1.0(デフォルト): 補助的

全てを強調すると相対的な差がなくなり、効果が薄れます。メリハリが大事です。

まとめ

モデルCFGネガティブプロンプト
z-image-turbo1.0機能しない → 正のプロンプトを最適化
Stable Diffusion標準モデル等7.0〜12.0有効。品質系+身体系を入れる

z-image-turboでの画質改善は、ネガティブプロンプトではなくプロンプトのベストプラクティスに従った正のプロンプトの最適化で行います。

関連記事