何枚生成しても外さない「神プロンプト」3選|アブレーション検証済み最小限版

何枚生成しても外さない「神プロンプト」3選|アブレーション検証済み最小限版

結論

  • 3つの神プロンプトはいずれも75トークン以内に収まる アブレーション検証で不要要素を削除し、夏祭り44トークン、朝ベッド54トークン、カフェ25トークンに削減
  • 環境がシンプルで矛盾がないことが安定の鍵 要素が少ないほど破綻しにくく、照明や場所の記述が一貫していることが重要
  • 手の対策が安定性に寄与する 綿菓子を持たせる、顎に手を置くなど、手の描写を安定させるテクニックが有効
  • 不要な品質ワードは入れない coherent anatomynatural skin texture8Kはz-image-turboでは効果なし
  • 前置きのスタイル指定が最も効果的 A Polaroid instant photoAn intimate close-up portraitのように先頭で写真スタイルを宣言すると構図・雰囲気が安定する

アブレーション検証で各要素の必要性を1つずつ検証し、不要な要素を削除した最小限版を掲載しています。9枚ずつ生成しても全枚が意図通り。

選定基準

  • 初版のプロンプトで修正なしにそのまま意図通りの画像が出た
  • 9枚生成して全枚が安定してゴール品質
  • アブレーション検証で不要要素を削除済み

トークン数の数え方

この記事のトークン数はCLIPトークナイザ(openai/clip-vit-large-patch14)で実測した値です。語数とトークン数は一致しません。詳しくはプロンプトの基本法則 - トークンの数え方を参照。

神プロンプト1: 夏祭りポラロイド

意図: 夏祭りの提灯の下で浴衣の女性が綿菓子を持って笑っている、ポラロイド写真。

最小限版(44トークン・旧版から31トークン削減)
A Polaroid instant photo of a woman. 1girl, 20yo japanese woman, outdoor summer festival grounds at dusk, light blue yukata, cotton candy in hand, looking at camera, big smile.

最小限版 作例9枚

123
456
789

アブレーション検証で削除した要素

詳細な検証結果はこちら

削除した要素理由
paper lantern warm lightsummer festivalの連想で提灯は自然に出現する(検証結果
food stalls blurred in backgroundsummer festivalだけで屋台は出る
Polaroid instant film look, slightly faded colors, soft vignette, warm nostalgic tint, fixed focus.前置きA Polaroid instant photoだけで十分
coherent anatomy.z-image-turboでは効果なし

75トークン → 44トークン(31トークン削減)。 ポラロイド枠・色褪せ・提灯・浴衣・綿菓子のすべてが維持されています。

旧版との比較(クリックで展開)
旧版(75トークン)
A Polaroid instant photo of a woman. 1girl, 20yo japanese woman, outdoor summer festival grounds at dusk, paper lantern warm light, food stalls blurred in background, light blue yukata, cotton candy in hand, looking at camera, big smile. Polaroid instant film look, slightly faded colors, soft vignette, warm nostalgic tint, fixed focus. coherent anatomy.

旧版の作例(参考):

旧1旧2旧3

なぜ安定するのか

  1. 「A Polaroid instant photo」がCLIPに極めてよく効く — 学習データにポラロイド写真が大量に含まれているため、白枠・色褪せ・ビネットが丸ごと再現される
  2. 「夏祭り」の構成要素がシンプルで一意paper lantern + yukata + dusk で場面が確定。曖昧さがない
  3. cotton candy in handが手の安定化に寄与 — 何かを持たせると指の描写が安定する
  4. 48トークンで75制限に余裕がある — 1チャンクに完全に収まり、全要素がフルに効く

神プロンプト2: 朝のベッドで親密ポートレート

意図: 白いシーツのベッドで横になり、カーテン越しの朝日に照らされた女性の親密な一枚。

最小限版(54トークン・旧版から31トークン削減)
An intimate close-up portrait of a woman. 1girl, 20yo japanese woman, in bed, white sheets rumpled, morning light through sheer curtains, oversized white shirt, lying on side, chin resting on hands, half-closed eyes, soft smile, warm ambient light.

最小限版 作例9枚

123
456
789

アブレーション検証で削除した要素

削除した要素理由
intimate portrait quality, shallow depth of field, soft bokeh background, gentle lighting on face.前置きAn intimate close-up portraitの影響で浅いボケ・親密な品質は維持される(検証結果
coherent anatomy, natural skin texture.z-image-turboでは効果なし

85トークン → 54トークン(31トークン削減)。 後置きの品質指示を削除しても、前置きのAn intimate close-up portraitが構図・ボケ感・親密な雰囲気を十分に規定しています。75トークン以内に収まりました。

旧版との比較(クリックで展開)
旧版(85トークン)
An intimate close-up portrait of a woman. 1girl, 20yo japanese woman, in bed, white sheets rumpled, morning light through sheer curtains, oversized white shirt, lying on side, chin resting on hands, half-closed eyes, soft smile, warm ambient light. intimate portrait quality, shallow depth of field, soft bokeh background, gentle lighting on face. coherent anatomy, natural skin texture.

旧版の作例(参考):

旧1旧2旧3

なぜ安定するのか

  1. An intimate close-up portraitが構図と雰囲気を同時に決定 — 「クローズアップ」と「親密」を1フレーズで兼ねる効率的な指定
  2. 環境がシンプルで矛盾が起きないin bed, white sheets, morning light through curtains だけ
  3. chin resting on handsが手の破綻を防止 — 顎に手を置くポーズで手指の描写が安定
  4. half-closed eyesが表情をコントロール — 半開きの目で「寝起き」「まどろみ」の雰囲気が安定

神プロンプト3: カフェ窓際スナップ

意図: カフェの窓際で友達がぼーっとしている瞬間をスマホで撮った、素人っぽい自然な1枚。

最小限版(25トークン・旧版から大幅削減)
1girl, 22yo japanese actress, small cafe window seat, natural overcast daylight through glass, beige oversized knit sweater, sitting, looking out window, gentle natural expression.

最小限版 作例9枚

123
456
789

アブレーション検証で削除した要素

削除した要素理由
A candid iPhone snapshot of an actress in her everyday life.(冒頭文全体)シーン描写タグが構図・雰囲気を十分に規定している(検証結果
The photo feels imperfect and unposed: ...(21語の長文)冒頭文と合わせて削除。シーン描写タグで十分
photorealistic, snapshot aesthetic.z-image-turboはデフォルトで写実的(検証結果
natural skin texture, coherent anatomy.z-image-turboでは効果なし

83トークン → 25トークンに大幅削減。 冒頭の自然言語文、品質キーワード、不要な修飾をすべて削除。シーン描写タグだけで構図・ライティング・雰囲気が十分に再現されます。

旧版との比較(クリックで展開)
旧版(83トークン)
A candid iPhone snapshot of an actress in her everyday life. 1girl, 22yo japanese woman, small café window seat, natural overcast daylight through glass, beige oversized knit sweater, sitting, looking out window, gentle natural expression. The photo feels imperfect and unposed: slightly awkward crop, mild smartphone compression, no cinematic lighting or editorial polish. photorealistic, snapshot aesthetic, natural skin texture, coherent anatomy.

旧版の作例(参考):

旧1旧2旧3

なぜ安定するのか

  1. シーン描写タグが具体的で一意small cafe window seat + natural overcast daylight + beige oversized knit sweater で場面が確定
  2. looking out windowが視線をカメラから外す — キャンディッド(自然な瞬間)のニュアンス
  3. actressが顔の方向性を制御 — 華やかな顔立ちを誘導(検証結果
  4. 25トークンで75制限に大きな余裕 — 1チャンクに完全に収まり、全要素がフルに効く

神プロンプトの共通パターン

特徴夏祭りポラロイド朝ベッドカフェスナップ
CLIPトークン数445425
旧版からの削減-31トークン-31トークン大幅削減
75トークン以内
環境の複雑さ低い低い低い
手の描写対策綿菓子を持つ顎に手を置くなし(手が見えない)
矛盾する要素なしなしなし

神プロンプトの5条件

  1. 環境がシンプル — 要素が少ないほど破綻しにくい
  2. 手の対策がある — 何かを持たせるか、手が見えないポーズ
  3. 矛盾する指示がない — 照明や場所の記述が一貫している
  4. 75トークン以内に収める — 1チャンクに収まれば全要素がフルに効く
  5. 不要な品質ワードを入れないcoherent anatomy, natural skin texture, 8K効果なし

関連記事