結論
- 3つの神プロンプトはいずれも75トークン以内に収まる アブレーション検証で不要要素を削除し、夏祭り44トークン、朝ベッド54トークン、カフェ25トークンに削減
- 環境がシンプルで矛盾がないことが安定の鍵 要素が少ないほど破綻しにくく、照明や場所の記述が一貫していることが重要
- 手の対策が安定性に寄与する 綿菓子を持たせる、顎に手を置くなど、手の描写を安定させるテクニックが有効
- 不要な品質ワードは入れない
coherent anatomy、natural skin texture、8Kはz-image-turboでは効果なし - 前置きのスタイル指定が最も効果的
A Polaroid instant photo、An intimate close-up portraitのように先頭で写真スタイルを宣言すると構図・雰囲気が安定する
アブレーション検証で各要素の必要性を1つずつ検証し、不要な要素を削除した最小限版を掲載しています。9枚ずつ生成しても全枚が意図通り。
選定基準
- 初版のプロンプトで修正なしにそのまま意図通りの画像が出た
- 9枚生成して全枚が安定してゴール品質
- アブレーション検証で不要要素を削除済み
トークン数の数え方
この記事のトークン数はCLIPトークナイザ(openai/clip-vit-large-patch14)で実測した値です。語数とトークン数は一致しません。詳しくはプロンプトの基本法則 - トークンの数え方を参照。
神プロンプト1: 夏祭りポラロイド
意図: 夏祭りの提灯の下で浴衣の女性が綿菓子を持って笑っている、ポラロイド写真。
最小限版(44トークン・旧版から31トークン削減)
A Polaroid instant photo of a woman. 1girl, 20yo japanese woman, outdoor summer festival grounds at dusk, light blue yukata, cotton candy in hand, looking at camera, big smile.
最小限版 作例9枚
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
アブレーション検証で削除した要素
| 削除した要素 | 理由 |
|---|---|
paper lantern warm light | summer festivalの連想で提灯は自然に出現する(検証結果) |
food stalls blurred in background | summer festivalだけで屋台は出る |
Polaroid instant film look, slightly faded colors, soft vignette, warm nostalgic tint, fixed focus. | 前置きA Polaroid instant photoだけで十分 |
coherent anatomy. | z-image-turboでは効果なし |
75トークン → 44トークン(31トークン削減)。 ポラロイド枠・色褪せ・提灯・浴衣・綿菓子のすべてが維持されています。
旧版との比較(クリックで展開)
旧版(75トークン)
A Polaroid instant photo of a woman. 1girl, 20yo japanese woman, outdoor summer festival grounds at dusk, paper lantern warm light, food stalls blurred in background, light blue yukata, cotton candy in hand, looking at camera, big smile. Polaroid instant film look, slightly faded colors, soft vignette, warm nostalgic tint, fixed focus. coherent anatomy.
旧版の作例(参考):
![]() | ![]() | ![]() |
なぜ安定するのか
- 「A Polaroid instant photo」がCLIPに極めてよく効く — 学習データにポラロイド写真が大量に含まれているため、白枠・色褪せ・ビネットが丸ごと再現される
- 「夏祭り」の構成要素がシンプルで一意 —
paper lantern+yukata+duskで場面が確定。曖昧さがない cotton candy in handが手の安定化に寄与 — 何かを持たせると指の描写が安定する- 48トークンで75制限に余裕がある — 1チャンクに完全に収まり、全要素がフルに効く
神プロンプト2: 朝のベッドで親密ポートレート
意図: 白いシーツのベッドで横になり、カーテン越しの朝日に照らされた女性の親密な一枚。
最小限版(54トークン・旧版から31トークン削減)
An intimate close-up portrait of a woman. 1girl, 20yo japanese woman, in bed, white sheets rumpled, morning light through sheer curtains, oversized white shirt, lying on side, chin resting on hands, half-closed eyes, soft smile, warm ambient light.
最小限版 作例9枚
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
アブレーション検証で削除した要素
| 削除した要素 | 理由 |
|---|---|
intimate portrait quality, shallow depth of field, soft bokeh background, gentle lighting on face. | 前置きAn intimate close-up portraitの影響で浅いボケ・親密な品質は維持される(検証結果) |
coherent anatomy, natural skin texture. | z-image-turboでは効果なし |
85トークン → 54トークン(31トークン削減)。 後置きの品質指示を削除しても、前置きのAn intimate close-up portraitが構図・ボケ感・親密な雰囲気を十分に規定しています。75トークン以内に収まりました。
旧版との比較(クリックで展開)
旧版(85トークン)
An intimate close-up portrait of a woman. 1girl, 20yo japanese woman, in bed, white sheets rumpled, morning light through sheer curtains, oversized white shirt, lying on side, chin resting on hands, half-closed eyes, soft smile, warm ambient light. intimate portrait quality, shallow depth of field, soft bokeh background, gentle lighting on face. coherent anatomy, natural skin texture.
旧版の作例(参考):
![]() | ![]() | ![]() |
なぜ安定するのか
An intimate close-up portraitが構図と雰囲気を同時に決定 — 「クローズアップ」と「親密」を1フレーズで兼ねる効率的な指定- 環境がシンプルで矛盾が起きない —
in bed, white sheets, morning light through curtainsだけ chin resting on handsが手の破綻を防止 — 顎に手を置くポーズで手指の描写が安定half-closed eyesが表情をコントロール — 半開きの目で「寝起き」「まどろみ」の雰囲気が安定
神プロンプト3: カフェ窓際スナップ
意図: カフェの窓際で友達がぼーっとしている瞬間をスマホで撮った、素人っぽい自然な1枚。
最小限版(25トークン・旧版から大幅削減)
1girl, 22yo japanese actress, small cafe window seat, natural overcast daylight through glass, beige oversized knit sweater, sitting, looking out window, gentle natural expression.
最小限版 作例9枚
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
![]() | ![]() | ![]() |
アブレーション検証で削除した要素
| 削除した要素 | 理由 |
|---|---|
A candid iPhone snapshot of an actress in her everyday life.(冒頭文全体) | シーン描写タグが構図・雰囲気を十分に規定している(検証結果) |
The photo feels imperfect and unposed: ...(21語の長文) | 冒頭文と合わせて削除。シーン描写タグで十分 |
photorealistic, snapshot aesthetic. | z-image-turboはデフォルトで写実的(検証結果) |
natural skin texture, coherent anatomy. | z-image-turboでは効果なし |
83トークン → 25トークンに大幅削減。 冒頭の自然言語文、品質キーワード、不要な修飾をすべて削除。シーン描写タグだけで構図・ライティング・雰囲気が十分に再現されます。
旧版との比較(クリックで展開)
旧版(83トークン)
A candid iPhone snapshot of an actress in her everyday life. 1girl, 22yo japanese woman, small café window seat, natural overcast daylight through glass, beige oversized knit sweater, sitting, looking out window, gentle natural expression. The photo feels imperfect and unposed: slightly awkward crop, mild smartphone compression, no cinematic lighting or editorial polish. photorealistic, snapshot aesthetic, natural skin texture, coherent anatomy.
旧版の作例(参考):
![]() | ![]() | ![]() |
なぜ安定するのか
- シーン描写タグが具体的で一意 —
small cafe window seat+natural overcast daylight+beige oversized knit sweaterで場面が確定 looking out windowが視線をカメラから外す — キャンディッド(自然な瞬間)のニュアンスactressが顔の方向性を制御 — 華やかな顔立ちを誘導(検証結果)- 25トークンで75制限に大きな余裕 — 1チャンクに完全に収まり、全要素がフルに効く
神プロンプトの共通パターン
| 特徴 | 夏祭りポラロイド | 朝ベッド | カフェスナップ |
|---|---|---|---|
| CLIPトークン数 | 44 | 54 | 25 |
| 旧版からの削減 | -31トークン | -31トークン | 大幅削減 |
| 75トークン以内 | ◎ | ◎ | ◎ |
| 環境の複雑さ | 低い | 低い | 低い |
| 手の描写対策 | 綿菓子を持つ | 顎に手を置く | なし(手が見えない) |
| 矛盾する要素 | なし | なし | なし |
神プロンプトの5条件
- 環境がシンプル — 要素が少ないほど破綻しにくい
- 手の対策がある — 何かを持たせるか、手が見えないポーズ
- 矛盾する指示がない — 照明や場所の記述が一貫している
- 75トークン以内に収める — 1チャンクに収まれば全要素がフルに効く
- 不要な品質ワードを入れない —
coherent anatomy,natural skin texture,8Kは効果なし














































