結論
- シンプルな1-2語でも表情変化は確実に起きる(pained expression, gritting teeth, tearful等)
- 詳細記述(H〜L)はシンプル表現より表情の強度・一貫性が高い
- 「biting lip」は痛みより色気のニュアンスが出やすい。痛みの文脈を出すには詳細記述(K)が必要
- 表情の段階: 穏やか(A) → 心配(B) → 歯食いしばり(C/H) → 泣き(G/J) → 絶叫(L)
- CFG=1.0でも重み付け構文が含まれる詳細記述で表情強度に差が出ている
この記事でわかること
- 痛み・苦悶系の表情プロンプトの有効性
- シンプルな表現(1-2語)と詳細な表現(多トークン)の差
- 各表現がどのような表情として出力されるか
- 微妙な表情のニュアンス差をプロンプトで制御できるか
実験条件
| 項目 | 値 |
|---|---|
| モデル | z-image-turbo(6B、写実特化蒸留モデル) |
| ステップ | 8 |
| サンプラー | euler |
| スケジューラー | ddim_uniform |
| CFG | 1.0 |
| 画像サイズ | 1024×1024 |
| Seed | 42, 123, 789 の3種類を固定使用 |
ベースプロンプト
表情の変化に注目するため、上半身(upper body)でソフトライティングに統一する。
実験1: シンプルな表情プロンプト(1-2語)
まず少ないトークンで表情がどこまで変わるか確認する。
条件A: ベースライン ── 表情指定なし

観察
穏やかな無表情〜微笑み。ソフトライティングのポートレート。
条件B: pained expression(2トークン)
「痛みの表情」という一般的な表現。

観察
眉をひそめ、口をわずかに開いた心配・苦悶の表情。ベースラインとの差が明確。
条件C: gritting teeth(2トークン)
歯を食いしばる表情。

観察
歯を食いしばった表情。口を閉じて力を入れている様子が描写される。
条件D: biting lip(2トークン)
唇を噛む表情。

観察
唇を噛む/指を唇に当てるポーズ。痛みよりも色気・不安のニュアンスが出る傾向。
条件E: wincing(1トークン)
顔をしかめる表情。瞬間的な痛みのリアクション。

観察
顔をしかめる瞬間的な反応。目をやや細め、眉間にシワが寄る。
条件F: grimacing(1トークン)
苦悶の表情。

観察
苦悶の表情。Eと比較して眉間のシワが深く、口角が下がり、表情筋全体の緊張が強い。
条件G: tearful expression(2トークン)
涙をこらえる表情。

観察
涙をこらえる表情。目に涙が浮かぶ描写。
実験2: 詳細な表情記述(多トークン)
多トークンの詳細な記述で痛み表情を表現した場合の効果を検証する。シンプル表現と比較して精度がどの程度向上するかが焦点。
条件H: 激痛耐え・歯軋りタイプ
口を横に大きく開き、上下の歯を見せて食いしばる表情。

観察
目を閉じ、歯を食いしばり、首の腱が張った激痛表情。シンプル表現(C: gritting teeth)より強度が高い。
条件I: 激痛耐え・凍りつきタイプ
目を見開いて凍りつく表情。

観察
目を見開き、口がわずかに開いた凍りつき表情。恐怖に近い表情。
条件J: 激痛耐え・号泣タイプ
泣きながら痛みに耐える表情。

観察
涙を流しながら口を開けて泣いている表情。顔の筋肉の緊張が描写。
条件K: 激痛耐え・堪え忍びタイプ
唇を噛んで静かに痛みに耐える表情。

観察
目を伏せ、唇を噛み、涙と汗が描写された堪え忍び表情。シンプルな「biting lip」(D)よりも明確に痛みの文脈。
ラボ長コメント: え、これめっちゃいい。目を伏せて唇噛んで涙と汗、静かに耐えてる感じがもう最高。シンプルなbiting lipだと色気に寄るのが、詳細記述でちゃんと「痛みに耐えてる」文脈になるのすごくない?
条件L: 絶叫激痛タイプ
目を見開いて叫ぶ極限の痛み表情。

観察
口を大きく開けて絶叫。顔全体に汗と涙、肌が紅潮。最も激しい表情。
横断比較
シンプル表現比較(ベースライン / pained / gritting / biting lip / wincing / grimacing / tearful)
| Seed | ベースライン (A) | pained (B) | gritting (C) | biting lip (D) | wincing (E) | grimacing (F) | tearful (G) |
|---|---|---|---|---|---|---|---|
| 42 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
| 123 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
| 789 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
1-2語でも表情変化は明確。biting lipのみ痛みより色気のニュアンスが出やすい。
シンプル vs 詳細記述比較
| Seed | gritting teeth (C) | 詳細・歯軋り (H) | biting lip (D) | 詳細・堪え忍び (K) | tearful (G) | 詳細・号泣 (J) |
|---|---|---|---|---|---|---|
| 42 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
| 123 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
| 789 | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
詳細記述はシンプル表現より表情の強度・一貫性が高い。
ラボ長コメント: えっと、1-2語のシンプル表現でも十分に表情は変わるけど、「痛みに耐える」みたいな微妙なニュアンスを出すなら詳細記述が必要ですね。条件Kの堪え忍びタイプが個人的にベストです。次はこの表情に拘束系の衣装とか組み合わせてみたいかなと。
知見まとめ
シンプル表現の有効性
- 1-2語でも表情変化は確実に起きる。pained expression, gritting teeth, tearful expression等はベースラインとの差が明確
- ただし表情の「強度」や「一貫性」は詳細記述に劣る
詳細記述の優位性
- 詳細記述(H〜L)はシンプル表現より表情の強度が高く、3枚間の一貫性も向上
- 重み付け構文(1.3〜1.6)がCFG=1.0環境でも表情の方向性に影響している
表現ごとの特性
- pained expression: 汎用的な苦悶表情。方向性が安定
- gritting teeth: 歯食いしばりに特化。口元の描写が明確
- biting lip: 痛みより色気・不安のニュアンスが出る。痛みの文脈が必要なら詳細記述(K)を使用
- wincing: 瞬間的な反応。目と眉間に集中
- grimacing: wincingより持続的な不快感
- tearful expression: 涙の描写に特化
表情の強度スケール
穏やか(A) → 心配・苦悶(B) → 歯食いしばり(C/H) → 顔しかめ(E/F) → 泣き(G/J) → 堪え忍び(K) → 絶叫(L)




