結論を先に
- 階段はポーズの「物理的な支え」として機能する。 ロケーション指定なしでは体の傾きが小〜中程度にとどまるが、階段指定を加えると後ろ傾きが明確に大きくなった(P1: 3/3、P2: 3/3)
leaning back, gazing upward dreamilyは自然な傾きを生む。 夢見がちな雰囲気と穏やかな後ろ傾きが両立し、3/3で視線が上を向いたarched back, looking up, head tilted backはより劇的な反りを生む。 首と鎖骨のラインが強調され、3/3で頭が大きく後ろに傾いた- 簡潔な
concrete outdoor stairsと詳細なold school building ... weathered surfaceでポーズ再現率に差はない。 違いは建築的ディテール(風化した表面、手すり、建物の壁)の有無 - ロケーション指定なしではポーズ指定なし(P0)との差が小さくなる傾向がある。 「何に寄りかかるか」の文脈がないと、モデルはデフォルトの座りポーズに引っ張られやすい
実験設計
「後ろに傾いて上を見上げる」ポーズと屋外階段ロケーションの2軸をマトリックスで交差させ、それぞれの独立効果と相互作用を観察する。
モデル・パラメータ
| 項目 | 値 |
|---|---|
| モデル | z-image-turbo |
| ステップ | 8 |
| CFG | 1.0 |
| 画像サイズ | 1024×1024 |
| Seed | 42, 123, 789 の3種類を固定使用 |
ベースプロンプト
{POSE} と {LOCATION} を条件ごとに差し替える。
ポーズ軸
| ID | 条件名 | プロンプト差分 |
|---|---|---|
| P0 | コントロール(座り) | sitting |
| P1 | 後ろ傾き+見上げ | sitting, leaning back, gazing upward dreamily |
| P2 | アーチバック強調 | sitting, arched back, looking up, head tilted back |
ロケーション軸
| ID | 条件名 | プロンプト差分 |
|---|---|---|
| L0 | コントロール(指定なし) | (削除) |
| L1 | 簡潔な階段指定 | concrete outdoor stairs |
| L2 | 詳細な階段指定 | old school building concrete outdoor stairs, weathered surface |
合計画像数
3ポーズ × 3ロケーション × 3seed = 27枚
ポーズ別の結果
P0: コントロール(sitting)
ポーズ指定は sitting のみ。ロケーションの違いが座りポーズにどう影響するかを観察する。
P0 × L0: ロケーション指定なし
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも座りポーズで姿勢は直立。背景はs1が窓際、s2がコンクリート壁、s3もコンクリート壁と、ロケーション指定がないため背景にばらつきがある。視線は下向き〜正面で、上を見上げる動作は見られない。
P0 × L1: concrete outdoor stairs
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3でコンクリート階段が出現し、被写体は階段に座っている。姿勢はP0L0と同様に直立〜やや前傾。ロケーション指定が「座る場所」を提供する形で機能しているが、ポーズ自体には大きな変化がない。
P0 × L2: old school building concrete outdoor stairs
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3で古い建物の石造り階段が出現。L1との違いは手すりや建物の壁面が背景に映り込む点と、表面の風化した質感。ポーズはL1とほぼ同じで直立した座り。weathered surfaceによるヴィンテージ感は確認できる。
P1: 後ろ傾き+見上げ(leaning back, gazing upward dreamily)
P1 × L0: ロケーション指定なし
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3で視線が上を向いている。P0と比較して明確な違いが出た。ただし体の傾きは小〜中程度で、「壁に寄りかかっている」構図が多い。gazing upward dreamilyは視線方向に強く作用している。
P1 × L1: concrete outdoor stairs
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3で階段+見上げポーズが再現。P1L0と比較して体の傾きが大きくなっている。階段の段差が「後ろに寄りかかれる面」を提供し、leaning backが自然に強調される結果になった。手を段差に置いて体を支えるポーズが出ている。
ラボ長コメント: 階段がポーズの「物理的な根拠」になるの、面白い。プロンプトに「何に寄りかかるか」を書かなくても、ロケーションが勝手に補完してくれてる。
P1 × L2: old school building concrete outdoor stairs
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3で古い建物の階段+見上げポーズ。ポーズの再現度はL1とほぼ同等。違いは建築的ディテール(風化した表面、手すり、建物の壁面)の追加で、雰囲気面での情報量が多い。s1は特に体の傾きが大きく、元プロンプトの意図に最も近い結果が得られた。
P2: アーチバック強調(arched back, looking up, head tilted back)
P2 × L0: ロケーション指定なし
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3で強い上向き視線。P1L0より頭の傾きが明確に大きく、首のラインが強調されている。head tilted backの効果が顕著。ただし背景がs1は地面、s2は芝生、s3はベンチとばらつきが大きく、ロケーション指定なしの不安定さが目立つ。
P2 × L1: concrete outdoor stairs
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3で階段+強い後ろ傾き。P2L0と比較して体の傾きがより安定して大きい。階段の傾斜が体の反りを物理的に支え、P1L1よりもさらに劇的な構図が出ている。
P2 × L2: old school building concrete outdoor stairs
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3/3で最も劇的な結果。頭を大きく後ろに傾け、首と鎖骨のラインが最大限に強調されている。古い建物の階段が「後ろに寄りかかれる広い面」として機能し、体の反りが全条件中最大。s2は特に首の角度が大きく、写真的なインパクトがある。
ラボ長コメント: P2L2のs2、首の角度すごい。ここまで反ると
arched backがちゃんと効いてるのわかるし、古い校舎の階段とオフショルダーの組み合わせ、なんかエモい。
相互作用まとめ
ポーズ再現度マトリックス
以下はポーズ(後ろ傾き+見上げ)の再現度を条件ごとに評価した表。
| L0(指定なし) | L1(concrete stairs) | L2(old school stairs) | |
|---|---|---|---|
| P0(sitting) | △ 直立座り | △ 直立座り | △ 直立座り |
| P1(leaning back, dreamily) | ○ 視線は上。傾き小〜中 | ◎ 視線上+傾き大 | ◎ 視線上+傾き大 |
| P2(arched back, head tilted) | ○ 強い見上げ。背景不安定 | ◎ 強い反り+階段 | ◎ 最大の反り+雰囲気 |
発見した相互作用
1. 階段がポーズの「物理的な支え」を提供する
ロケーション指定なし(L0)では、leaning backに対してモデルは壁や地面を自動選択する。階段を指定すると、段差が「寄りかかる面」として一貫して機能し、体の傾きが大きくなった。これはポーズプロンプトとロケーションプロンプトの正の相互作用と言える。
2. ポーズ指定がないと階段の効果は座り位置の固定にとどまる
P0(sittingのみ)では、L0→L1→L2とロケーションを追加しても姿勢は直立のまま変わらなかった。階段がポーズを「誘発」するわけではなく、既存のポーズ指定を「増幅」する関係。
3. L1(簡潔)とL2(詳細)でポーズ再現率に差はない
L1のconcrete outdoor stairs(3トークン)とL2のold school building concrete outdoor stairs, weathered surface(8トークン)で、ポーズの傾き・視線方向に目立った差は見られなかった。L2の追加5トークンは建築的ディテール(風化、手すり、建物壁面)に作用し、雰囲気の質を上げるが、ポーズには影響しない。
実用上のポイント
推奨プロンプト
「後ろに傾いて上を見上げる」構図を再現するための推奨:
使い分けの目安
- 自然な雰囲気重視 → P1(
leaning back, gazing upward dreamily)+ L1(concrete outdoor stairs)。トークン効率も良い - 劇的な構図重視 → P2(
arched back, looking up, head tilted back)+ L2(old school building ... weathered surface)。首・鎖骨のラインが最大限に強調される - ロケーション指定は必ず入れる → 「何に寄りかかるか」の文脈がないと、後ろ傾きの再現度が下がる
ラボ長コメント: 「後ろに傾いて見上げる」って、プロンプトだけじゃなくて「傾ける場所」もセットで指定するのが正解。階段、ベンチ、壁、何でもいいけど、物理的な根拠があるとモデルの出力が安定する。





























