【実験】動的ポーズ比較検証 ── 走る・ジャンプ・振り向きはどこまで破綻せず出せるか?

【実験】動的ポーズ比較検証 ── 走る・ジャンプ・振り向きはどこまで破綻せず出せるか?

結論を先に

  • 静的ポーズ(standing, crouching, walking)は3枚中3枚で破綻なし。安定して意図通りの姿勢が得られた
  • 動的ポーズ(running, jumping)ではジャンプに破綻が出やすい。jumpingは3枚中2枚で足の形状異常または靴の消失が発生した。runningは3枚中3枚で破綻なし
  • 振り向き(looking back over shoulder)は再現度が高く、破綻も確認されなかった
  • 髪かきあげ(running hand through hair)は再現度がやや低い。3枚中2枚で「走りながら髪を押さえる」構図になり、静止した髪かきあげにはならなかった
  • 動的ポーズでは服装がプロンプト指定(tank top, shorts)からランニングウェア風に変化する傾向がある
  • 【深掘り】jumpingの破綻はワーディング変更で回避可能。「leaping」「hopping on one foot」「jumping rope」ではいずれも手足の破綻が発生しなかった。特にleapingはjumpingの実質的な上位互換として推奨できる

この記事でわかること

  • 静的ポーズと動的ポーズで画像の破綻率に差があるか
  • 走る・ジャンプなど激しい動きのプロンプトがどの程度再現されるか
  • 手足の形状異常・不自然な姿勢がどの条件で起きやすいか
  • ポーズの種類ごとの安定性の違い

実験条件

項目
モデルz-image-turbo(6B、写実特化蒸留モデル)
ステップ8
CFG1.0
画像サイズ1024×1024
Seed42, 123, 789 の3種類を固定使用
変更する変数ポーズ / 動きの記述のみ(1変数)

ベースプロンプト

ベースプロンプト
1girl, 32yo japanese actress, {POSE}, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic

{POSE} 部分のみを条件ごとに差し替える。服装・場所・画角はすべて固定。

評価基準

  • ポーズの再現度: 指定した動きが意図通りに描写されているか
  • 手足の破綻: 指の本数異常、関節の不自然な曲がり、手足の融合
  • 姿勢の自然さ: 重心・バランスが物理的に不自然でないか
  • 全体の画質: ポーズ以外の要素(顔・背景・服装)に悪影響がないか

各条件の結果

A00: コントロール ── standing

静止した立ちポーズをベースラインとする。

A00: コントロール
1girl, 32yo japanese actress, standing, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
standingstandingstanding

観察

3枚とも公園の緑地で正面を向いた直立姿勢。両足が揃い、腕は体の横に自然に下ろされている。全身が写っており、指の本数異常や関節の破綻は3枚とも確認されなかった。seed=42では足元がやや不明瞭だが、形状異常ではない。3枚中3枚で「静止した立ちポーズ」が再現されており、コントロールとして機能している。

A01: 走る ── running

A01: running
1girl, 32yo japanese actress, running, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
runningrunningrunning

観察

3枚とも横向きの走行ポーズで、腕を前後に振り、足が前後に大きく開いた姿勢。髪が後方になびいており、動きの表現がある。3枚中3枚で手足の破綻は確認されなかった。関節の曲がりも自然で、重心バランスに不自然さはない。

ただし、服装がプロンプト指定の「tank top, shorts」からランニングウェア風(スポーツタンクトップ+ランニングショーツ)に変化している。3枚中3枚で同傾向が見られ、「running」というポーズ指定が服装にも影響を与えている。

A02: ジャンプ ── jumping in the air

A02: jumping in the air
1girl, 32yo japanese actress, jumping in the air, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
jumpingjumpingjumping

観察

3枚とも空中に浮いたジャンプポーズで、両腕を上方または左右に広げた構図。ジャンプの意図は3枚中3枚で再現されている。

しかし、破綻が目立つ条件でもある。seed=42では片足が不自然に大きく折れ曲がっており、膝関節の角度が物理的にありえない方向に曲がっている。seed=789では足が裸足に見え、靴が消失している。seed=123は比較的自然な姿勢で、明確な破綻は確認されなかった。3枚中2枚で何らかの形状異常が発生しており、今回の7条件中で最も破綻率が高い。

A03: 振り向き ── looking back over shoulder

A03: looking back over shoulder
1girl, 32yo japanese actress, looking back over shoulder, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
looking backlooking backlooking back

観察

3枚とも背中をカメラに向け、肩越しに振り返る構図。「looking back over shoulder」の意図が3枚中3枚で正確に再現されている。上半身のひねりも自然で、手足の破綻は確認されなかった。

seed=42は背中側からの構図で顔が肩越しに見える。seed=123は体の側面がやや見える角度で振り向いている。seed=789は足元が裸足に見えるが、ポーズ自体の破綻ではない。全体的に再現度が高く、安定した条件と言える。

A04: 髪をかきあげる ── running hand through hair

A04: running hand through hair
1girl, 32yo japanese actress, running hand through hair, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
hand through hairhand through hairhand through hair

観察

3枚とも片手を頭付近に上げた姿勢だが、「静止して髪をかきあげる」動作ではなく、走行中に髪を押さえているような構図になった。seed=42とseed=123は歩行または走行中の姿勢で、「running hand through hair」の"running"が走行動作として解釈された可能性がある。seed=789はより明確に走行ポーズに近い。

3枚中3枚で手指の破綻は確認されなかった。手が頭付近にある構図でも指の形状異常は発生していない。ただし、意図した「静止した髪かきあげ」の再現度は低く、3枚中2枚以上が移動中の姿勢になっている。

ラボ長コメント: “running hand through hair” の “running” が走行として解釈されてるっぽくない? “brushing hair back with hand” とかに変えたら静止で出そうだし。指が破綻しなかったのは意外だったけど。

A05: しゃがむ ── crouching

A05: crouching
1girl, 32yo japanese actress, crouching, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
crouchingcrouchingcrouching

観察

3枚ともしゃがみポーズが再現されている。膝を曲げて低い姿勢をとっており、「crouching」の意図が3枚中3枚で反映された。手足の破綻は確認されなかった。

seed=42では上半身がやや大きくフレーミングされており、足先がフレーム外に近い。seed=123は正面からのしゃがみ姿勢で全身が収まっている。seed=789は低い位置からのアングルで、足元が裸足に見える。全体的に安定した条件で、ポーズの再現度・破綻の少なさともに良好。

A06: 歩く ── walking towards camera

A06: walking towards camera
1girl, 32yo japanese actress, walking towards camera, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
walkingwalkingwalking

観察

3枚ともカメラに向かって歩いている構図。片足を前に出し、重心が移動中の姿勢が表現されている。3枚中3枚で手足の破綻は確認されなかった。

standingとの差はやや小さいが、standing条件では両足が揃った静止姿勢であるのに対し、walking条件では片足が前に出て歩幅が見られる点で区別できる。服装はプロンプト指定通りのタンクトップ+ショートパンツが維持されており、running条件のような服装の変化は見られなかった。

条件横断比較(同一seed)

seed=42で全7条件を横並びで比較する。

条件seed=42
A00: standingstanding
A01: runningrunning
A02: jumpingjumping
A03: looking backlooking back
A04: hand through hairhand through hair
A05: crouchingcrouching
A06: walkingwalking

まとめ

破綻率の比較

条件ポーズ再現度手足の破綻服装の変化
A00: standing3/30/3なし
A01: running3/30/3あり(3/3)
A02: jumping3/32/3なし
A03: looking back3/30/3なし
A04: hand through hair1/30/3なし
A05: crouching3/30/3なし
A06: walking3/30/3なし

主な知見

  1. 動的ポーズで最も破綻しやすいのはjumping。空中で全身のバランスを決定する必要があるためか、3枚中2枚で足の形状異常や靴の消失が発生した。running(走り)では3枚中3枚とも破綻がなく、動的ポーズの中でも差がある
  2. 静的ポーズ(standing, crouching, walking)は安定。3条件9枚すべてで手足の破綻は確認されなかった
  3. 振り向き(looking back over shoulder)は再現度・安定性ともに良好。背中を向けて肩越しに振り返るという複合的な姿勢が3枚中3枚で正確に再現された
  4. 「running hand through hair」は走行動作に引っ張られる。“running"という単語が走行ポーズとして解釈され、静止した髪かきあげの再現度は3枚中1枚程度。別の表現(例: “brushing hair back with hand”)を検討する余地がある
  5. 動的ポーズでは服装がプロンプト指定から逸脱しやすい。running条件では3枚中3枚でランニングウェア風に変化した。ポーズの意味が服装にも影響を与えている
  6. 手が顔付近に来る条件(hair)でも指の破綻は確認されなかった。hand through hair条件では3枚中3枚で指の形状異常がなく、手の位置が顔に近いこと自体は破綻の直接的な原因にはならなかった

深掘り検証: ジャンプ表現のワーディング比較

第1段階の検証で「jumping in the air」は3枚中2枚で手足の破綻が発生し、7条件中で最も破綻率が高かった。この結果を受け、ジャンプ系の表現を変えることで破綻を回避できるか追加検証を行った。

追加実験の条件

ベースプロンプトとseed(42, 123, 789)は第1段階と同一。ポーズ部分のみ以下の4条件に差し替えた。

条件IDポーズ記述意図
D00leaping跳躍(ジャンプの言い換え)
D01hopping on one foot片足ジャンプ
D02mid-air, both feet off ground空中状態を直接指定
D03jumping rope縄跳び(道具を伴うジャンプ)

D00: leaping(跳躍)

D00: leaping
1girl, 32yo japanese actress, leaping, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
leapingleapingleaping

観察

3枚とも空中で大きく手足を広げた跳躍ポーズ。第1段階のjumping条件(A02)と同様に空中姿勢だが、腕を上方に伸ばしたダイナミックな構図が多い。3枚中3枚で関節の不自然な曲がりや手足の形状異常は確認されなかった。seed=123で裸足に見えるが、形状異常ではない。A02(jumping)で発生した膝関節の破綻や靴の消失は、leapingでは3枚中0枚だった。

D01: hopping on one foot(片足ジャンプ)

D01: hopping on one foot
1girl, 32yo japanese actress, hopping on one foot, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
hopping on one foothopping on one foothopping on one foot

観察

3枚とも片足を上げ、もう片足で跳ねている姿勢。「片足ジャンプ」の意図が3枚中3枚で再現されている。片足が膝を曲げて持ち上がっており、ポーズの特徴が明確に出ている。3枚中3枚で手足の破綻は確認されなかった。裸足傾向は見られるが、形状異常ではない。片足接地のため重心が安定しやすいのか、jumpingより破綻が少ない結果となった。

D02: mid-air, both feet off ground(空中)

D02: mid-air, both feet off ground
1girl, 32yo japanese actress, mid-air, both feet off ground, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
mid-airmid-airmid-air

観察

3枚とも空中に浮いた構図だが、跳躍の勢いに差がある。seed=42は地面に近く浮遊感が弱い。seed=123は両足を左右に開いた空中姿勢。seed=789は大きく跳躍して腕を広げたダイナミックな構図。seed=42で足先の描写がやや曖昧だが、明確な形状異常とは断定できない。3枚中0〜1枚で軽微な異常の可能性があり、A02(jumping)の2/3よりは改善しているが、完全に安定とも言い切れない結果だった。

D03: jumping rope(縄跳び)

D03: jumping rope
1girl, 32yo japanese actress, jumping rope, outdoor park, green trees, sunny day, tank top, shorts, full body, photorealistic
seed=42seed=123seed=789
jumping ropejumping ropejumping rope

観察

3枚とも両手に縄を持ち、軽く空中に浮いた縄跳びの構図。「jumping rope」の意図が3枚中3枚で正確に再現された。縄の描写も確認でき、道具を含むポーズとして成立している。3枚中3枚で手足の破綻は確認されなかった。靴(スニーカー)も3枚中3枚で維持されており、A02(jumping)で見られた靴の消失は発生しなかった。跳躍の高さが控えめで、両足が揃った姿勢であることが安定性に寄与している可能性がある。

深掘り条件の横断比較(seed=42)

条件seed=42
A02: jumping in the air(第1段階)jumping
D00: leapingleaping
D01: hopping on one foothopping on one foot
D02: mid-air, both feet off groundmid-air
D03: jumping ropejumping rope

深掘り検証のまとめ

条件ポーズ再現度手足の破綻靴の維持
A02: jumping in the air(第1段階)3/32/31/3
D00: leaping3/30/32/3
D01: hopping on one foot3/30/31/3
D02: mid-air, both feet off ground3/30〜1/31/3
D03: jumping rope3/30/33/3

知見

  1. 「jumping in the air」の破綻はワーディング変更で回避可能。leaping、hopping on one foot、jumping ropeの3条件では3枚中0枚で手足の破綻が発生しなかった
  2. 「jumping rope」が最も安定。破綻なし・靴の維持・ポーズ再現度いずれも良好。道具(縄)を指定することで姿勢が制約され、結果として安定した出力になっている
  3. 「leaping」はjumpingの実質的な上位互換。同じ跳躍でも破綻率が大幅に低下した。ジャンプ系のポーズにはleapingを第一候補として推奨できる
  4. 「mid-air」は浮遊感の強さにばらつきがある。ポーズの動作ではなく状態を指定しているためか、跳躍の勢いがseedごとに大きく異なった
  5. 裸足傾向はジャンプ系全般に共通。D00〜D02の3条件で裸足に見える画像が複数確認された。jumping ropeのみ靴が安定して維持された

ラボ長コメント: えっと、leaping が3/3で破綻なしなの、jumping とほぼ同じ意味なのに出力がここまで変わるのは正直びっくりしました。jumping rope も3/3安定してるのは、手に縄を持ってることが姿勢のアンカーになってるのかなと。ジャンプ系は leaping を第一候補にしてよさそうですね。

関連記事