【実験】巨人・巨大化を出すプロンプト|15条件・45枚で検証

【実験】巨人・巨大化を出すプロンプト|15条件・45枚で検証

結論を先に

  • controlでは通常サイズの女性が都市の街路に立つ写真が生成され、巨大化の要素はない
  • giant は都市上空に女性が立つ構図になるが、スケール感にばらつきがある。ビルの高さと同程度か少し大きい程度
  • giantess はgiantと同様に都市上空の構図が出る。巨大化の度合いはgiantとほぼ同等で、明確な差がない
  • colossal は都市の俯瞰背景に女性が立つ構図。ツインタワー級の高層ビルと同程度の身長で描画される場合がある
  • kaiju scale は最も特徴的で、3枚全てに怪獣(ゴジラ風の造形)が女性の背後に出現する。都市はミニチュア模型のように描写され、スケール感が最も大きい
  • towering はビル群の中に女性が立つ構図で、ビルの高さと同等かやや上回る程度。giantとの差がない
  • looking down は都市を俯瞰する巨大女性の構図が出るが、見下ろすポーズの変化にとどまり、スケール感に大きな差はない
  • holding building は建物の屋上付近に立ち、片手を差し出すポーズが出る。ただし実際に建物を掴んでいる描写は1枚(s1)のみで、残りは手のひらを差し出すポーズにとどまる
  • tiny people は通常サイズの女性の周囲にミニチュアの人物が配置され、相対的に巨大に見える構図。都市背景は出ず、台座や計測器のような小道具が出現する
  • 【実験2】ミニチュア撮影テクニックの応用が最も効果的。ローアングル・マクロ被写界深度・逆光・空背景をプロンプトに組み込むことで、巨大化の安定性(全条件3/3)とミニチュア都市のスケール感が大幅に向上した
  • 特に macro photography, shallow depth of field, tilt-shift の組み合わせがジオラマ風ミニチュア感を最も強く引き出す
  • backlit silhouette, rim light は神々しい巨大感を演出し、視覚的インパクトが最も強い

実験設計

項目
モデルz-image-turbo(6B、写実特化蒸留)
ステップ8
サンプラーeuler
スケジューラーddim_uniform
CFG1.0
サイズ1024x1024
seed3つ固定(全条件共通)
各条件3枚(3seed)
合計9条件 = 27枚

ベースプロンプト

ベースプロンプト
1girl, 32yo japanese actress, white dress, full body, {VARIABLE}

建物との比較でスケール感を判定するため、都市環境を基本設定とした。

A00: control

seed 1seed 2seed 3
control s1control s2control s3

観察: 3枚とも都市の歩道に立つ通常サイズの女性。背景に車、通行人、店舗が見え、人物と周囲のスケールは現実的。白いワンピースを着用し、バッグやベルトなどの小物が追加されている。巨大化の要素は一切ない。

A01: giant

追加キーワード
giant
seed 1seed 2seed 3
giant s1giant s2giant s3

観察: s1は通常サイズの女性が都市の街路に立っており、controlとの差がない。s2は都市の俯瞰背景にビルの高さと同程度の女性が立っており、巨大化が表現されている。s3も同様に都市上空の構図だが、ビルと比べて女性の身長はビルの上部に頭が届く程度。3枚中2枚で巨大化が出現したが、スケールの再現度にばらつきがある。

A02: giantess

追加キーワード
giantess
seed 1seed 2seed 3
giantess s1giantess s2giantess s3

観察: s1は通常サイズの女性が都市の街路に立っており、巨大化していない。s2は都市の俯瞰背景に女性が立ち、ビルの上部と同程度の高さ。s3も都市背景で同様の構図。giantとの視覚的な差がない。「giantess」という女性形の単語を使っても巨大化の度合いは変わらない。

A03: colossal

追加キーワード
colossal
seed 1seed 2seed 3
colossal s1colossal s2colossal s3

観察: 3枚とも都市の俯瞰背景に女性が立つ構図。s1は高層ビルの屋上に立ち、周囲のビルと同程度かやや上回る高さ。s2はツインタワー型の高層ビルの間に立ち、ビルと同じ高さで描画されている。s3も高層ビルに囲まれた構図で、ビルの高さとほぼ同じ。giantやgiantessと比べて3枚とも安定して巨大化しているが、スケールの大きさ自体には目立った差がない。

A04: kaiju scale

追加キーワード
kaiju scale
seed 1seed 2seed 3
kaiju scale s1kaiju scale s2kaiju scale s3

観察: 3枚全てに女性の背後にゴジラ風の怪獣が出現している。女性と怪獣が都市のミニチュア模型の上に立つ構図で、建物が明確に小さく描写されている。車や道路がミニチュアとして確認でき、スケール差の表現が全条件中で最も大きい。ただし「kaiju scale」の意図は怪獣サイズのスケール感を出すことだったが、実際には怪獣そのものが出現しており、意図とは異なる結果になった。女性自体の巨大化はビル10階建て相当で、他の条件より大きい。

ラボ長コメント: なにこれ、怪獣出てきちゃってるじゃん。でもスケール感は全条件で一番大きいし、巨大女性とゴジラが並んでるの絵面として最高すぎるんだけど

A05: towering

追加キーワード
towering
seed 1seed 2seed 3
towering s1towering s2towering s3

観察: 3枚とも都市のビル群を背景に女性が立つ構図。s1はビルの上部に頭が届く高さ、s2はビル群の中に立ちビルの高さとほぼ同じ、s3も同様。giantやcolossalとの視覚的な差がない。「towering」単体では巨大化のスケールを拡大する効果は確認できなかった。

A06: looking down

追加キーワード
looking down
seed 1seed 2seed 3
looking down s1looking down s2looking down s3

観察: 3枚とも都市の俯瞰背景に女性が立ち、視線がやや下に向いている。s1は中層ビル群の中に立ち見下ろしている。s2は都市を見下ろす構図で、ビルが女性の膝下から足元に広がっている。s3は低層のビル群の中に立ち下を見ている。ポーズとして「見下ろし」は反映されているが、スケール感はgiantと同程度で、looking downの追加による巨大化の増幅は確認できない。

A07: holding building

追加キーワード
holding building
seed 1seed 2seed 3
holding building s1holding building s2holding building s3

観察: s1はビル群の中に立ち、片手をビルの上に乗せるような仕草でスケール感が表現されている。s2は都市背景で片手を差し出すポーズだが、建物を実際に掴んではいない。s3はビルの屋上に立っているように見え、巨大化というよりビルの上にいる構図。「building」を掴む表現は安定して再現されず、手を差し出すポーズへの置き換えが多い。

A08: tiny people

追加キーワード
tiny people
seed 1seed 2seed 3
tiny people s1tiny people s2tiny people s3

観察: 3枚とも女性の周囲に10人前後のミニチュアサイズの人物が配置されている。女性自体は通常サイズだが、周囲の人物が極端に小さい(女性の膝下程度の身長)ため、相対的に巨大に見える。都市背景は出現せず、s1は広場のような場所で計測器風の台座の上に立っている。s2は台の上に立ち周囲を小さな人々が取り囲む構図。s3は体重計のような大きな計測器の前に立ち、周囲にミニチュアの人々がいる。都市とのスケール比較ではなく「小さな人間と大きな人間」という相対的な表現になった。

実験2: ミニチュア撮影テクニックの応用

ミニチュア模型を大きく見せる撮影テクニック(ローアングル・マクロ撮影・ライティング・空背景)をプロンプトに応用し、巨大化のスケール感を強化できるか検証する。全条件に giant を含め、実験1の結果をベースラインとする。

A09: ローアングル撮影

地面レベルから見上げる構図で、建物を小さく・女性を大きく見せる。

A09 プロンプト全文
1girl, 32yo japanese actress, giant, white dress, full body, low angle shot from ground level, looking up at her from below, miniature buildings at her feet, city street
seed 1seed 2seed 3
low angle s1low angle s2low angle s3

観察: 3枚ともミニチュア都市の道路上に立つ巨大女性の構図で、建物が腰〜肩の高さに描写されている。s1は足元に車やミニチュアの街路樹が確認でき、スケール差が明確。low angle + miniature buildings at her feet の組み合わせが安定している。実験1のgiant単体(A01)と比較してスケール感が大幅に向上。

A10: マクロ撮影+浅い被写界深度

マクロレンズとチルトシフト効果で、手前にピントを合わせ背景をぼかす。ジオラマ風の遠近感を強調。

A10 プロンプト全文
1girl, 32yo japanese actress, giant, white dress, full body, macro photography, shallow depth of field, tilt-shift lens effect, sharp focus on woman, blurred miniature city below, bokeh
seed 1seed 2seed 3
macro dof s1macro dof s2macro dof s3

観察: 3枚とも都市全体がミニチュア模型のように描写され、背景に大きなボケ光(玉ボケ)が入っている。建物の屋上ディテールや車のスケールがジオラマ風で、実験1のどの条件よりもミニチュア感が強い。tilt-shift + shallow depth of field がミニチュア効果を最も効果的に引き出している。

A11: サイドライティング

斜光でディテールのコントラストを強調し、ミニチュア模型にリアルな立体感を与える。

A11 プロンプト全文
1girl, 32yo japanese actress, giant, white dress, full body, dramatic side lighting, strong shadow, miniature city below, harsh directional light like sunlight on miniature
seed 1seed 2seed 3
sidelight s1sidelight s2sidelight s3

観察: 3枚とも俯瞰構図で、都市がミニチュア模型として描写されている。ドレスの裾が風になびくダイナミックな描写(s1)が出現。ライティングの方向性は条件間で差があり、dramatic side lighting の効果はミニチュア感よりも女性自体の立体感に寄与している。

A12: 逆光シルエット

バックライトで女性をシルエット化し、巨大感を演出。

A12 プロンプト全文
1girl, 32yo japanese actress, giant, white dress, full body, backlit silhouette, standing against bright sky, miniature city skyline below, strong backlighting, rim light
seed 1seed 2seed 3
backlit s1backlit s2backlit s3

観察: 3枚とも頭部の背後に太陽光のリムライトが入り、神々しい巨大感が出ている。都市のスカイラインが足元に広がり、ビルが膝下〜腰の高さに描写されている。backlit + rim light の組み合わせが女性の輪郭を強調し、巨大さを視覚的に際立たせている。全条件中最も印象的な構図。

A13: 空背景+ミニチュア都市

本物の空と雲をバックに、ミニチュア都市模型の上に立つ構図。

A13 プロンプト全文
1girl, 32yo japanese actress, giant, white dress, full body, real sky background with clouds, miniature city model below, photographed outdoors, natural daylight, scale model cityscape
seed 1seed 2seed 3
real sky s1real sky s2real sky s3

観察: 3枚とも雲のある実写風の空が背景に広がり、足元にスケールモデルの都市が配置されている。s1は奥に緑地帯と丘陵があり、屋外ジオラマのようなリアルなスケール感。real sky background with clouds + scale model cityscape がミニチュアの屋外撮影を再現している。

A14: 全テクニック複合

ローアングル+マクロ+サイドライト+空背景を全て投入した複合条件。

A14 プロンプト全文
1girl, 32yo japanese actress, giant, white dress, full body, low angle shot from ground level, macro photography, shallow depth of field, dramatic side lighting, miniature city buildings at her feet, real sky with clouds, looking down at tiny city
seed 1seed 2seed 3
combined s1combined s2combined s3

観察: s1は曇天の空をバックに前傾で下を覗き込む構図で、ビル群の間に立つ巨大女性が描写されている。s2・s3はミニチュア都市の俯瞰構図。全テクニックを盛り込んだ結果、構図のバリエーションが広がったが、特定の1テクニックが突出するよりも全体的なクオリティ向上に寄与している。

横断比較

実験1 vs 実験2: スケール感の比較(giant / ローアングル / マクロ被写界深度 / 逆光)

Seedgiant (A01)ローアングル (A09)マクロ+DoF (A10)逆光 (A12)
s1giantローアングルマクロ被写界深度逆光シルエット
s2giantローアングルマクロ被写界深度逆光シルエット
s3giantローアングルマクロ被写界深度逆光シルエット

giant 単体では通常サイズが混在(s1)。撮影テクニックの追加でミニチュア都市感と巨大さが大幅に安定。

ミニチュア撮影テクニック比較(ローアングル / サイドライト / 空背景 / 複合)

Seedローアングル (A09)サイドライト (A11)空背景 (A13)複合 (A14)
s1ローアングルサイドライト実写空背景テクニック組み合わせ
s2ローアングルサイドライト実写空背景テクニック組み合わせ
s3ローアングルサイドライト実写空背景テクニック組み合わせ

いずれもミニチュア都市が安定して生成されている。ローアングルは見上げ構図で迫力、空背景は屋外ジオラマのリアルさが特徴。

まとめ

実験1: 巨大化キーワード

条件巨大化都市背景特徴
controlなし街路通常サイズの女性
giant2/3枚俯瞰ビルと同程度、ばらつきあり
giantess2/3枚俯瞰giantと差がない
colossal3/3枚俯瞰安定してビルと同程度
kaiju scale3/3枚ミニチュア怪獣が出現、スケール最大
towering3/3枚俯瞰giantと差がない
looking down3/3枚俯瞰見下ろしポーズが追加
holding building2/3枚俯瞰掴む表現は不安定
tiny people3/3枚なしミニチュア人間で相対表現

実験2: ミニチュア撮影テクニック

条件巨大化ミニチュア感特徴
ローアングル (A09)3/3枚見上げ構図で迫力、足元に車・街路樹
マクロ+DoF (A10)3/3枚最高ジオラマ風ボケ、ミニチュア感が最も強い
サイドライト (A11)3/3枚ドレスの立体感が向上、俯瞰ミニチュア
逆光 (A12)3/3枚リムライトで神々しい巨大感、最も印象的
空背景 (A13)3/3枚屋外ジオラマ風、リアルな空との合成感
複合 (A14)3/3枚全テクニック統合、構図バリエーション豊か

総合的な知見

巨大化キーワード単体(giant, colossal 等)では安定性・スケール感ともに限界がある。ミニチュア撮影テクニックをプロンプトに応用することで、巨大化の安定性(全条件3/3)とスケール感の両方が大幅に向上した。

推奨アプローチ:

  • ミニチュアジオラマ感を出したい場合: macro photography, shallow depth of field, tilt-shift lens effect(A10)
  • 迫力ある巨大感を出したい場合: backlit silhouette, rim light, miniature city skyline below(A12)
  • リアルな屋外スケール感: real sky background with clouds, scale model cityscape(A13)
  • 安定した基本構図: low angle shot from ground level, miniature buildings at her feet(A09)

共通して効果的だったのは miniature 系の語句(miniature buildings / miniature city / scale model)で、都市をミニチュア模型として描写させることがスケール感の鍵になっている。

ラボ長コメント: 「大きくする」じゃなくて「周りを小さくする」アプローチが一番効いたの、プロンプト設計として面白いですね。ミニチュア撮影テクニックの応用はかなり汎用性が高そうかなと。逆光のやつ、神々しくてめちゃくちゃ好きです。

関連記事