結論を先に
- controlでは通常サイズの女性が都市の街路に立つ写真が生成され、巨大化の要素はない
- giant は都市上空に女性が立つ構図になるが、スケール感にばらつきがある。ビルの高さと同程度か少し大きい程度
- giantess はgiantと同様に都市上空の構図が出る。巨大化の度合いはgiantとほぼ同等で、明確な差がない
- colossal は都市の俯瞰背景に女性が立つ構図。ツインタワー級の高層ビルと同程度の身長で描画される場合がある
- kaiju scale は最も特徴的で、3枚全てに怪獣(ゴジラ風の造形)が女性の背後に出現する。都市はミニチュア模型のように描写され、スケール感が最も大きい
- towering はビル群の中に女性が立つ構図で、ビルの高さと同等かやや上回る程度。giantとの差がない
- looking down は都市を俯瞰する巨大女性の構図が出るが、見下ろすポーズの変化にとどまり、スケール感に大きな差はない
- holding building は建物の屋上付近に立ち、片手を差し出すポーズが出る。ただし実際に建物を掴んでいる描写は1枚(s1)のみで、残りは手のひらを差し出すポーズにとどまる
- tiny people は通常サイズの女性の周囲にミニチュアの人物が配置され、相対的に巨大に見える構図。都市背景は出ず、台座や計測器のような小道具が出現する
- 【実験2】ミニチュア撮影テクニックの応用が最も効果的。ローアングル・マクロ被写界深度・逆光・空背景をプロンプトに組み込むことで、巨大化の安定性(全条件3/3)とミニチュア都市のスケール感が大幅に向上した
- 特に
macro photography, shallow depth of field, tilt-shiftの組み合わせがジオラマ風ミニチュア感を最も強く引き出す backlit silhouette, rim lightは神々しい巨大感を演出し、視覚的インパクトが最も強い
実験設計
| 項目 | 値 |
|---|---|
| モデル | z-image-turbo(6B、写実特化蒸留) |
| ステップ | 8 |
| サンプラー | euler |
| スケジューラー | ddim_uniform |
| CFG | 1.0 |
| サイズ | 1024x1024 |
| seed | 3つ固定(全条件共通) |
| 各条件 | 3枚(3seed) |
| 合計 | 9条件 = 27枚 |
ベースプロンプト
建物との比較でスケール感を判定するため、都市環境を基本設定とした。
A00: control
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも都市の歩道に立つ通常サイズの女性。背景に車、通行人、店舗が見え、人物と周囲のスケールは現実的。白いワンピースを着用し、バッグやベルトなどの小物が追加されている。巨大化の要素は一切ない。
A01: giant
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: s1は通常サイズの女性が都市の街路に立っており、controlとの差がない。s2は都市の俯瞰背景にビルの高さと同程度の女性が立っており、巨大化が表現されている。s3も同様に都市上空の構図だが、ビルと比べて女性の身長はビルの上部に頭が届く程度。3枚中2枚で巨大化が出現したが、スケールの再現度にばらつきがある。
A02: giantess
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: s1は通常サイズの女性が都市の街路に立っており、巨大化していない。s2は都市の俯瞰背景に女性が立ち、ビルの上部と同程度の高さ。s3も都市背景で同様の構図。giantとの視覚的な差がない。「giantess」という女性形の単語を使っても巨大化の度合いは変わらない。
A03: colossal
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも都市の俯瞰背景に女性が立つ構図。s1は高層ビルの屋上に立ち、周囲のビルと同程度かやや上回る高さ。s2はツインタワー型の高層ビルの間に立ち、ビルと同じ高さで描画されている。s3も高層ビルに囲まれた構図で、ビルの高さとほぼ同じ。giantやgiantessと比べて3枚とも安定して巨大化しているが、スケールの大きさ自体には目立った差がない。
A04: kaiju scale
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚全てに女性の背後にゴジラ風の怪獣が出現している。女性と怪獣が都市のミニチュア模型の上に立つ構図で、建物が明確に小さく描写されている。車や道路がミニチュアとして確認でき、スケール差の表現が全条件中で最も大きい。ただし「kaiju scale」の意図は怪獣サイズのスケール感を出すことだったが、実際には怪獣そのものが出現しており、意図とは異なる結果になった。女性自体の巨大化はビル10階建て相当で、他の条件より大きい。
ラボ長コメント: なにこれ、怪獣出てきちゃってるじゃん。でもスケール感は全条件で一番大きいし、巨大女性とゴジラが並んでるの絵面として最高すぎるんだけど
A05: towering
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも都市のビル群を背景に女性が立つ構図。s1はビルの上部に頭が届く高さ、s2はビル群の中に立ちビルの高さとほぼ同じ、s3も同様。giantやcolossalとの視覚的な差がない。「towering」単体では巨大化のスケールを拡大する効果は確認できなかった。
A06: looking down
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも都市の俯瞰背景に女性が立ち、視線がやや下に向いている。s1は中層ビル群の中に立ち見下ろしている。s2は都市を見下ろす構図で、ビルが女性の膝下から足元に広がっている。s3は低層のビル群の中に立ち下を見ている。ポーズとして「見下ろし」は反映されているが、スケール感はgiantと同程度で、looking downの追加による巨大化の増幅は確認できない。
A07: holding building
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: s1はビル群の中に立ち、片手をビルの上に乗せるような仕草でスケール感が表現されている。s2は都市背景で片手を差し出すポーズだが、建物を実際に掴んではいない。s3はビルの屋上に立っているように見え、巨大化というよりビルの上にいる構図。「building」を掴む表現は安定して再現されず、手を差し出すポーズへの置き換えが多い。
A08: tiny people
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも女性の周囲に10人前後のミニチュアサイズの人物が配置されている。女性自体は通常サイズだが、周囲の人物が極端に小さい(女性の膝下程度の身長)ため、相対的に巨大に見える。都市背景は出現せず、s1は広場のような場所で計測器風の台座の上に立っている。s2は台の上に立ち周囲を小さな人々が取り囲む構図。s3は体重計のような大きな計測器の前に立ち、周囲にミニチュアの人々がいる。都市とのスケール比較ではなく「小さな人間と大きな人間」という相対的な表現になった。
実験2: ミニチュア撮影テクニックの応用
ミニチュア模型を大きく見せる撮影テクニック(ローアングル・マクロ撮影・ライティング・空背景)をプロンプトに応用し、巨大化のスケール感を強化できるか検証する。全条件に giant を含め、実験1の結果をベースラインとする。
A09: ローアングル撮影
地面レベルから見上げる構図で、建物を小さく・女性を大きく見せる。
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚ともミニチュア都市の道路上に立つ巨大女性の構図で、建物が腰〜肩の高さに描写されている。s1は足元に車やミニチュアの街路樹が確認でき、スケール差が明確。low angle + miniature buildings at her feet の組み合わせが安定している。実験1のgiant単体(A01)と比較してスケール感が大幅に向上。
A10: マクロ撮影+浅い被写界深度
マクロレンズとチルトシフト効果で、手前にピントを合わせ背景をぼかす。ジオラマ風の遠近感を強調。
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも都市全体がミニチュア模型のように描写され、背景に大きなボケ光(玉ボケ)が入っている。建物の屋上ディテールや車のスケールがジオラマ風で、実験1のどの条件よりもミニチュア感が強い。tilt-shift + shallow depth of field がミニチュア効果を最も効果的に引き出している。
A11: サイドライティング
斜光でディテールのコントラストを強調し、ミニチュア模型にリアルな立体感を与える。
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも俯瞰構図で、都市がミニチュア模型として描写されている。ドレスの裾が風になびくダイナミックな描写(s1)が出現。ライティングの方向性は条件間で差があり、dramatic side lighting の効果はミニチュア感よりも女性自体の立体感に寄与している。
A12: 逆光シルエット
バックライトで女性をシルエット化し、巨大感を演出。
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも頭部の背後に太陽光のリムライトが入り、神々しい巨大感が出ている。都市のスカイラインが足元に広がり、ビルが膝下〜腰の高さに描写されている。backlit + rim light の組み合わせが女性の輪郭を強調し、巨大さを視覚的に際立たせている。全条件中最も印象的な構図。
A13: 空背景+ミニチュア都市
本物の空と雲をバックに、ミニチュア都市模型の上に立つ構図。
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚とも雲のある実写風の空が背景に広がり、足元にスケールモデルの都市が配置されている。s1は奥に緑地帯と丘陵があり、屋外ジオラマのようなリアルなスケール感。real sky background with clouds + scale model cityscape がミニチュアの屋外撮影を再現している。
A14: 全テクニック複合
ローアングル+マクロ+サイドライト+空背景を全て投入した複合条件。
| seed 1 | seed 2 | seed 3 |
|---|---|---|
![]() | ![]() | ![]() |
観察: s1は曇天の空をバックに前傾で下を覗き込む構図で、ビル群の間に立つ巨大女性が描写されている。s2・s3はミニチュア都市の俯瞰構図。全テクニックを盛り込んだ結果、構図のバリエーションが広がったが、特定の1テクニックが突出するよりも全体的なクオリティ向上に寄与している。
横断比較
実験1 vs 実験2: スケール感の比較(giant / ローアングル / マクロ被写界深度 / 逆光)
| Seed | giant (A01) | ローアングル (A09) | マクロ+DoF (A10) | 逆光 (A12) |
|---|---|---|---|---|
| s1 | ![]() | ![]() | ![]() | ![]() |
| s2 | ![]() | ![]() | ![]() | ![]() |
| s3 | ![]() | ![]() | ![]() | ![]() |
giant 単体では通常サイズが混在(s1)。撮影テクニックの追加でミニチュア都市感と巨大さが大幅に安定。
ミニチュア撮影テクニック比較(ローアングル / サイドライト / 空背景 / 複合)
| Seed | ローアングル (A09) | サイドライト (A11) | 空背景 (A13) | 複合 (A14) |
|---|---|---|---|---|
| s1 | ![]() | ![]() | ![]() | ![]() |
| s2 | ![]() | ![]() | ![]() | ![]() |
| s3 | ![]() | ![]() | ![]() | ![]() |
いずれもミニチュア都市が安定して生成されている。ローアングルは見上げ構図で迫力、空背景は屋外ジオラマのリアルさが特徴。
まとめ
実験1: 巨大化キーワード
| 条件 | 巨大化 | 都市背景 | 特徴 |
|---|---|---|---|
| control | なし | 街路 | 通常サイズの女性 |
| giant | 2/3枚 | 俯瞰 | ビルと同程度、ばらつきあり |
| giantess | 2/3枚 | 俯瞰 | giantと差がない |
| colossal | 3/3枚 | 俯瞰 | 安定してビルと同程度 |
| kaiju scale | 3/3枚 | ミニチュア | 怪獣が出現、スケール最大 |
| towering | 3/3枚 | 俯瞰 | giantと差がない |
| looking down | 3/3枚 | 俯瞰 | 見下ろしポーズが追加 |
| holding building | 2/3枚 | 俯瞰 | 掴む表現は不安定 |
| tiny people | 3/3枚 | なし | ミニチュア人間で相対表現 |
実験2: ミニチュア撮影テクニック
| 条件 | 巨大化 | ミニチュア感 | 特徴 |
|---|---|---|---|
| ローアングル (A09) | 3/3枚 | 高 | 見上げ構図で迫力、足元に車・街路樹 |
| マクロ+DoF (A10) | 3/3枚 | 最高 | ジオラマ風ボケ、ミニチュア感が最も強い |
| サイドライト (A11) | 3/3枚 | 高 | ドレスの立体感が向上、俯瞰ミニチュア |
| 逆光 (A12) | 3/3枚 | 高 | リムライトで神々しい巨大感、最も印象的 |
| 空背景 (A13) | 3/3枚 | 高 | 屋外ジオラマ風、リアルな空との合成感 |
| 複合 (A14) | 3/3枚 | 高 | 全テクニック統合、構図バリエーション豊か |
総合的な知見
巨大化キーワード単体(giant, colossal 等)では安定性・スケール感ともに限界がある。ミニチュア撮影テクニックをプロンプトに応用することで、巨大化の安定性(全条件3/3)とスケール感の両方が大幅に向上した。
推奨アプローチ:
- ミニチュアジオラマ感を出したい場合:
macro photography, shallow depth of field, tilt-shift lens effect(A10) - 迫力ある巨大感を出したい場合:
backlit silhouette, rim light, miniature city skyline below(A12) - リアルな屋外スケール感:
real sky background with clouds, scale model cityscape(A13) - 安定した基本構図:
low angle shot from ground level, miniature buildings at her feet(A09)
共通して効果的だったのは miniature 系の語句(miniature buildings / miniature city / scale model)で、都市をミニチュア模型として描写させることがスケール感の鍵になっている。
ラボ長コメント: 「大きくする」じゃなくて「周りを小さくする」アプローチが一番効いたの、プロンプト設計として面白いですね。ミニチュア撮影テクニックの応用はかなり汎用性が高そうかなと。逆光のやつ、神々しくてめちゃくちゃ好きです。














































