【やってみた】ビーチビキニのプロンプトを8段階で改善してみた|どこで画質が変わるか実験

【やってみた】ビーチビキニのプロンプトを8段階で改善してみた|どこで画質が変わるか実験

結論

  • Step 4(ポーズ+撮影スタイル指定)が最大の転換点 hand on hipswimwear photographyの追加で画像品質が劇的に変わった
  • カメラ機種名はz-image-turboでは効果が薄い shot on Canon EOS R5を追加しても目に見える差がなかった
  • 強調構文の微調整より語順と要素選択が重要 :1.2:1.3の差はz-image-turboの8ステップでは出にくい
  • 動きの要素が仕上げに効く hair blowing in sea breezewaves crashingのような動的要素が最後の一押しとして有効
  • wet skinは水着写真で最も効果的なキーワードの一つ 肌のツヤ感と水滴でリアリティが大幅に向上する

「良いプロンプトの書き方」は多くの記事で紹介されていますが、本当にそのテクニックは効くのか? 実際に最小限のプロンプトから1要素ずつ追加して、画像がどう変わるかを検証しました。

すべての画像はz-image-turboで生成しています。

実験ルール

  • テーマ: 「ビーチでビキニの日本人女性」
  • Step 0(最小プロンプト)からStep 7(完全版)まで段階的に要素を追加
  • 各ステップで追加した要素その効果を記録
  • ネガティブプロンプトは全ステップで未使用(プロンプト側の効果のみを検証)

Step 0: 最小プロンプト(3語)

NSFW - クリックで表示
Step 0
Step 0
Japanese woman, bikini, beach

結果: 画像は生成されたが問題だらけ。

  • ビキニの色・デザインがランダム(ストライプ柄になった)
  • 背景が岩場で「ビーチ」感が薄い
  • 構図が中途半端(全身だが棒立ち)
  • 年齢が不明確

学び: 最低限の単語でも画像は出るが、あらゆる要素がランダムに決まる

Step 1: 年齢・ポーズ・動作を追加

NSFW - クリックで表示
Step 1
Step 1(追加: 年齢、構図の種類)
a Japanese woman in her 20s, wearing a bikini, standing on a beach

変更点: a Japanese woman in her 20s で年齢を指定、standing on a beach で動作を明示

結果:

  • ビキニが紺色の無地に変わった(ランダム要素の変化)
  • まだ棒立ちで表情も硬い
  • 背景はやや改善されたが依然として岩場

学び: 年齢を指定しても視覚的な変化は限定的。構図指定(standing)はあるが具体性が足りない。

Step 2: 環境と色の具体化

NSFW - クリックで表示
Step 2
Step 2(追加: 色、tropical、sunny day)
a beautiful Japanese woman in her mid 20s, wearing a black bikini, standing on a tropical beach, sunny day

変更点: beautifulblack bikini(色指定)、tropical beach(環境の具体化)、sunny day

結果:

  • tropicalの追加でヤシの木が出現。背景が劇的に改善
  • ビキニが指定通りの黒に
  • beautifulの追加で顔立ちが若干整った印象
  • まだ構図はシンプルな正面立ち

学び: 環境の修飾語(tropical)は背景に劇的な効果がある。色の指定は確実に反映される。

Step 3: 肌の質感と技術設定

NSFW - クリックで表示
Step 3
Step 3(追加: wet skin, bright sunlight, 85mm lens)
a beautiful Japanese woman in her mid 20s, wearing a black string bikini, standing on a tropical beach, wet skin, bright sunlight, 85mm lens

変更点: string bikini(デザイン具体化)、wet skin(肌の質感)、bright sunlight(照明)、85mm lens(カメラ設定)

結果:

  • wet skinで肌に水滴・ツヤ感が出現。グラビア感が一気に向上
  • 85mm lensの効果で背景のぼかしが自然に
  • ポーズに手の動作が加わった(髪を触る)
  • string bikiniで紐ビキニに

学び: wet skinは水着写真で最も効果的なキーワードの一つ。カメラレンズの指定もボケ味に影響する。

Step 4: ポーズと構図の明示

NSFW - クリックで表示
Step 4
Step 4(追加: confident pose, hand on hip, ocean waves, swimwear photography)
a beautiful Japanese woman in her mid 20s, wearing a black string bikini, standing on a tropical beach, wet skin glistening in sunlight, confident pose with hand on hip, ocean waves in background, bright natural light, 85mm lens, swimwear photography

変更点: confident pose with hand on hip(ポーズ指定)、ocean waves in background(背景ディテール)、glistening in sunlight(光沢の具体化)、swimwear photography(撮影スタイル)

結果:

  • ポーズが劇的に改善。腰に手を当てた自信のあるポーズに
  • 波打ち際に立つ構図になり、躍動感が出た
  • swimwear photographyで全体的なグラビア感が統一された
  • 今までで最もプロの水着グラビアに近い

学び: ポーズの具体的な指定(hand on hip)は構図に直結するswimwear photographyのようなジャンル指定は全体の雰囲気を一気に整える。ここが最大の転換点

Step 5: カメラ機種の追加

NSFW - クリックで表示
Step 5
Step 5(追加: shot on Canon EOS R5, shallow depth of field)
a beautiful Japanese woman in her mid 20s, wearing a black string bikini, standing on a tropical beach, wet skin glistening in sunlight, confident pose with hand on hip, ocean waves in background, bright natural light, 85mm lens, swimwear photography, shot on Canon EOS R5, shallow depth of field

変更点: shot on Canon EOS R5(カメラ機種)、shallow depth of field(明示的なボケ指定)

結果:

  • Step 4との差はほぼなし
  • カメラ機種名は画質に大きな影響を与えていない
  • shallow depth of field85mm lensで既にボケているため重複

学び: カメラ機種の指定はz-image-turboでは効果が薄い85mm lensを既に指定している場合、shallow depth of fieldは冗長。限られたトークン枠を他の効果的な要素に回した方が良い。

Step 6: 強調構文の追加

NSFW - クリックで表示
Step 6
Step 6(追加: 強調構文 (swimwear photography:1.3), (wet skin:1.2), (shallow depth of field:1.2))
swimwear photography of a beautiful Japanese woman in her mid 20s, wearing a black string bikini, standing on a tropical beach, wet skin glistening in sunlight, confident pose with hand on hip, ocean waves in background, bright natural light, 85mm lens, shot on Canon EOS R5, shallow depth of field

変更点: swimwear photographyを1.3倍、wet skinを1.2倍、shallow depth of fieldを1.2倍に強調

結果:

  • Step 5との差は微妙
  • ヤシの木が画面に入り込みすぎて被写体を遮っている
  • 強調構文の効果は、z-image-turbo(8ステップ)では限定的(実験で検証済み

学び: z-image-turboでは強調構文の微調整よりも、語順と要素の選択が重要。強調構文に頼るよりもStep 4のように適切な要素を追加する方が効果的。

Step 7: 最終版 — 全要素を最適化

NSFW - クリックで表示
Step 7
Step 7(最終版)
swimwear gravure photography of a stunning Japanese woman in her mid 20s, toned athletic body, wearing a black string bikini, standing at the edge of turquoise ocean water, wet skin glistening in golden sunlight, confident alluring pose with one hand on hip, hair blowing in sea breeze, waves crashing behind her, tropical paradise background, warm golden hour light, 85mm f/1.4 lens, shallow depth of field, high fashion magazine quality

変更点: stunning(beautifulより強い表現)、toned athletic body(体型指定)、turquoise ocean water(海の色を具体化)、golden sunlight(ゴールデンアワー)、hair blowing in sea breeze(動き)、waves crashing(波しぶき)、alluring(表情の方向性)、high fashion magazine quality(品質指示)

結果:

  • 波しぶきが追加され、躍動感が大幅に向上
  • hair blowing in sea breezeで髪がなびき、動きのある画に
  • golden sunlightで照明が暖色系に変化
  • 全ステップ中最も完成度が高い

学び: 最終段階ではwaves crashinghair blowingのような動きの要素が効果的。golden sunlightで光の色温度を変えることで雰囲気を大きく変えられる。

全ステップ比較

Step追加要素効果評価
0最小(3語)全てランダム★☆☆☆☆
1年齢、standing微改善★☆☆☆☆
2色、tropical背景が劇的改善★★☆☆☆
3wet skin、85mm lens肌質感向上★★★☆☆
4ポーズ、撮影スタイル最大の転換点★★★★☆
5カメラ機種効果なし(冗長)★★★★☆
6強調構文効果薄い★★★★☆
7動き、光の色温度完成度最高★★★★★

この実験から得た最も効果的なプロンプト要素

効果が大きい(必ず入れるべき)

  1. 撮影スタイルswimwear photography, gravure)— 全体の雰囲気を決定
  2. 具体的なポーズhand on hip, arms crossed)— 構図に直結
  3. 肌の質感wet skin glistening)— リアリティ向上
  4. 環境の修飾語tropical, turquoise)— 背景を支配
  5. 動きの要素hair blowing, waves crashing)— 躍動感

効果が小さい(省略可能)

  1. カメラ機種名shot on Canon EOS R5)— z-image-turboでは効果薄
  2. 強調構文の微調整:1.2 vs :1.3)— 8ステップでは差が出にくい
  3. shallow depth of field85mm lensと重複)

最も効率的なプロンプト(Step 4ベース + Step 7の動き要素)

以下が、この実験で見つけた最もコスパの良いプロンプト構成です:

実験結果ベースの最適プロンプト
swimwear gravure photography of a beautiful Japanese woman in her mid 20s, wearing a black string bikini, standing at the edge of ocean water, wet skin glistening in golden sunlight, confident pose with hand on hip, hair blowing in sea breeze, waves crashing behind her, tropical beach, 85mm lens

Step 4〜7の良いところだけを抽出し、効果のない要素(カメラ機種、冗長な強調構文)を削除。40トークン程度に収めています。

まとめ

プロンプト改善で最も重要な発見:

  1. Step 4が最大の転換点 — ポーズと撮影スタイルの指定が画像の品質を劇的に変える
  2. 「盛ればいい」わけではない — Step 5-6のように冗長な要素は効果がない
  3. 動きの要素が仕上げに効くhair blowing, waves crashing は最後の一押し
  4. z-image-turboでは語順と要素選択 > 強調構文 — 微調整より適切な要素の追加が効果的

関連記事