テーマ
プロフェッショナルな撮影とは対照的に、スマートフォンで自撮りしたような「素人感」をプロンプトで演出できるか検証した。mirror selfie、amateur snapshot、messy composition 等のキーワードを段階的に追加し、構図・背景・画質がどのように変化するかを観察する。
結論を先に
mirror selfieは構図・撮影スタイルを大きく変える。 コントロールと比較して、鏡越しの構図とスマートフォンを持つポーズが3seed全てで出現した。amateur snapshot, messy compositionの追加で背景の散乱度が増す。 鏡に映る室内に衣類や小物が散乱し、生活感のある画像が得られた。「構図の乱れ」ではなく「部屋の散らかり」として反映される傾向がある。low quality photo, motion blurの効果は限定的。 背景の散乱度がさらに増す傾向はあったが、画像全体のシャープネス低下やモーションブレは目立たなかった。extremely close smartphone selfieは顔クローズアップと端末による顔隠しを実現する。 3枚中3枚でスマートフォンが顔の一部を覆う接写構図が出現した。lying on bed taking smartphone selfieはベッドに横たわる構図を安定して再現する。 俯瞰気味のアングルとスマートフォンを持つ手が画面に入る日常的な構図が得られた。- 品質低下系キーワード(
film grain、overexposed、out of focus含む)はz-image-turboでは効果が限定的。bokeh foregroundのみ背景照明のボケとして部分的に反映された。
実験設計
| 項目 | 値 |
|---|---|
| モデル | z-image-turbo(6B、写実特化蒸留) |
| ステップ | 8 |
| CFG | 1.0 |
| サイズ | 1024x1024 |
| seed | 42 / 123 / 789(全条件共通) |
| 各条件 | 3枚(3seed) |
| 合計 | 9条件 x 3seed = 27枚 |
条件一覧
| 条件 | 概要 | 追加キーワード |
|---|---|---|
| ctrl | プロフェッショナル撮影 | professional lighting |
| A | ミラーセルフィー基本 | mirror selfie, holding smartphone, casual home wear |
| B | 素人感追加 | A + amateur snapshot, messy composition |
| C | 低品質感追加 | B + low quality photo, motion blur |
| D | 超接近セルフィー | extremely close smartphone selfie, face partially hidden by smartphone, messy framing |
| E | ベッド横向き | lying on bed taking smartphone selfie, part of face outside frame, amateur snapshot |
| F | フィルムグレイン | film grain, noise |
| G | 露出過多 | overexposed, washed out colors |
| H | ピンぼけ | out of focus, bokeh foreground |
ctrl: プロフェッショナル撮影(ベースライン)
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 整った照明下でベッドルームに立つポートレート。背景は整頓されており、ベッド・枕が配置されている。被写体はカメラ目線で、ポーズも安定している。以降の比較基準とする。
A: ミラーセルフィー基本
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚全てでスマートフォンを片手に持ち、鏡越しに自撮りしている構図が再現された。服装はシャツ+ショートパンツやジーンズなど、コントロールのワンピースとは異なるカジュアルな部屋着に変化している。背景にはベッドや家具が鏡に映り込んでおり、視線はスマートフォンの画面方向を向いている。コントロールと比較して、ポーズがリラックスした姿勢に変わった。
B: 素人感追加
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 条件Aと同様にミラーセルフィーの構図が維持されている。顕著な変化は背景で、鏡に映る部屋に衣類・小物が散乱している様子が3枚中3枚で確認された。条件Aの背景が比較的整っていたのに対し、messy composition の追加で生活感のある散らかった室内が描写されている。被写体の服装もよりラフな印象(オーバーサイズのシャツ等)になった。
C: 低品質感追加
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 条件Bと比較して、背景の散乱度がさらに増している。部屋に衣類・雑貨がより多く散らかっており、生活感が強い。一方、low quality photo や motion blur による画像全体のシャープネス低下やモーションブレは3枚とも目立たなかった。照明がやや暗めになり、室内灯のみで撮影したような色味になった画像が確認された。服装はTシャツ+ダメージジーンズなど、条件Bよりさらにカジュアルになっている。
D: 超接近セルフィー
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚全てで顔のクローズアップ構図となり、スマートフォンが顔の一部(目元〜頬付近)を覆っている。extremely close により被写体との距離が極端に近くなり、肩から上のみが画面に収まっている。face partially hidden by smartphone の指示通り、端末で顔の一部が隠れる構図が安定して再現された。背景はほぼ見えず、被写体の顔・手・端末が画面の大部分を占めている。A〜C(ミラーセルフィー系)とは全く異なる構図になった。
E: ベッド横向きセルフィー
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: 3枚全てでベッドに横たわり、スマートフォンを手に持つ構図が再現された。俯瞰気味のアングルまたは横向きの視点で、枕・布団・シーツが画面の大部分を占めている。part of face outside frame の効果か、頭頂部や額が画面端で切れている画像が確認された。リラックスした姿勢と寝具の描写により、就寝前後の日常的な場面が表現されている。
F: film grain + noise
low quality photo, motion blur が効かなかったため、フィルムグレインと画像ノイズで品質低下を試みる。
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: seed 42ではミラーセルフィー構図が再現され、グレーのTシャツにベージュのパンツというカジュアルな部屋着が出力された。画像全体にごくわずかな粒状感が見られるが、明確なフィルムグレインとは言い難い。色調がやや彩度を落とした落ち着いたトーンになっている点は film grain の影響の可能性がある。ただし条件Aとの差は限定的で、ノイズの効果は3枚を通じて顕著ではなかった。
G: overexposed + washed out colors
露出過多・色褪せ感を検証。
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: seed 42ではミラーセルフィー構図が再現された。全体的に明るめのトーンで、壁や背景の白飛び感がやや確認できる。服装がデニムショートパンツに変化し、条件Aよりカジュアル度が増している。ただし overexposed による劇的な白飛びや washed out colors による明確な色褪せは3枚を通じて限定的だった。通常の室内照明の範囲内に収まっている。
H: out of focus + bokeh foreground
ピンぼけ効果を検証。
| seed 42 | seed 123 | seed 789 |
|---|---|---|
![]() | ![]() | ![]() |
観察: seed 42ではミラーセルフィー構図が再現された。ストライプシャツにデニムショートパンツの服装。背景に丸い照明のボケが描写されており、bokeh foreground の効果が部分的に反映されている。ただし被写体自体にピンぼけがかかっているわけではなく、out of focus の効果は確認されなかった。ボケは前景ではなく背景の照明に適用される傾向がある。
まとめ比較
| 条件 | 構図の変化 | 背景の散乱 | スマートフォン | 画質変化 |
|---|---|---|---|---|
| ctrl | 正面ポートレート | なし(整頓) | なし | なし |
| A | ミラーセルフィー | 軽微 | 片手に保持 | なし |
| B | ミラーセルフィー | 顕著(衣類散乱) | 片手に保持 | なし |
| C | ミラーセルフィー | さらに顕著 | 片手に保持 | 照明やや暗め |
| D | 顔クローズアップ | ほぼ不可視 | 顔を部分的に覆う | なし |
| E | ベッド横たわり | なし(寝具中心) | 片手に保持 | なし |
| F | ミラーセルフィー | 軽微 | 片手に保持 | 粒状感ごくわずか |
| G | ミラーセルフィー | 軽微 | 片手に保持 | やや明るめ |
| H | ミラーセルフィー | 軽微 | 片手に保持 | 背景ボケあり |
messy composition は「構図を崩す」のではなく「背景を散らかす」方向に作用する傾向が確認された。構図自体を変えるには extremely close、lying on bed、face partially hidden のようなポーズ・フレーミングを直接指定するキーワードの方が効果的だった。
low quality photo と motion blur は18枚の生成結果において画質の低下やブレとして明確に反映されなかった。film grain、noise、overexposed、washed out colors、out of focus も同様に効果が限定的で、劇的な画質変化は確認されなかった。bokeh foreground のみ背景照明のボケとして部分的に反映された。品質低下系キーワード全般が、z-image-turboの8ステップ・CFG 1.0環境では効果が限定的である。
ラボ長コメント
えっと、今回の一番の発見は
messy compositionが構図じゃなくて部屋の散らかり度に効くことですね。構図を崩したいならextremely closeとかface partially hiddenみたいにポーズ・フレーミングを直接指定するほうが効果的みたいです。Dの顔隠しセルフィーは使い道ありそうだし、Eのベッド横向きも安定してて日常感出すには良さそうかなと。品質低下系キーワードが全般的に効かないのはこのモデルの特性として覚えておきたいところですね。































