2026/04/23

GPT Image 2 プロンプト作成ガイド：命中率90%を実現する7つのルール

200回以上の生成から導いた GPT Image 2 プロンプト作成の実戦ガイド。7つのルール、構造、キーワード、一発成功のためのアンチパターンまで網羅。

GPT Image 2 を試してみて「指示の半分が無視されている」と感じたなら、原因はほぼ確実にモデルではなくプロンプトの書き方です。私は200回以上の生成を行い、命中率マトリクスを比較しました。その結果、「1発で当たる」か「5回試して諦める」かを分けているのは、いつも同じ7つのルールでした。

これは GPT Image 2 のための実戦プロンプト作成ガイドです。以下のルールはすべて、次のプロンプトに30秒で適用できる内容です。

なぜほとんどの GPT Image 2 プロンプトが失敗するのか

失敗の約8割は、以下の3パターンに集約されます。

GPT Image 2 を Stable Diffusion と同じように扱う — masterpiece, 8k, ultra detailed, high quality のようなキーワードの詰め合わせ。これらは GPT Image 2 にとってはノイズです。
構造のない一文の長文を書く — 英語や日本語の長い一文に全部詰め込む。GPT Image 2 は構造を読み、構造で返してきます。
テキスト内容を引用符でくくり忘れる — the headline says limited offer と書くより the headline says "Limited Offer" と書く方が圧倒的に信頼できます。引用符ですべてが変わります。

この3つを直すだけで命中率は2倍になります。以下、7ルールを詳しく見ていきます。

ルール1：プロンプトを構造化する — 主題、シーン、スタイル、テキスト、カメラ

信頼できる GPT Image 2 プロンプトには、順序のある5つの構成要素があります。

構成要素	ここに書く内容	例
主題（Subject）	メインの被写体やキャラクター	`a white stainless steel water bottle`
シーン（Scene）	背景と環境	`on a beige linen tablecloth, soft indoor light`
スタイル（Style）	ビジュアルムードと参照	`editorial product photography, premium feel`
テキスト（Text）	画像上のすべての文字を引用符で	`top-left red badge: "50% off"`
カメラ（Camera）	レンズ、アングル、照明	`45-degree side light, shallow depth of field`

これらをカンマでつなぎます。完成形はこんな感じ：

A white stainless steel water bottle, on a beige linen tablecloth,
soft indoor light, editorial product photography, premium feel,
top-left red badge "50% off", bottom black bold text
"Daily Commute Companion", 45-degree side light, shallow depth of field.

この構造が効くのは、GPT Image 2 が言語モデルだからです。物語の順序に従います。順序がランダム = 出力もランダム。

ルール2：画像上のすべてのテキストを引用符でくくる

これは1つで一番効くルールです。

❌ the headline says limited offer ✅ the headline reads "Limited Offer"

この差はテキスト描画精度で30〜40ポイントの命中率差になります。理由は単純で、引用符は「この文字列を正確にレンダリングしろ」とモデルに伝え、ノークォートだと「limited offer という概念を描いて」と解釈されるからです。

非ラテン文字でも同じです：

❌ 标题写限时五折 ✅ 标题写 "限时五折"

複数のテキスト要素がある場合：

Headline at top reads "2026 Spring Collection",
subhead reads "30% Off Sitewide",
bottom-left small text reads "Code: SPRING30",
right-side vertical text reads "Limited Time".

それぞれ引用符でくくり、それぞれの位置を指定する。

ルール3：要素ごとに位置を指定する

GPT Image 2 は空間言語をよく理解しますが、それは指定された場合に限ります。

曖昧：a logo and some text on the image 正確：a circular logo in the top-left corner, three lines of text in the bottom-right corner

確実に効く空間ボキャブラリー：

top-left / top-right / top-center / bottom-left / bottom-right / bottom-center
centered / vertically centered / horizontally centered
foreground / midground / background
above the headline / below the subhead / next to the icon

3つ以上の要素がある場合、すべての要素に位置を指定する。例外なし。

ルール4：否定の制約を入れる — やってほしくないことを明示

拡散モデルには明示的な「ネガティブプロンプト」フィールドがありましたが、GPT Image 2 にはありません。ただし平易な制約文は理解します：

... no text on the bottle itself,
no shadows on the background,
no other objects in frame,
no watermark.

アンチパターンの明示は特に有効：

ウォーターマーク除去（no watermark, no logo overlay）
雑然とした背景の整理（solid plain background, no decorations）
余分な手や指の防止（hands clearly visible, anatomically correct）
過剰装飾の抑制（minimalist, no extra ornaments）

5回の再生成のうち1回は、10秒かけて「やってほしくないこと」を書くだけで省けます。

ルール5：形容詞ではなく具体的なリファレンスでスタイルを固定する

「美しい」「魅力的」「素晴らしい」はモデルに何も伝えません。固有名詞のリファレンスは全部伝えます。

弱い：a beautiful illustration of a girl 強い：a Studio Ghibli style illustration of a girl, soft watercolor textures, warm color palette

効果の高いスタイルアンカー：

カテゴリ	アンカー例
イラスト	Studio Ghibli、Pixar、Cartoon Network 2010s、Adventure Time、原神（Genshin Impact）
写真	Wes Anderson、Annie Leibovitz、National Geographic、Vogue エディトリアル、Kodak Portra 400
絵画	モネ印象派、ゴッホ後期印象派、ホッパー写実主義、浮世絵
モダン	Y2K、ヴェイパーウェイヴ、ブルータリズム、Memphis パターン、Bauhaus
シネマティック	Wong Kar-wai、Christopher Nolan、A24 カラーパレット、Blade Runner 2049

モデルはこれらのリファレンスを知っています。使いましょう。

ルール6：カメラと照明をリアル写真用語で固定する

フォトリアルな出力では、アマチュアとプロを分けるのはカメラ用語です。

初心者：a realistic photo of a coffee cup on a desk プロ：

A coffee cup on a wooden desk, shot on Sony A7R IV, 35mm f/2.8 lens,
shallow depth of field, soft natural window light from the left,
golden hour color temperature, slight film grain.

リアリズムを明確に底上げするカメラ用語：

レンズ：35mm、50mm、85mm portrait lens、wide-angle 24mm、macro 100mm
絞り：f/1.4、f/2.8、shallow depth of field、deep focus
ボディ：Sony A7R IV、Canon EOS R5、Leica M11、Hasselblad medium format
光：golden hour、blue hour、softbox studio lighting、Rembrandt lighting、rim light
フィルム：Kodak Portra 400、Fujifilm Velvia、Ilford HP5 black and white

これらは飾り言葉ではなく、モデルが解釈できる 技術指示 です。

ルール7：フル再生成ではなく directed edit で反復する

多くのユーザーが API 予算の70%をここで無駄にしています。

悪いワークフロー：

生成 → 不満 → プロンプト微調整 → ゼロから再生成 → 構図全変更 → 泣く →
5回繰り返す。

良いワークフロー：

生成 → 不満 → "in this image, change [X] to [Y],
keep everything else identical" → 完了。

GPT Image 2 は他の部分を保ったままマルチターンの指向性編集をサポートします。これが最大のコスト削減ポイントです。

効く directed edit の例：

"Change the model's jacket from navy to beige. Keep face,
background, lighting, and pose unchanged."

"Replace the headline text with 'Spring Sale'. Keep all other
text, layout, and styling identical."

"Remove the watermark in the bottom-right corner. Keep
everything else exactly the same."

呪文は 「keep everything else identical」。省略しないこと。

7つすべてを使った完成形プロンプト例

以下は EC ヒーロー画像向けに7ルールをすべて使ったプロンプトです。

A white stainless steel insulated water bottle, standing upright
on a beige linen tablecloth, with soft window light from the left
at 45 degrees, premium minimalist product photography style.

Top-left red rectangular badge reads "Limited 50% Off",
top-right gold circular badge reads "24h Hot/Cold",
below the bottle bold black headline reads "Daily Commute Companion",
bottom-center small text reads "Tap to Shop".

Shot on Sony A7R IV, 50mm f/2.8 lens, shallow depth of field,
clean composition, no other objects in frame, no watermarks,
1:1 aspect ratio.

このタイプのプロンプトは、曖昧なプロンプトで5〜7回かかっていたところを、1〜2回で使える結果を出してくれます。

GPT Image 2 プロンプトのアンチパターン

今すぐやめるべきことの簡易リスト：

アンチパターン	失敗する理由	代わりにすべきこと
`masterpiece, 8k, ultra detailed` のキーワード詰め込み	GPT Image 2 にはノイズ	リアルなスタイルアンカーを使う（ルール5）
カンマなしの長い一文	モデルが構造を解析しづらい	5要素構造を使う（ルール1）
「セール見出し」のように概念で記述	正しい文字列が出ない	必ず正確な文字列を引用符で（ルール2）
意図のない多言語混在プロンプト	どの言語でレンダリングするかでモデルが混乱	指示は1言語に統一、画像上テキストはターゲット言語で引用
50行のメガプロンプト	約15指定を超えると効果が逓減	10〜15指定で抑え、リファインは directed edit
アスペクト比の指定なし	モデルのデフォルトが場合により変わる	必ず `1:1 / 16:9 / 9:16 aspect ratio` で締める

生成ボタンを押す前のクイックチェックリスト

GPT Image 2 にプロンプトを送る前に、以下を1分でチェック：

5要素（主題、シーン、スタイル、テキスト、カメラ）が揃っているか？
画像上のテキストはすべて引用符でくくっているか？
すべての要素に位置を指定しているか？
やってほしくないことを除外しているか？
スタイルは実在のリファレンスでアンカーされているか？
カメラと照明が指定されているか（写真の場合）？
末尾にアスペクト比があるか？

7項目すべてにチェックが入れば、命中率は約90%まで跳ね上がります。

書く手間自体をスキップしたい？

そのままコピペで使える事前作成済みの GPT Image 2 プロンプトが欲しい方は、gpt-image2.art/explore を覗いてみてください。EC、SNS、キャラクターデザイン、写真、インフォグラフィック、ポスターなど、ユースケース別に整理され、各サンプル画像にはソースプロンプトが添えられています。

すべての記事