Guide d'écriture de prompts GPT Image 2 : 7 règles pour 90 % de taux de réussite
2026/04/23

Guide d'écriture de prompts GPT Image 2 : 7 règles pour 90 % de taux de réussite

Un guide pratique d'écriture de prompts GPT Image 2 issu de 200+ générations. Les 7 règles, la structure, les mots-clés et les anti-patterns pour réussir du premier coup.

Si vous avez essayé GPT Image 2 et eu l'impression qu'il ignorait la moitié de votre prompt, le problème n'est presque jamais le modèle — c'est la manière dont le prompt est écrit. Après avoir lancé plus de 200 générations et comparé une matrice de taux de réussite, les mêmes 7 règles expliquent la différence entre "succès au premier essai" et "cinq retries jusqu'à abandonner".

Voici un guide pratique d'écriture de prompts GPT Image 2. Chaque règle ci-dessous est quelque chose que vous pouvez appliquer à votre prochain prompt en 30 secondes.

Pourquoi la plupart des prompts GPT Image 2 échouent

Trois patterns expliquent environ 80 % des échecs de prompts :

  1. Traiter GPT Image 2 comme Stable Diffusion — bourrer le prompt avec une soupe de mots-clés masterpiece, 8k, ultra detailed, high quality. Ces tokens sont du bruit pour GPT Image 2.
  2. Écrire des phrases interminables sans structure — une longue phrase en anglais/français avec tout mélangé. GPT Image 2 lit la structure ; la structure se relit.
  3. Oublier de mettre le texte entre guillemets — dire the headline says limited offer est bien moins fiable que the headline says "Limited Offer". Les guillemets changent tout.

Si vous ne corrigez que ces trois points, votre taux de réussite double. Ci-dessous, les 7 règles en détail.

Règle 1 : Structurez votre prompt — sujet, scène, style, texte, caméra

Un prompt GPT Image 2 fiable comporte 5 composants ordonnés :

ComposantCe qui va iciExemple
SujetL'objet ou le personnage principala white stainless steel water bottle
ScèneArrière-plan et environnementon a beige linen tablecloth, soft indoor light
StyleAmbiance visuelle et référenceeditorial product photography, premium feel
TexteTout texte sur l'image entre guillemetstop-left red badge: "50% off"
CaméraObjectif, angle, éclairage45-degree side light, shallow depth of field

Assemblez-les avec des virgules. Un prompt complet ressemble à :

A white stainless steel water bottle, on a beige linen tablecloth,
soft indoor light, editorial product photography, premium feel,
top-left red badge "50% off", bottom black bold text
"Daily Commute Companion", 45-degree side light, shallow depth of field.

Cette structure fonctionne parce que GPT Image 2 est un modèle de langage — il suit l'ordre narratif. Ordre aléatoire = rendu aléatoire.

Règle 2 : Mettez entre guillemets chaque morceau de texte sur l'image

C'est la règle au plus fort levier. La différence entre :

the headline says limited offerthe headline reads "Limited Offer"

C'est un écart de 30 à 40 points de pourcentage de taux de réussite sur la précision du rendu de texte. Pourquoi ? Les guillemets disent au modèle "voici la chaîne exacte à rendre", au lieu de "décris le concept d'offre limitée".

Idem pour le texte non latin :

❌ 标题写限时五折 ✅ 标题写 "限时五折"

Quand vous avez plusieurs éléments textuels :

Headline at top reads "2026 Spring Collection",
subhead reads "30% Off Sitewide",
bottom-left small text reads "Code: SPRING30",
right-side vertical text reads "Limited Time".

Chaque morceau entre guillemets, chaque emplacement spécifié.

Règle 3 : Spécifiez l'emplacement de chaque élément

GPT Image 2 comprend bien le langage spatial — mais seulement si vous le lui donnez.

Vague : a logo and some text on the image Précis : a circular logo in the top-left corner, three lines of text in the bottom-right corner

Vocabulaire spatial qui fonctionne de manière fiable :

  • top-left / top-right / top-center / bottom-left / bottom-right / bottom-center
  • centered / vertically centered / horizontally centered
  • foreground / midground / background
  • above the headline / below the subhead / next to the icon

Quand vous avez 3+ éléments, chaque élément obtient un emplacement. Pas d'exception.

Règle 4 : Contraignez le négatif — dites ce que vous NE voulez PAS

Les modèles de diffusion avaient des champs explicites "prompt négatif". GPT Image 2 n'en a pas, mais il comprend les contraintes en langage clair :

... no text on the bottle itself,
no shadows on the background,
no other objects in frame,
no watermark.

Les anti-patterns sont particulièrement utiles pour :

  • Supprimer les watermarks (no watermark, no logo overlay)
  • Nettoyer les fonds chargés (solid plain background, no decorations)
  • Éviter les mains ou doigts en trop (hands clearly visible, anatomically correct)
  • Prévenir la sur-décoration (minimalist, no extra ornaments)

Environ 1 retry sur 5 peut être éliminé en passant 10 secondes à écrire ce que vous ne voulez pas.

Règle 5 : Ancrez le style avec une référence, pas des adjectifs

"Beau" "stupéfiant" "incroyable" ne disent rien au modèle. Les références ancrées lui disent tout.

Faible : a beautiful illustration of a girl Fort : a Studio Ghibli style illustration of a girl, soft watercolor textures, warm color palette

Ancrages stylistiques à fort effet de levier :

CatégorieExemples d'ancrage
IllustrationStudio Ghibli, Pixar, Cartoon Network 2010s, Adventure Time, Genshin Impact
PhotographieWes Anderson, Annie Leibovitz, National Geographic, Vogue editorial, Kodak Portra 400
PeintureMonet impressionnisme, Van Gogh post-impressionnisme, Hopper réalisme, ukiyo-e
ModerneY2K aesthetic, vaporwave, brutalist design, Memphis pattern, Bauhaus
CinématographiqueWong Kar-wai, Christopher Nolan, A24 film palette, Blade Runner 2049

Le modèle connaît ces références. Utilisez-les.

Règle 6 : Verrouillez la caméra et l'éclairage en termes de vraie photographie

Pour les rendus photoréalistes, la différence entre amateur et pro est le vocabulaire caméra.

Débutant : a realistic photo of a coffee cup on a desk Pro :

A coffee cup on a wooden desk, shot on Sony A7R IV, 35mm f/2.8 lens,
shallow depth of field, soft natural window light from the left,
golden hour color temperature, slight film grain.

Termes caméra qui améliorent démontrablement le réalisme :

  • Objectif : 35mm, 50mm, 85mm portrait lens, wide-angle 24mm, macro 100mm
  • Ouverture : f/1.4, f/2.8, shallow depth of field, deep focus
  • Boîtier : Sony A7R IV, Canon EOS R5, Leica M11, Hasselblad medium format
  • Lumière : golden hour, blue hour, softbox studio lighting, Rembrandt lighting, rim light
  • Pellicule : Kodak Portra 400, Fujifilm Velvia, Ilford HP5 black and white

Ce ne sont pas des fioritures — ce sont des instructions techniques que le modèle sait interpréter.

Règle 7 : Itérez avec des éditions dirigées, pas des régénérations complètes

C'est là où la plupart des utilisateurs gaspillent 70 % de leur budget API.

Mauvais workflow :

Générer → pas parfait → ajuster le prompt → régénérer depuis zéro → la composition
change → pleurer → répéter 5 fois.

Bon workflow :

Générer → pas parfait → "in this image, change [X] to [Y],
keep everything else identical" → fait.

GPT Image 2 prend en charge l'édition dirigée multi-tours qui préserve le reste de l'image. C'est sa plus grosse économie de coût.

Exemples de prompts d'édition dirigée efficaces :

"Change the model's jacket from navy to beige. Keep face,
background, lighting, and pose unchanged."

"Replace the headline text with 'Spring Sale'. Keep all other
text, layout, and styling identical."

"Remove the watermark in the bottom-right corner. Keep
everything else exactly the same."

La phrase "keep everything else identical" est l'incantation magique. Ne la sautez pas.

Tout réunir : un prompt réel complet

Voici un prompt qui utilise les 7 règles à la fois. C'est pour une image de couverture e-commerce :

A white stainless steel insulated water bottle, standing upright
on a beige linen tablecloth, with soft window light from the left
at 45 degrees, premium minimalist product photography style.

Top-left red rectangular badge reads "Limited 50% Off",
top-right gold circular badge reads "24h Hot/Cold",
below the bottle bold black headline reads "Daily Commute Companion",
bottom-center small text reads "Tap to Shop".

Shot on Sony A7R IV, 50mm f/2.8 lens, shallow depth of field,
clean composition, no other objects in frame, no watermarks,
1:1 aspect ratio.

Ce genre de prompt produit généralement un résultat utilisable au premier ou deuxième essai, au lieu des 5-7 retries qu'il vous faudrait avec un prompt vague.

Anti-patterns courants des prompts GPT Image 2

Une courte liste de choses à arrêter de faire immédiatement :

Anti-patternPourquoi ça échoueQuoi faire à la place
Bourrage de mots-clés masterpiece, 8k, ultra detailedDu bruit pour GPT Image 2Utiliser de vrais ancrages stylistiques (Règle 5)
Phrase unique interminable sans virgulesDifficile pour le modèle d'analyser la structureUtiliser la structure à 5 composants (Règle 1)
Décrire le texte en concept (a sale headline)Ne rend pas les bons motsToujours mettre la chaîne exacte entre guillemets (Règle 2)
Prompts en langues mixtes sans intentionLe modèle s'embrouille sur la langue à rendreRestez dans une langue pour les instructions, mettez entre guillemets la langue cible pour le texte sur l'image
Méga-prompts de 50 lignesRendements décroissants au-delà d'environ 15 spécificationsPlafonnez à 10-15 spécifications, utilisez des éditions dirigées pour les ajustements
Aucune mention du ratio d'aspectLes défauts du modèle varientToujours finir par 1:1 / 16:9 / 9:16 aspect ratio

Checklist rapide avant de cliquer sur Générer

Avant de soumettre tout prompt GPT Image 2, passez en revue :

  • A-t-il les 5 composants (sujet, scène, style, texte, caméra) ?
  • Chaque morceau de texte sur l'image est-il entre guillemets ?
  • Chaque élément a-t-il un emplacement spécifié ?
  • Ai-je exclu ce que je ne veux pas ?
  • Le style est-il ancré à une vraie référence ?
  • La caméra et l'éclairage sont-ils spécifiés (pour de la photo) ?
  • Le ratio d'aspect est-il à la fin ?

Si les 7 cases sont cochées, votre taux de réussite bondit à ~90 %.

Vous voulez sauter l'écriture entièrement ?

Si vous voulez des prompts GPT Image 2 pré-écrits que vous pouvez copier-coller directement, parcourez gpt-image2.art/explore — chaque image d'exemple a son prompt source visible, organisé par cas d'usage (e-commerce, réseaux sociaux, design de personnages, photographie, infographies, posters).

Pour aller plus loin

Free to try

Generate your first image with GPT Image 2 — right now

Reliable non-Latin text rendering, directed editing, and 50+ ready-to-use prompts. No downloads — just open in your browser.