
Guida ai prompt per GPT Image 2: 7 regole per il 90% di successo
Una guida pratica alla scrittura dei prompt per GPT Image 2 nata da 200+ generazioni. Le 7 regole, struttura, parole chiave e anti-pattern per il successo al primo colpo nella generazione di immagini con IA.
Se hai provato GPT Image 2 e hai avuto l'impressione che ignori metà del tuo prompt, il problema non è quasi mai il modello — è il modo in cui il prompt è scritto. Dopo aver lanciato 200+ generazioni nella generazione di immagini con IA e confrontato una matrice di hit-rate, sono sempre le stesse 7 regole a fare la differenza tra "successo al primo colpo" e "cinque retry prima di mollare".
Questa è una guida pratica ai prompt per GPT Image 2. Ogni regola qui sotto è qualcosa che puoi applicare al tuo prossimo prompt in 30 secondi.
Perché la maggior parte dei prompt GPT Image 2 fallisce
Tre pattern causano circa l'80% dei fallimenti dei prompt:
- Trattare GPT Image 2 come Stable Diffusion — riempire il prompt con una zuppa di keyword tipo
masterpiece, 8k, ultra detailed, high quality. Per GPT Image 2 questi token sono rumore. - Scrivere frasi-fiume senza struttura — una lunga frase in inglese/italiano con tutto mescolato. GPT Image 2 legge la struttura; la struttura legge indietro.
- Dimenticare di virgolettare il contenuto testuale — dire
the headline says limited offerè molto meno affidabile che direthe headline says "Limited Offer". Le virgolette cambiano tutto.
Se sistemi solo questi tre, il tasso di successo raddoppia. Sotto le 7 regole in dettaglio.
Regola 1: Struttura il prompt — soggetto, scena, stile, testo, camera
Un prompt GPT Image 2 affidabile ha 5 componenti ordinati:
| Componente | Cosa va qui | Esempio |
|---|---|---|
| Soggetto | L'oggetto o personaggio principale | a white stainless steel water bottle |
| Scena | Sfondo e ambiente | on a beige linen tablecloth, soft indoor light |
| Stile | Mood visivo e riferimento | editorial product photography, premium feel |
| Testo | Tutto il testo sull'immagine tra virgolette | top-left red badge: "50% off" |
| Camera | Obiettivo, angolo, illuminazione | 45-degree side light, shallow depth of field |
Cuciscili insieme con virgole. Un prompt completo si presenta così:
A white stainless steel water bottle, on a beige linen tablecloth,
soft indoor light, editorial product photography, premium feel,
top-left red badge "50% off", bottom black bold text
"Daily Commute Companion", 45-degree side light, shallow depth of field.Questa struttura funziona perché GPT Image 2 è un language model — segue l'ordine narrativo. Ordine casuale = output casuale.
Regola 2: Virgoletta ogni pezzo di testo sull'immagine
Questa è la regola con la leva più alta. La differenza tra:
❌ the headline says limited offer
✅ the headline reads "Limited Offer"
È un gap di 30-40 punti percentuali sul tasso di accuratezza del rendering del testo. Perché? Le virgolette dicono al modello "questa stringa esatta è quello che renderizzi", invece di "descrivi il concetto di un'offerta limitata".
Lo stesso vale per il testo non latino:
❌ 标题写限时五折
✅ 标题写 "限时五折"
Quando hai più elementi testuali:
Headline at top reads "2026 Spring Collection",
subhead reads "30% Off Sitewide",
bottom-left small text reads "Code: SPRING30",
right-side vertical text reads "Limited Time".Ogni pezzo virgolettato, ogni posizione specificata.
Regola 3: Specifica la posizione di ogni elemento
GPT Image 2 capisce bene il linguaggio spaziale — ma solo se glielo dai.
Vago: a logo and some text on the image
Preciso: a circular logo in the top-left corner, three lines of text in the bottom-right corner
Vocabolario spaziale che funziona in modo affidabile:
top-left / top-right / top-center / bottom-left / bottom-right / bottom-centercentered / vertically centered / horizontally centeredforeground / midground / backgroundabove the headline / below the subhead / next to the icon
Quando hai 3+ elementi, ogni elemento ha la sua posizione. Senza eccezioni.
Regola 4: Limita il negativo — di' cosa NON vuoi
I modelli diffusion avevano campi "negative prompt" espliciti. GPT Image 2 no, ma capisce i vincoli in linguaggio naturale:
... no text on the bottle itself,
no shadows on the background,
no other objects in frame,
no watermark.Gli anti-pattern sono particolarmente utili per:
- Rimuovere watermark (
no watermark, no logo overlay) - Pulire sfondi affollati (
solid plain background, no decorations) - Evitare mani o dita in più (
hands clearly visible, anatomically correct) - Prevenire sovra-decorazioni (
minimalist, no extra ornaments)
Circa 1 retry su 5 si può eliminare spendendo 10 secondi a scrivere cosa non vuoi.
Regola 5: Ancora lo stile a un riferimento, non ad aggettivi
"Bello", "magnifico", "stupendo" non dicono niente al modello. I riferimenti ancorati gli dicono tutto.
Debole: a beautiful illustration of a girl
Forte: a Studio Ghibli style illustration of a girl, soft watercolor textures, warm color palette
Ancore di stile ad alta leva:
| Categoria | Esempi di ancore |
|---|---|
| Illustrazione | Studio Ghibli, Pixar, Cartoon Network anni 2010, Adventure Time, Genshin Impact |
| Fotografia | Wes Anderson, Annie Leibovitz, National Geographic, editoriale Vogue, Kodak Portra 400 |
| Pittura | Impressionismo di Monet, post-impressionismo di Van Gogh, realismo di Hopper, ukiyo-e |
| Moderno | Estetica Y2K, vaporwave, design brutalista, pattern Memphis, Bauhaus |
| Cinematografico | Wong Kar-wai, Christopher Nolan, palette dei film A24, Blade Runner 2049 |
Il modello conosce questi riferimenti. Usali.
Regola 6: Fissa camera e illuminazione in termini di fotografia reale
Per output fotorealistici, la differenza tra dilettante e pro è il vocabolario fotografico.
Principiante: a realistic photo of a coffee cup on a desk
Pro:
A coffee cup on a wooden desk, shot on Sony A7R IV, 35mm f/2.8 lens,
shallow depth of field, soft natural window light from the left,
golden hour color temperature, slight film grain.Termini fotografici che dimostrabilmente migliorano il realismo:
- Obiettivo:
35mm,50mm,85mm portrait lens,wide-angle 24mm,macro 100mm - Apertura:
f/1.4,f/2.8,shallow depth of field,deep focus - Corpo macchina:
Sony A7R IV,Canon EOS R5,Leica M11,Hasselblad medium format - Luce:
golden hour,blue hour,softbox studio lighting,Rembrandt lighting,rim light - Pellicola:
Kodak Portra 400,Fujifilm Velvia,Ilford HP5 black and white
Non sono fronzoli — sono istruzioni tecniche che il modello sa interpretare.
Regola 7: Itera con modifiche guidate, non con rigenerazioni complete
Qui la maggior parte degli utenti spreca il 70% del budget API.
Workflow sbagliato:
Genera → non perfetto → modifica prompt → rigenera da capo → la composizione
cambia → piangi → ripeti 5 volte.Workflow giusto:
Genera → non perfetto → "in this image, change [X] to [Y],
keep everything else identical" → fatto.GPT Image 2 supporta l'editing guidato multi-turn che preserva il resto dell'immagine. È il suo più grande risparmio di costi.
Esempi di prompt di editing guidato efficaci:
"Change the model's jacket from navy to beige. Keep face,
background, lighting, and pose unchanged."
"Replace the headline text with 'Spring Sale'. Keep all other
text, layout, and styling identical."
"Remove the watermark in the bottom-right corner. Keep
everything else exactly the same."La frase "keep everything else identical" è la formula magica. Non saltarla.
Mettiamo tutto insieme: un prompt reale completo
Ecco un prompt che usa tutte e 7 le regole insieme. È per una hero image e-commerce:
A white stainless steel insulated water bottle, standing upright
on a beige linen tablecloth, with soft window light from the left
at 45 degrees, premium minimalist product photography style.
Top-left red rectangular badge reads "Limited 50% Off",
top-right gold circular badge reads "24h Hot/Cold",
below the bottle bold black headline reads "Daily Commute Companion",
bottom-center small text reads "Tap to Shop".
Shot on Sony A7R IV, 50mm f/2.8 lens, shallow depth of field,
clean composition, no other objects in frame, no watermarks,
1:1 aspect ratio.Questo tipo di prompt produce di solito un risultato usabile al primo o secondo tentativo, invece dei 5-7 retry che ti servirebbero con un prompt vago.
Anti-pattern comuni nei prompt GPT Image 2
Una breve lista di cose da smettere di fare subito:
| Anti-pattern | Perché fallisce | Cosa fare invece |
|---|---|---|
Keyword stuffing tipo masterpiece, 8k, ultra detailed | Per GPT Image 2 è rumore | Usa ancore di stile reali (Regola 5) |
| Singola frase-fiume senza virgole | Difficile per il modello parsare la struttura | Usa la struttura a 5 componenti (Regola 1) |
Descrivere il testo come concetto (a sale headline) | Non renderizzerà le parole giuste | Virgoletta sempre la stringa esatta (Regola 2) |
| Prompt in lingue miste senza intenzione | Il modello si confonde su quale lingua renderizzare | Resta in una lingua per le istruzioni, virgoletta la lingua target per il testo nell'immagine |
| Mega-prompt da 50 righe | Rendimenti decrescenti oltre le ~15 specifiche | Tetto a 10-15 specifiche, usa modifiche guidate per le rifiniture |
| Nessuna menzione del rapporto d'aspetto | Il default del modello varia | Chiudi sempre con 1:1 / 16:9 / 9:16 aspect ratio |
Checklist veloce prima di premere Genera
Prima di inviare qualsiasi prompt GPT Image 2, passa in rassegna:
- Ha tutti e 5 i componenti (soggetto, scena, stile, testo, camera)?
- Ogni pezzo di testo sull'immagine è virgolettato?
- Ogni elemento ha una posizione specificata?
- Ho escluso quello che non voglio?
- Lo stile è ancorato a un riferimento reale?
- Camera e illuminazione sono specificate (per la foto)?
- Il rapporto d'aspetto è alla fine?
Se tutte e 7 le caselle sono spuntate, il tuo tasso di successo schizza al ~90%.
Vuoi saltare del tutto la scrittura?
Se vuoi prompt GPT Image 2 pre-scritti da copia-incollare direttamente, sfoglia gpt-image2.art/explore — ogni immagine d'esempio ha il prompt sorgente visibile, organizzato per caso d'uso (e-commerce, social media, character design, fotografia, infografiche, poster).
Approfondimenti
Altri articoli

GPT Image 2 vs Nano Banana 2 vs Midjourney v7 (2026)
GPT Image 2 vs Nano Banana 2 vs Midjourney v7: quale modello di AI image generation vince per testi, poster, foto e concept art? Una guida pratica per il 2026.

È possibile utilizzare GPT Image 2 per scopi commerciali? Guida al copyright
Guida completa all'uso commerciale di GPT Image 2: permessi, proprietà del copyright, regole per Amazon/Etsy/Shopify/TikTok e come pubblicare immagini AI in sicurezza.

GPT Image 2 Style Library: 12 prompt di stili artistici pronti all'uso
Una libreria curata di stili per GPT Image 2 con 12 stili artistici popolari — Studio Ghibli, cyberpunk, Wes Anderson e altri. Ogni stile ha il suo prompt copia-incolla.
Generate your first image with GPT Image 2 — right now
Reliable non-Latin text rendering, directed editing, and 50+ ready-to-use prompts. No downloads — just open in your browser.