Guida ai prompt per GPT Image 2: 7 regole per il 90% di successo
2026/04/23

Guida ai prompt per GPT Image 2: 7 regole per il 90% di successo

Una guida pratica alla scrittura dei prompt per GPT Image 2 nata da 200+ generazioni. Le 7 regole, struttura, parole chiave e anti-pattern per il successo al primo colpo nella generazione di immagini con IA.

Se hai provato GPT Image 2 e hai avuto l'impressione che ignori metà del tuo prompt, il problema non è quasi mai il modello — è il modo in cui il prompt è scritto. Dopo aver lanciato 200+ generazioni nella generazione di immagini con IA e confrontato una matrice di hit-rate, sono sempre le stesse 7 regole a fare la differenza tra "successo al primo colpo" e "cinque retry prima di mollare".

Questa è una guida pratica ai prompt per GPT Image 2. Ogni regola qui sotto è qualcosa che puoi applicare al tuo prossimo prompt in 30 secondi.

Perché la maggior parte dei prompt GPT Image 2 fallisce

Tre pattern causano circa l'80% dei fallimenti dei prompt:

  1. Trattare GPT Image 2 come Stable Diffusion — riempire il prompt con una zuppa di keyword tipo masterpiece, 8k, ultra detailed, high quality. Per GPT Image 2 questi token sono rumore.
  2. Scrivere frasi-fiume senza struttura — una lunga frase in inglese/italiano con tutto mescolato. GPT Image 2 legge la struttura; la struttura legge indietro.
  3. Dimenticare di virgolettare il contenuto testuale — dire the headline says limited offer è molto meno affidabile che dire the headline says "Limited Offer". Le virgolette cambiano tutto.

Se sistemi solo questi tre, il tasso di successo raddoppia. Sotto le 7 regole in dettaglio.

Regola 1: Struttura il prompt — soggetto, scena, stile, testo, camera

Un prompt GPT Image 2 affidabile ha 5 componenti ordinati:

ComponenteCosa va quiEsempio
SoggettoL'oggetto o personaggio principalea white stainless steel water bottle
ScenaSfondo e ambienteon a beige linen tablecloth, soft indoor light
StileMood visivo e riferimentoeditorial product photography, premium feel
TestoTutto il testo sull'immagine tra virgolettetop-left red badge: "50% off"
CameraObiettivo, angolo, illuminazione45-degree side light, shallow depth of field

Cuciscili insieme con virgole. Un prompt completo si presenta così:

A white stainless steel water bottle, on a beige linen tablecloth,
soft indoor light, editorial product photography, premium feel,
top-left red badge "50% off", bottom black bold text
"Daily Commute Companion", 45-degree side light, shallow depth of field.

Questa struttura funziona perché GPT Image 2 è un language model — segue l'ordine narrativo. Ordine casuale = output casuale.

Regola 2: Virgoletta ogni pezzo di testo sull'immagine

Questa è la regola con la leva più alta. La differenza tra:

the headline says limited offerthe headline reads "Limited Offer"

È un gap di 30-40 punti percentuali sul tasso di accuratezza del rendering del testo. Perché? Le virgolette dicono al modello "questa stringa esatta è quello che renderizzi", invece di "descrivi il concetto di un'offerta limitata".

Lo stesso vale per il testo non latino:

❌ 标题写限时五折 ✅ 标题写 "限时五折"

Quando hai più elementi testuali:

Headline at top reads "2026 Spring Collection",
subhead reads "30% Off Sitewide",
bottom-left small text reads "Code: SPRING30",
right-side vertical text reads "Limited Time".

Ogni pezzo virgolettato, ogni posizione specificata.

Regola 3: Specifica la posizione di ogni elemento

GPT Image 2 capisce bene il linguaggio spaziale — ma solo se glielo dai.

Vago: a logo and some text on the image Preciso: a circular logo in the top-left corner, three lines of text in the bottom-right corner

Vocabolario spaziale che funziona in modo affidabile:

  • top-left / top-right / top-center / bottom-left / bottom-right / bottom-center
  • centered / vertically centered / horizontally centered
  • foreground / midground / background
  • above the headline / below the subhead / next to the icon

Quando hai 3+ elementi, ogni elemento ha la sua posizione. Senza eccezioni.

Regola 4: Limita il negativo — di' cosa NON vuoi

I modelli diffusion avevano campi "negative prompt" espliciti. GPT Image 2 no, ma capisce i vincoli in linguaggio naturale:

... no text on the bottle itself,
no shadows on the background,
no other objects in frame,
no watermark.

Gli anti-pattern sono particolarmente utili per:

  • Rimuovere watermark (no watermark, no logo overlay)
  • Pulire sfondi affollati (solid plain background, no decorations)
  • Evitare mani o dita in più (hands clearly visible, anatomically correct)
  • Prevenire sovra-decorazioni (minimalist, no extra ornaments)

Circa 1 retry su 5 si può eliminare spendendo 10 secondi a scrivere cosa non vuoi.

Regola 5: Ancora lo stile a un riferimento, non ad aggettivi

"Bello", "magnifico", "stupendo" non dicono niente al modello. I riferimenti ancorati gli dicono tutto.

Debole: a beautiful illustration of a girl Forte: a Studio Ghibli style illustration of a girl, soft watercolor textures, warm color palette

Ancore di stile ad alta leva:

CategoriaEsempi di ancore
IllustrazioneStudio Ghibli, Pixar, Cartoon Network anni 2010, Adventure Time, Genshin Impact
FotografiaWes Anderson, Annie Leibovitz, National Geographic, editoriale Vogue, Kodak Portra 400
PitturaImpressionismo di Monet, post-impressionismo di Van Gogh, realismo di Hopper, ukiyo-e
ModernoEstetica Y2K, vaporwave, design brutalista, pattern Memphis, Bauhaus
CinematograficoWong Kar-wai, Christopher Nolan, palette dei film A24, Blade Runner 2049

Il modello conosce questi riferimenti. Usali.

Regola 6: Fissa camera e illuminazione in termini di fotografia reale

Per output fotorealistici, la differenza tra dilettante e pro è il vocabolario fotografico.

Principiante: a realistic photo of a coffee cup on a desk Pro:

A coffee cup on a wooden desk, shot on Sony A7R IV, 35mm f/2.8 lens,
shallow depth of field, soft natural window light from the left,
golden hour color temperature, slight film grain.

Termini fotografici che dimostrabilmente migliorano il realismo:

  • Obiettivo: 35mm, 50mm, 85mm portrait lens, wide-angle 24mm, macro 100mm
  • Apertura: f/1.4, f/2.8, shallow depth of field, deep focus
  • Corpo macchina: Sony A7R IV, Canon EOS R5, Leica M11, Hasselblad medium format
  • Luce: golden hour, blue hour, softbox studio lighting, Rembrandt lighting, rim light
  • Pellicola: Kodak Portra 400, Fujifilm Velvia, Ilford HP5 black and white

Non sono fronzoli — sono istruzioni tecniche che il modello sa interpretare.

Regola 7: Itera con modifiche guidate, non con rigenerazioni complete

Qui la maggior parte degli utenti spreca il 70% del budget API.

Workflow sbagliato:

Genera → non perfetto → modifica prompt → rigenera da capo → la composizione
cambia → piangi → ripeti 5 volte.

Workflow giusto:

Genera → non perfetto → "in this image, change [X] to [Y],
keep everything else identical" → fatto.

GPT Image 2 supporta l'editing guidato multi-turn che preserva il resto dell'immagine. È il suo più grande risparmio di costi.

Esempi di prompt di editing guidato efficaci:

"Change the model's jacket from navy to beige. Keep face,
background, lighting, and pose unchanged."

"Replace the headline text with 'Spring Sale'. Keep all other
text, layout, and styling identical."

"Remove the watermark in the bottom-right corner. Keep
everything else exactly the same."

La frase "keep everything else identical" è la formula magica. Non saltarla.

Mettiamo tutto insieme: un prompt reale completo

Ecco un prompt che usa tutte e 7 le regole insieme. È per una hero image e-commerce:

A white stainless steel insulated water bottle, standing upright
on a beige linen tablecloth, with soft window light from the left
at 45 degrees, premium minimalist product photography style.

Top-left red rectangular badge reads "Limited 50% Off",
top-right gold circular badge reads "24h Hot/Cold",
below the bottle bold black headline reads "Daily Commute Companion",
bottom-center small text reads "Tap to Shop".

Shot on Sony A7R IV, 50mm f/2.8 lens, shallow depth of field,
clean composition, no other objects in frame, no watermarks,
1:1 aspect ratio.

Questo tipo di prompt produce di solito un risultato usabile al primo o secondo tentativo, invece dei 5-7 retry che ti servirebbero con un prompt vago.

Anti-pattern comuni nei prompt GPT Image 2

Una breve lista di cose da smettere di fare subito:

Anti-patternPerché fallisceCosa fare invece
Keyword stuffing tipo masterpiece, 8k, ultra detailedPer GPT Image 2 è rumoreUsa ancore di stile reali (Regola 5)
Singola frase-fiume senza virgoleDifficile per il modello parsare la strutturaUsa la struttura a 5 componenti (Regola 1)
Descrivere il testo come concetto (a sale headline)Non renderizzerà le parole giusteVirgoletta sempre la stringa esatta (Regola 2)
Prompt in lingue miste senza intenzioneIl modello si confonde su quale lingua renderizzareResta in una lingua per le istruzioni, virgoletta la lingua target per il testo nell'immagine
Mega-prompt da 50 righeRendimenti decrescenti oltre le ~15 specificheTetto a 10-15 specifiche, usa modifiche guidate per le rifiniture
Nessuna menzione del rapporto d'aspettoIl default del modello variaChiudi sempre con 1:1 / 16:9 / 9:16 aspect ratio

Checklist veloce prima di premere Genera

Prima di inviare qualsiasi prompt GPT Image 2, passa in rassegna:

  • Ha tutti e 5 i componenti (soggetto, scena, stile, testo, camera)?
  • Ogni pezzo di testo sull'immagine è virgolettato?
  • Ogni elemento ha una posizione specificata?
  • Ho escluso quello che non voglio?
  • Lo stile è ancorato a un riferimento reale?
  • Camera e illuminazione sono specificate (per la foto)?
  • Il rapporto d'aspetto è alla fine?

Se tutte e 7 le caselle sono spuntate, il tuo tasso di successo schizza al ~90%.

Vuoi saltare del tutto la scrittura?

Se vuoi prompt GPT Image 2 pre-scritti da copia-incollare direttamente, sfoglia gpt-image2.art/explore — ogni immagine d'esempio ha il prompt sorgente visibile, organizzato per caso d'uso (e-commerce, social media, character design, fotografia, infografiche, poster).

Approfondimenti

Free to try

Generate your first image with GPT Image 2 — right now

Reliable non-Latin text rendering, directed editing, and 50+ ready-to-use prompts. No downloads — just open in your browser.