
Guia de Prompts do GPT Image 2: 7 Regras para 90% de Acerto
Um guia prático de escrita de prompts para GPT Image 2 a partir de mais de 200 gerações. As 7 regras, estrutura, palavras-chave e anti-padrões para acertar de primeira.
Se você experimentou o GPT Image 2 e sentiu que ele ignora metade do seu prompt, o problema quase nunca é o modelo — é a forma como o prompt foi escrito. Depois de rodar mais de 200 gerações e comparar uma matriz de taxa de acerto, as mesmas 7 regras explicam a diferença entre "sucesso na primeira tentativa" e "cinco retentativas até desistir".
Este é um guia prático de escrita de prompts para geração de imagens com IA usando o GPT Image 2. Toda regra abaixo é algo que você pode aplicar ao seu próximo prompt em 30 segundos.
Por que a maioria dos prompts do GPT Image 2 falha
Três padrões causam cerca de 80% das falhas de prompt:
- Tratar o GPT Image 2 como Stable Diffusion — enchendo o prompt com sopa de palavras como
masterpiece, 8k, ultra detailed, high quality. Esses tokens são ruído para o GPT Image 2. - Escrever frases corridas sem estrutura — uma frase longa em inglês/português com tudo misturado. O GPT Image 2 lê estrutura; estrutura responde com clareza.
- Esquecer de colocar texto entre aspas — dizer
the headline says limited offeré bem menos confiável do que dizerthe headline says "Limited Offer". As aspas mudam tudo.
Se você consertar só esses três, sua taxa de acerto dobra. Abaixo estão as 7 regras em detalhe.
Regra 1: Estruture seu prompt — sujeito, cena, estilo, texto, câmera
Um prompt confiável para GPT Image 2 tem 5 componentes ordenados:
| Componente | O que vai aqui | Exemplo |
|---|---|---|
| Sujeito | O objeto ou personagem principal | a white stainless steel water bottle |
| Cena | Fundo e ambiente | on a beige linen tablecloth, soft indoor light |
| Estilo | Atmosfera visual e referência | editorial product photography, premium feel |
| Texto | Todo texto na imagem entre aspas | top-left red badge: "50% off" |
| Câmera | Lente, ângulo, iluminação | 45-degree side light, shallow depth of field |
Costure tudo com vírgulas. Um prompt completo fica assim:
A white stainless steel water bottle, on a beige linen tablecloth,
soft indoor light, editorial product photography, premium feel,
top-left red badge "50% off", bottom black bold text
"Daily Commute Companion", 45-degree side light, shallow depth of field.Essa estrutura funciona porque o GPT Image 2 é um modelo de linguagem — ele segue ordem narrativa. Ordem aleatória = saída aleatória.
Regra 2: Coloque entre aspas cada trecho de texto da imagem
Esta é a regra de maior alavancagem. A diferença entre:
the headline says limited offer (errado)
the headline reads "Limited Offer" (certo)
É um gap de 30-40 pontos percentuais na precisão de renderização de texto. Por quê? As aspas dizem ao modelo "esta string exata é o que você deve renderizar", em vez de "descreva o conceito de oferta limitada".
O mesmo vale para texto não-latino:
o título diz oferta limitada (errado)
o título diz "Oferta Limitada" (certo)
Quando você tem múltiplos elementos de texto:
Headline at top reads "2026 Spring Collection",
subhead reads "30% Off Sitewide",
bottom-left small text reads "Code: SPRING30",
right-side vertical text reads "Limited Time".Cada trecho entre aspas, cada localização especificada.
Regra 3: Especifique localização para cada elemento
O GPT Image 2 entende bem linguagem espacial — mas só se você a fornecer.
Vago: a logo and some text on the image
Preciso: a circular logo in the top-left corner, three lines of text in the bottom-right corner
Vocabulário espacial que funciona com confiabilidade:
top-left / top-right / top-center / bottom-left / bottom-right / bottom-centercentered / vertically centered / horizontally centeredforeground / midground / backgroundabove the headline / below the subhead / next to the icon
Quando você tem 3+ elementos, cada elemento ganha uma localização. Sem exceções.
Regra 4: Restrinja o negativo — diga o que você NÃO quer
Modelos de difusão tinham campos explícitos de "negative prompt". O GPT Image 2 não tem, mas entende restrições em linguagem natural:
... no text on the bottle itself,
no shadows on the background,
no other objects in frame,
no watermark.Anti-padrões são especialmente úteis para:
- Remover marcas d'água (
no watermark, no logo overlay) - Limpar fundos cheios (
solid plain background, no decorations) - Evitar mãos ou dedos extras (
hands clearly visible, anatomically correct) - Prevenir excesso de decoração (
minimalist, no extra ornaments)
Cerca de 1 em 5 retentativas pode ser eliminada gastando 10 segundos escrevendo o que você não quer.
Regra 5: Ancore o estilo com uma referência, não com adjetivos
"Lindo", "incrível", "deslumbrante" não dizem nada ao modelo. Referências ancoradas dizem tudo.
Fraco: a beautiful illustration of a girl
Forte: a Studio Ghibli style illustration of a girl, soft watercolor textures, warm color palette
Âncoras de estilo de alta alavancagem:
| Categoria | Exemplos de âncoras |
|---|---|
| Ilustração | Studio Ghibli, Pixar, Cartoon Network 2010s, Adventure Time, Genshin Impact |
| Fotografia | Wes Anderson, Annie Leibovitz, National Geographic, Vogue editorial, Kodak Portra 400 |
| Pintura | Impressionismo de Monet, pós-impressionismo de Van Gogh, realismo de Hopper, ukiyo-e |
| Moderno | Y2K aesthetic, vaporwave, brutalist design, padrão Memphis, Bauhaus |
| Cinematográfico | Wong Kar-wai, Christopher Nolan, paleta A24, Blade Runner 2049 |
O modelo conhece essas referências. Use-as.
Regra 6: Trave câmera e iluminação em termos reais de fotografia
Para saídas fotorrealistas, a diferença entre amador e profissional é o vocabulário de câmera.
Iniciante: a realistic photo of a coffee cup on a desk
Profissional:
A coffee cup on a wooden desk, shot on Sony A7R IV, 35mm f/2.8 lens,
shallow depth of field, soft natural window light from the left,
golden hour color temperature, slight film grain.Termos de câmera que comprovadamente melhoram o realismo:
- Lente:
35mm,50mm,85mm portrait lens,wide-angle 24mm,macro 100mm - Abertura:
f/1.4,f/2.8,shallow depth of field,deep focus - Corpo:
Sony A7R IV,Canon EOS R5,Leica M11,Hasselblad medium format - Luz:
golden hour,blue hour,softbox studio lighting,Rembrandt lighting,rim light - Filme:
Kodak Portra 400,Fujifilm Velvia,Ilford HP5 black and white
Não são floreios — são instruções técnicas que o modelo sabe interpretar.
Regra 7: Itere com edições direcionadas, não regenerações completas
Aqui é onde a maioria dos usuários gasta 70% do orçamento de API à toa.
Workflow ruim:
Generate → not perfect → tweak prompt → regenerate from scratch → composition
changes → cry → repeat 5 times.Workflow bom:
Generate → not perfect → "in this image, change [X] to [Y],
keep everything else identical" → done.O GPT Image 2 suporta edição direcionada multi-turno que preserva o resto da imagem. Esse é o seu maior economizador de custo individual.
Exemplos de prompts efetivos de edição direcionada:
"Change the model's jacket from navy to beige. Keep face,
background, lighting, and pose unchanged."
"Replace the headline text with 'Spring Sale'. Keep all other
text, layout, and styling identical."
"Remove the watermark in the bottom-right corner. Keep
everything else exactly the same."A frase "keep everything else identical" é o encantamento mágico. Não pule.
Juntando tudo: um prompt completo do mundo real
Aqui está um prompt que usa as 7 regras de uma vez. Este é para uma imagem hero de e-commerce:
A white stainless steel insulated water bottle, standing upright
on a beige linen tablecloth, with soft window light from the left
at 45 degrees, premium minimalist product photography style.
Top-left red rectangular badge reads "Limited 50% Off",
top-right gold circular badge reads "24h Hot/Cold",
below the bottle bold black headline reads "Daily Commute Companion",
bottom-center small text reads "Tap to Shop".
Shot on Sony A7R IV, 50mm f/2.8 lens, shallow depth of field,
clean composition, no other objects in frame, no watermarks,
1:1 aspect ratio.Esse tipo de prompt geralmente produz um resultado utilizável na primeira ou segunda tentativa, em vez das 5-7 retentativas que você precisaria com um prompt vago.
Anti-padrões comuns em prompts do GPT Image 2
Uma lista curta de coisas para parar de fazer imediatamente:
| Anti-padrão | Por que falha | O que fazer em vez disso |
|---|---|---|
Empilhar palavras-chave masterpiece, 8k, ultra detailed | Ruído para o GPT Image 2 | Use âncoras de estilo reais (Regra 5) |
| Frase corrida única sem vírgulas | Difícil para o modelo parsear estrutura | Use a estrutura de 5 componentes (Regra 1) |
Descrever texto como conceito (a sale headline) | Não renderiza as palavras certas | Sempre coloque a string exata entre aspas (Regra 2) |
| Prompts em línguas mistas sem intenção | Modelo se confunde sobre qual idioma renderizar | Fique em um idioma para instruções, coloque entre aspas o idioma alvo para texto na imagem |
| Mega-prompts de 50 linhas | Retornos decrescentes após ~15 especificações | Limite a 10-15 specs, use edições direcionadas para refinamentos |
| Sem menção da proporção | Padrões do modelo variam | Sempre termine com 1:1 / 16:9 / 9:16 aspect ratio |
Checklist rápido antes de clicar em Gerar
Antes de submeter qualquer prompt do GPT Image 2, passe por:
- Tem os 5 componentes (sujeito, cena, estilo, texto, câmera)?
- Cada trecho de texto da imagem está entre aspas?
- Cada elemento tem uma localização especificada?
- Excluí o que não quero?
- O estilo está ancorado a uma referência real?
- Câmera e iluminação especificadas (para foto)?
- A proporção está no final?
Se todas as 7 caixas estiverem marcadas, sua taxa de acerto pula para ~90%.
Quer pular a parte de escrever?
Se você quer prompts prontos do GPT Image 2 para copiar e colar diretamente, navegue por gpt-image2.art/explore — toda imagem de exemplo tem seu prompt de origem visível, organizado por caso de uso (e-commerce, redes sociais, design de personagem, fotografia, infográficos, posters).
Leitura adicional
Mais Publicações

GPT Image 2 para E-commerce Cross-Border: Hero Images em 8 Idiomas
Use o GPT Image 2 no e-commerce internacional: gere uma hero image e adapte para 8 idiomas com texto correto. Ideal para Amazon, Shopee e TikTok Shop.

O GPT Image 2 Realmente Destronou o Nano Banana? Meu Veredito
Passei por cada hot take, benchmark e doc da OpenAI sobre GPT Image 2 vs Nano Banana 2. O veredito é mais nuançado do que 'esmagou o Banana'.

Biblioteca de Estilos do GPT Image 2: 12 Prompts de Arte Prontos para Copiar e Colar
Uma biblioteca curada de estilos do GPT Image 2 cobrindo 12 estilos artísticos populares — Studio Ghibli, cyberpunk, Wes Anderson e mais. Cada um com um prompt pronto.
Generate your first image with GPT Image 2 — right now
Reliable non-Latin text rendering, directed editing, and 50+ ready-to-use prompts. No downloads — just open in your browser.