Guia de Prompts do GPT Image 2: 7 Regras para 90% de Acerto
2026/04/23

Guia de Prompts do GPT Image 2: 7 Regras para 90% de Acerto

Um guia prático de escrita de prompts para GPT Image 2 a partir de mais de 200 gerações. As 7 regras, estrutura, palavras-chave e anti-padrões para acertar de primeira.

Se você experimentou o GPT Image 2 e sentiu que ele ignora metade do seu prompt, o problema quase nunca é o modelo — é a forma como o prompt foi escrito. Depois de rodar mais de 200 gerações e comparar uma matriz de taxa de acerto, as mesmas 7 regras explicam a diferença entre "sucesso na primeira tentativa" e "cinco retentativas até desistir".

Este é um guia prático de escrita de prompts para geração de imagens com IA usando o GPT Image 2. Toda regra abaixo é algo que você pode aplicar ao seu próximo prompt em 30 segundos.

Por que a maioria dos prompts do GPT Image 2 falha

Três padrões causam cerca de 80% das falhas de prompt:

  1. Tratar o GPT Image 2 como Stable Diffusion — enchendo o prompt com sopa de palavras como masterpiece, 8k, ultra detailed, high quality. Esses tokens são ruído para o GPT Image 2.
  2. Escrever frases corridas sem estrutura — uma frase longa em inglês/português com tudo misturado. O GPT Image 2 lê estrutura; estrutura responde com clareza.
  3. Esquecer de colocar texto entre aspas — dizer the headline says limited offer é bem menos confiável do que dizer the headline says "Limited Offer". As aspas mudam tudo.

Se você consertar só esses três, sua taxa de acerto dobra. Abaixo estão as 7 regras em detalhe.

Regra 1: Estruture seu prompt — sujeito, cena, estilo, texto, câmera

Um prompt confiável para GPT Image 2 tem 5 componentes ordenados:

ComponenteO que vai aquiExemplo
SujeitoO objeto ou personagem principala white stainless steel water bottle
CenaFundo e ambienteon a beige linen tablecloth, soft indoor light
EstiloAtmosfera visual e referênciaeditorial product photography, premium feel
TextoTodo texto na imagem entre aspastop-left red badge: "50% off"
CâmeraLente, ângulo, iluminação45-degree side light, shallow depth of field

Costure tudo com vírgulas. Um prompt completo fica assim:

A white stainless steel water bottle, on a beige linen tablecloth,
soft indoor light, editorial product photography, premium feel,
top-left red badge "50% off", bottom black bold text
"Daily Commute Companion", 45-degree side light, shallow depth of field.

Essa estrutura funciona porque o GPT Image 2 é um modelo de linguagem — ele segue ordem narrativa. Ordem aleatória = saída aleatória.

Regra 2: Coloque entre aspas cada trecho de texto da imagem

Esta é a regra de maior alavancagem. A diferença entre:

the headline says limited offer (errado) the headline reads "Limited Offer" (certo)

É um gap de 30-40 pontos percentuais na precisão de renderização de texto. Por quê? As aspas dizem ao modelo "esta string exata é o que você deve renderizar", em vez de "descreva o conceito de oferta limitada".

O mesmo vale para texto não-latino:

o título diz oferta limitada (errado) o título diz "Oferta Limitada" (certo)

Quando você tem múltiplos elementos de texto:

Headline at top reads "2026 Spring Collection",
subhead reads "30% Off Sitewide",
bottom-left small text reads "Code: SPRING30",
right-side vertical text reads "Limited Time".

Cada trecho entre aspas, cada localização especificada.

Regra 3: Especifique localização para cada elemento

O GPT Image 2 entende bem linguagem espacial — mas só se você a fornecer.

Vago: a logo and some text on the image Preciso: a circular logo in the top-left corner, three lines of text in the bottom-right corner

Vocabulário espacial que funciona com confiabilidade:

  • top-left / top-right / top-center / bottom-left / bottom-right / bottom-center
  • centered / vertically centered / horizontally centered
  • foreground / midground / background
  • above the headline / below the subhead / next to the icon

Quando você tem 3+ elementos, cada elemento ganha uma localização. Sem exceções.

Regra 4: Restrinja o negativo — diga o que você NÃO quer

Modelos de difusão tinham campos explícitos de "negative prompt". O GPT Image 2 não tem, mas entende restrições em linguagem natural:

... no text on the bottle itself,
no shadows on the background,
no other objects in frame,
no watermark.

Anti-padrões são especialmente úteis para:

  • Remover marcas d'água (no watermark, no logo overlay)
  • Limpar fundos cheios (solid plain background, no decorations)
  • Evitar mãos ou dedos extras (hands clearly visible, anatomically correct)
  • Prevenir excesso de decoração (minimalist, no extra ornaments)

Cerca de 1 em 5 retentativas pode ser eliminada gastando 10 segundos escrevendo o que você não quer.

Regra 5: Ancore o estilo com uma referência, não com adjetivos

"Lindo", "incrível", "deslumbrante" não dizem nada ao modelo. Referências ancoradas dizem tudo.

Fraco: a beautiful illustration of a girl Forte: a Studio Ghibli style illustration of a girl, soft watercolor textures, warm color palette

Âncoras de estilo de alta alavancagem:

CategoriaExemplos de âncoras
IlustraçãoStudio Ghibli, Pixar, Cartoon Network 2010s, Adventure Time, Genshin Impact
FotografiaWes Anderson, Annie Leibovitz, National Geographic, Vogue editorial, Kodak Portra 400
PinturaImpressionismo de Monet, pós-impressionismo de Van Gogh, realismo de Hopper, ukiyo-e
ModernoY2K aesthetic, vaporwave, brutalist design, padrão Memphis, Bauhaus
CinematográficoWong Kar-wai, Christopher Nolan, paleta A24, Blade Runner 2049

O modelo conhece essas referências. Use-as.

Regra 6: Trave câmera e iluminação em termos reais de fotografia

Para saídas fotorrealistas, a diferença entre amador e profissional é o vocabulário de câmera.

Iniciante: a realistic photo of a coffee cup on a desk Profissional:

A coffee cup on a wooden desk, shot on Sony A7R IV, 35mm f/2.8 lens,
shallow depth of field, soft natural window light from the left,
golden hour color temperature, slight film grain.

Termos de câmera que comprovadamente melhoram o realismo:

  • Lente: 35mm, 50mm, 85mm portrait lens, wide-angle 24mm, macro 100mm
  • Abertura: f/1.4, f/2.8, shallow depth of field, deep focus
  • Corpo: Sony A7R IV, Canon EOS R5, Leica M11, Hasselblad medium format
  • Luz: golden hour, blue hour, softbox studio lighting, Rembrandt lighting, rim light
  • Filme: Kodak Portra 400, Fujifilm Velvia, Ilford HP5 black and white

Não são floreios — são instruções técnicas que o modelo sabe interpretar.

Regra 7: Itere com edições direcionadas, não regenerações completas

Aqui é onde a maioria dos usuários gasta 70% do orçamento de API à toa.

Workflow ruim:

Generate → not perfect → tweak prompt → regenerate from scratch → composition
changes → cry → repeat 5 times.

Workflow bom:

Generate → not perfect → "in this image, change [X] to [Y],
keep everything else identical" → done.

O GPT Image 2 suporta edição direcionada multi-turno que preserva o resto da imagem. Esse é o seu maior economizador de custo individual.

Exemplos de prompts efetivos de edição direcionada:

"Change the model's jacket from navy to beige. Keep face,
background, lighting, and pose unchanged."

"Replace the headline text with 'Spring Sale'. Keep all other
text, layout, and styling identical."

"Remove the watermark in the bottom-right corner. Keep
everything else exactly the same."

A frase "keep everything else identical" é o encantamento mágico. Não pule.

Juntando tudo: um prompt completo do mundo real

Aqui está um prompt que usa as 7 regras de uma vez. Este é para uma imagem hero de e-commerce:

A white stainless steel insulated water bottle, standing upright
on a beige linen tablecloth, with soft window light from the left
at 45 degrees, premium minimalist product photography style.

Top-left red rectangular badge reads "Limited 50% Off",
top-right gold circular badge reads "24h Hot/Cold",
below the bottle bold black headline reads "Daily Commute Companion",
bottom-center small text reads "Tap to Shop".

Shot on Sony A7R IV, 50mm f/2.8 lens, shallow depth of field,
clean composition, no other objects in frame, no watermarks,
1:1 aspect ratio.

Esse tipo de prompt geralmente produz um resultado utilizável na primeira ou segunda tentativa, em vez das 5-7 retentativas que você precisaria com um prompt vago.

Anti-padrões comuns em prompts do GPT Image 2

Uma lista curta de coisas para parar de fazer imediatamente:

Anti-padrãoPor que falhaO que fazer em vez disso
Empilhar palavras-chave masterpiece, 8k, ultra detailedRuído para o GPT Image 2Use âncoras de estilo reais (Regra 5)
Frase corrida única sem vírgulasDifícil para o modelo parsear estruturaUse a estrutura de 5 componentes (Regra 1)
Descrever texto como conceito (a sale headline)Não renderiza as palavras certasSempre coloque a string exata entre aspas (Regra 2)
Prompts em línguas mistas sem intençãoModelo se confunde sobre qual idioma renderizarFique em um idioma para instruções, coloque entre aspas o idioma alvo para texto na imagem
Mega-prompts de 50 linhasRetornos decrescentes após ~15 especificaçõesLimite a 10-15 specs, use edições direcionadas para refinamentos
Sem menção da proporçãoPadrões do modelo variamSempre termine com 1:1 / 16:9 / 9:16 aspect ratio

Checklist rápido antes de clicar em Gerar

Antes de submeter qualquer prompt do GPT Image 2, passe por:

  • Tem os 5 componentes (sujeito, cena, estilo, texto, câmera)?
  • Cada trecho de texto da imagem está entre aspas?
  • Cada elemento tem uma localização especificada?
  • Excluí o que não quero?
  • O estilo está ancorado a uma referência real?
  • Câmera e iluminação especificadas (para foto)?
  • A proporção está no final?

Se todas as 7 caixas estiverem marcadas, sua taxa de acerto pula para ~90%.

Quer pular a parte de escrever?

Se você quer prompts prontos do GPT Image 2 para copiar e colar diretamente, navegue por gpt-image2.art/explore — toda imagem de exemplo tem seu prompt de origem visível, organizado por caso de uso (e-commerce, redes sociais, design de personagem, fotografia, infográficos, posters).

Leitura adicional

Free to try

Generate your first image with GPT Image 2 — right now

Reliable non-Latin text rendering, directed editing, and 50+ ready-to-use prompts. No downloads — just open in your browser.