2026/04/23

Guia de Prompts do GPT Image 2: 7 Regras para 90% de Acerto

Um guia prático de escrita de prompts para GPT Image 2 a partir de mais de 200 gerações. As 7 regras, estrutura, palavras-chave e anti-padrões para acertar de primeira.

Se você experimentou o GPT Image 2 e sentiu que ele ignora metade do seu prompt, o problema quase nunca é o modelo — é a forma como o prompt foi escrito. Depois de rodar mais de 200 gerações e comparar uma matriz de taxa de acerto, as mesmas 7 regras explicam a diferença entre "sucesso na primeira tentativa" e "cinco retentativas até desistir".

Este é um guia prático de escrita de prompts para geração de imagens com IA usando o GPT Image 2. Toda regra abaixo é algo que você pode aplicar ao seu próximo prompt em 30 segundos.

Por que a maioria dos prompts do GPT Image 2 falha

Três padrões causam cerca de 80% das falhas de prompt:

Tratar o GPT Image 2 como Stable Diffusion — enchendo o prompt com sopa de palavras como masterpiece, 8k, ultra detailed, high quality. Esses tokens são ruído para o GPT Image 2.
Escrever frases corridas sem estrutura — uma frase longa em inglês/português com tudo misturado. O GPT Image 2 lê estrutura; estrutura responde com clareza.
Esquecer de colocar texto entre aspas — dizer the headline says limited offer é bem menos confiável do que dizer the headline says "Limited Offer". As aspas mudam tudo.

Se você consertar só esses três, sua taxa de acerto dobra. Abaixo estão as 7 regras em detalhe.

Regra 1: Estruture seu prompt — sujeito, cena, estilo, texto, câmera

Um prompt confiável para GPT Image 2 tem 5 componentes ordenados:

Componente	O que vai aqui	Exemplo
Sujeito	O objeto ou personagem principal	`a white stainless steel water bottle`
Cena	Fundo e ambiente	`on a beige linen tablecloth, soft indoor light`
Estilo	Atmosfera visual e referência	`editorial product photography, premium feel`
Texto	Todo texto na imagem entre aspas	`top-left red badge: "50% off"`
Câmera	Lente, ângulo, iluminação	`45-degree side light, shallow depth of field`

Costure tudo com vírgulas. Um prompt completo fica assim:

A white stainless steel water bottle, on a beige linen tablecloth,
soft indoor light, editorial product photography, premium feel,
top-left red badge "50% off", bottom black bold text
"Daily Commute Companion", 45-degree side light, shallow depth of field.

Essa estrutura funciona porque o GPT Image 2 é um modelo de linguagem — ele segue ordem narrativa. Ordem aleatória = saída aleatória.

Regra 2: Coloque entre aspas cada trecho de texto da imagem

Esta é a regra de maior alavancagem. A diferença entre:

the headline says limited offer (errado) the headline reads "Limited Offer" (certo)

É um gap de 30-40 pontos percentuais na precisão de renderização de texto. Por quê? As aspas dizem ao modelo "esta string exata é o que você deve renderizar", em vez de "descreva o conceito de oferta limitada".

O mesmo vale para texto não-latino:

o título diz oferta limitada (errado) o título diz "Oferta Limitada" (certo)

Quando você tem múltiplos elementos de texto:

Headline at top reads "2026 Spring Collection",
subhead reads "30% Off Sitewide",
bottom-left small text reads "Code: SPRING30",
right-side vertical text reads "Limited Time".

Cada trecho entre aspas, cada localização especificada.

Regra 3: Especifique localização para cada elemento

O GPT Image 2 entende bem linguagem espacial — mas só se você a fornecer.

Vago: a logo and some text on the image Preciso: a circular logo in the top-left corner, three lines of text in the bottom-right corner

Vocabulário espacial que funciona com confiabilidade:

top-left / top-right / top-center / bottom-left / bottom-right / bottom-center
centered / vertically centered / horizontally centered
foreground / midground / background
above the headline / below the subhead / next to the icon

Quando você tem 3+ elementos, cada elemento ganha uma localização. Sem exceções.

Regra 4: Restrinja o negativo — diga o que você NÃO quer

Modelos de difusão tinham campos explícitos de "negative prompt". O GPT Image 2 não tem, mas entende restrições em linguagem natural:

... no text on the bottle itself,
no shadows on the background,
no other objects in frame,
no watermark.

Anti-padrões são especialmente úteis para:

Remover marcas d'água (no watermark, no logo overlay)
Limpar fundos cheios (solid plain background, no decorations)
Evitar mãos ou dedos extras (hands clearly visible, anatomically correct)
Prevenir excesso de decoração (minimalist, no extra ornaments)

Cerca de 1 em 5 retentativas pode ser eliminada gastando 10 segundos escrevendo o que você não quer.

Regra 5: Ancore o estilo com uma referência, não com adjetivos

"Lindo", "incrível", "deslumbrante" não dizem nada ao modelo. Referências ancoradas dizem tudo.

Fraco: a beautiful illustration of a girl Forte: a Studio Ghibli style illustration of a girl, soft watercolor textures, warm color palette

Âncoras de estilo de alta alavancagem:

Categoria	Exemplos de âncoras
Ilustração	Studio Ghibli, Pixar, Cartoon Network 2010s, Adventure Time, Genshin Impact
Fotografia	Wes Anderson, Annie Leibovitz, National Geographic, Vogue editorial, Kodak Portra 400
Pintura	Impressionismo de Monet, pós-impressionismo de Van Gogh, realismo de Hopper, ukiyo-e
Moderno	Y2K aesthetic, vaporwave, brutalist design, padrão Memphis, Bauhaus
Cinematográfico	Wong Kar-wai, Christopher Nolan, paleta A24, Blade Runner 2049

O modelo conhece essas referências. Use-as.

Regra 6: Trave câmera e iluminação em termos reais de fotografia

Para saídas fotorrealistas, a diferença entre amador e profissional é o vocabulário de câmera.

Iniciante: a realistic photo of a coffee cup on a desk Profissional:

A coffee cup on a wooden desk, shot on Sony A7R IV, 35mm f/2.8 lens,
shallow depth of field, soft natural window light from the left,
golden hour color temperature, slight film grain.

Termos de câmera que comprovadamente melhoram o realismo:

Lente: 35mm, 50mm, 85mm portrait lens, wide-angle 24mm, macro 100mm
Abertura: f/1.4, f/2.8, shallow depth of field, deep focus
Corpo: Sony A7R IV, Canon EOS R5, Leica M11, Hasselblad medium format
Luz: golden hour, blue hour, softbox studio lighting, Rembrandt lighting, rim light
Filme: Kodak Portra 400, Fujifilm Velvia, Ilford HP5 black and white

Não são floreios — são instruções técnicas que o modelo sabe interpretar.

Regra 7: Itere com edições direcionadas, não regenerações completas

Aqui é onde a maioria dos usuários gasta 70% do orçamento de API à toa.

Workflow ruim:

Generate → not perfect → tweak prompt → regenerate from scratch → composition
changes → cry → repeat 5 times.

Workflow bom:

Generate → not perfect → "in this image, change [X] to [Y],
keep everything else identical" → done.

O GPT Image 2 suporta edição direcionada multi-turno que preserva o resto da imagem. Esse é o seu maior economizador de custo individual.

Exemplos de prompts efetivos de edição direcionada:

"Change the model's jacket from navy to beige. Keep face,
background, lighting, and pose unchanged."

"Replace the headline text with 'Spring Sale'. Keep all other
text, layout, and styling identical."

"Remove the watermark in the bottom-right corner. Keep
everything else exactly the same."

A frase "keep everything else identical" é o encantamento mágico. Não pule.

Juntando tudo: um prompt completo do mundo real

Aqui está um prompt que usa as 7 regras de uma vez. Este é para uma imagem hero de e-commerce:

A white stainless steel insulated water bottle, standing upright
on a beige linen tablecloth, with soft window light from the left
at 45 degrees, premium minimalist product photography style.

Top-left red rectangular badge reads "Limited 50% Off",
top-right gold circular badge reads "24h Hot/Cold",
below the bottle bold black headline reads "Daily Commute Companion",
bottom-center small text reads "Tap to Shop".

Shot on Sony A7R IV, 50mm f/2.8 lens, shallow depth of field,
clean composition, no other objects in frame, no watermarks,
1:1 aspect ratio.

Esse tipo de prompt geralmente produz um resultado utilizável na primeira ou segunda tentativa, em vez das 5-7 retentativas que você precisaria com um prompt vago.

Anti-padrões comuns em prompts do GPT Image 2

Uma lista curta de coisas para parar de fazer imediatamente:

Anti-padrão	Por que falha	O que fazer em vez disso
Empilhar palavras-chave `masterpiece, 8k, ultra detailed`	Ruído para o GPT Image 2	Use âncoras de estilo reais (Regra 5)
Frase corrida única sem vírgulas	Difícil para o modelo parsear estrutura	Use a estrutura de 5 componentes (Regra 1)
Descrever texto como conceito (`a sale headline`)	Não renderiza as palavras certas	Sempre coloque a string exata entre aspas (Regra 2)
Prompts em línguas mistas sem intenção	Modelo se confunde sobre qual idioma renderizar	Fique em um idioma para instruções, coloque entre aspas o idioma alvo para texto na imagem
Mega-prompts de 50 linhas	Retornos decrescentes após ~15 especificações	Limite a 10-15 specs, use edições direcionadas para refinamentos
Sem menção da proporção	Padrões do modelo variam	Sempre termine com `1:1 / 16:9 / 9:16 aspect ratio`

Checklist rápido antes de clicar em Gerar

Antes de submeter qualquer prompt do GPT Image 2, passe por:

Tem os 5 componentes (sujeito, cena, estilo, texto, câmera)?
Cada trecho de texto da imagem está entre aspas?
Cada elemento tem uma localização especificada?
Excluí o que não quero?
O estilo está ancorado a uma referência real?
Câmera e iluminação especificadas (para foto)?
A proporção está no final?

Se todas as 7 caixas estiverem marcadas, sua taxa de acerto pula para ~90%.

Quer pular a parte de escrever?

Se você quer prompts prontos do GPT Image 2 para copiar e colar diretamente, navegue por gpt-image2.art/explore — toda imagem de exemplo tem seu prompt de origem visível, organizado por caso de uso (e-commerce, redes sociais, design de personagem, fotografia, infográficos, posters).

Leitura adicional

Todas as Publicações

Por que a maioria dos prompts do GPT Image 2 falha Regra 1: Estruture seu prompt — sujeito, cena, estilo, texto, câmera Regra 2: Coloque entre aspas cada trecho de texto da imagem Regra 3: Especifique localização para cada elemento Regra 4: Restrinja o negativo — diga o que você NÃO quer Regra 5: Ancore o estilo com uma referência, não com adjetivos Regra 6: Trave câmera e iluminação em termos reais de fotografia Regra 7: Itere com edições direcionadas, não regenerações completas Juntando tudo: um prompt completo do mundo real Anti-padrões comuns em prompts do GPT Image 2 Checklist rápido antes de clicar em Gerar Quer pular a parte de escrever?Leitura adicional

Mais Publicações

Product

10 Prompts de Pôsteres com GPT Image 2 que Uso para Designs Prontos para Clientes

Dez prompts de pôster do GPT Image 2 prontos para copiar e colar — livraria, sobremesa, camping, esports e mais — mais a fórmula de 8 blocos por trás de todos eles e 4 pôsteres realmente gerados.

GPT Image 2 Team

2026/07/06

CompanyProduct

API do GPT Image 2: Guia Completo (Python, Node.js, Curl)

Guia completo de integração com a API do GPT Image 2. Autenticação, parâmetros, exemplos em Python/Node.js, edição de imagens, geração em lote, tratamento de erros e dicas de custo.

GPT Image 2 Team

2026/04/23

Product

Guia de Prompts para Mapas de Conhecimento com GPT Image 2: 5 Templates Prontos para Estudo, Redes Sociais, Anotações de Aula, Slides e SOPs

Um framework de prompts pronto para copiar e colar e transformar qualquer tópico em um infográfico de mapa de conhecimento em uma única passada com o GPT Image 2. Cinco templates testados em produção para fichas de estudo, posts em redes sociais, materiais de aula, visuais de slides e SOPs operacionais.

GPT Image 2 Team

2026/05/16

Free to try

Generate your first image with GPT Image 2 — right now

Reliable non-Latin text rendering, directed editing, and 50+ ready-to-use prompts. No downloads — just open in your browser.

Start generating free Browse examples