
GPT Image 2 con prompt inverso: reproduce cualquier imagen
Guía práctica de prompt inverso con GPT Image 2. Sube cualquier imagen de referencia y consigue un prompt reproducible en segundos. 4 técnicas + plantillas listas para copiar.
Lo has visto cien veces — esa imagen IA perfecta en Pinterest, Twitter o Instagram, y no tienes ni idea de cómo escribir un prompt que produzca algo parecido. El prompt inverso es la solución.
Esta es una guía práctica para hacer ingeniería inversa de prompts de imagen con GPT Image 2. Subes una imagen de referencia, recibes de vuelta un prompt reproducible y regeneras variantes en segundos. Al final conocerás las 4 técnicas de prompt inverso, cuándo usar cada una y las plantillas para copiar y pegar que funcionan.
Por qué importa el prompt inverso
Tres razones reales por las que los creadores aprenden esto:
- Ves una estética viral y quieres tu propia versión — el mismo rollo, tu sujeto
- Te contratan para imitar un estilo de marca existente — el cliente de agencia te pasa imágenes de muestra y tienes que producir variantes alineadas con la marca
- Estás aprendiendo prompt-craft — hacer ingeniería inversa de 100 buenas imágenes es la forma más rápida de interiorizar lo que funciona
Sea cual sea tu motivo, el flujo de abajo te da un prompt reproducible al 90% en menos de 60 segundos.
Técnica 1: el visión-a-prompt integrado de GPT Image 2 (la más fácil)
El modelo GPT subyacente a GPT Image 2 puede analizar una imagen de referencia y describirla en lenguaje listo para prompt. Es el método más rápido.
Cómo hacerlo
En ChatGPT:
[Upload your reference image]
Analyze this image and write a detailed image generation prompt
that would reproduce it. Include: subject, scene, style, lighting,
camera (if photographic), color palette, and composition. Format
the output as a single comma-separated prompt I can paste directly
into GPT Image 2.Por la API (usando GPT-4 visión + GPT Image 2):
from openai import OpenAI
import base64
client = OpenAI()
# Step 1: encode the reference image
with open("reference.jpg", "rb") as f:
image_data = base64.b64encode(f.read()).decode()
# Step 2: ask GPT to write a reverse prompt
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "Write a detailed GPT Image 2 prompt that would reproduce this image. Format as a single comma-separated string."},
{"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"}},
],
}
],
)
reverse_prompt = response.choices[0].message.content
# Step 3: use the reverse prompt to generate variants
new_image = client.images.generate(
model="gpt-image-2",
prompt=reverse_prompt,
quality="medium",
)Este pipeline tarda unos 10 segundos extremo a extremo y te devuelve un prompt reproducible que ronda el 80-90% del original.
Técnica 2: image-to-image directo con GPT Image 2
Sáltate el prompt por completo. Usa images.edit con una imagen de referencia y un prompt vago.
result = client.images.edit(
model="gpt-image-2",
image=open("reference.jpg", "rb"),
prompt="Generate a similar image in the same style and composition, but with a different subject: [your new subject].",
quality="medium",
)Genial para clonar estilo sin escribir prompt. La pega: menos control. Usa la Técnica 1 cuando necesites entender y retocar el estilo.
Técnica 3: plantilla manual de prompt inverso (máximo control)
Los redactores de prompts experimentados hacen ingeniería inversa a mano. Lleva más tiempo, pero te da la comprensión más profunda.
El marco de 7 preguntas para prompt inverso
Para cualquier imagen de referencia, responde a estas 7 preguntas:
| # | Pregunta | Respuesta de ejemplo |
|---|---|---|
| 1 | ¿Cuál es el sujeto? | Una mujer joven con melena castaña |
| 2 | ¿Dónde está? | Sentada en un café soleado junto a la ventana |
| 3 | ¿Cuál es el estilo? | Fotografía editorial en película, grano ligero |
| 4 | ¿Cómo es la iluminación? | Luz natural cálida de tarde desde la izquierda |
| 5 | ¿Qué cámara? | Lente 35mm, profundidad de campo reducida |
| 6 | ¿Cuál es la paleta de color? | Beiges cálidos, marrones suaves, verdes apagados |
| 7 | ¿Cómo es la composición? | Plano medio, descentrado, regla de los tercios |
Une las respuestas con comas y tienes un prompt inverso:
A young woman with long brown hair, sitting in a sunlit cafe by
the window, editorial film photography style with slight grain,
warm afternoon natural light from the left, 35mm lens with shallow
depth of field, warm beige and muted green palette, mid-shot
off-center composition following rule of thirds.Es más certero que los prompts inversos auto-generados porque tú has detectado los detalles que importaban.
Técnica 4: híbrida — auto-genera y luego refina a mano
Lo mejor de los dos mundos:
- Pasa la Técnica 1 para conseguir un borrador de prompt inverso
- Compáralo con la imagen de referencia
- Corrige a mano lo que el auto-prompt se ha dejado (a menudo referencias de estilo, marcas concretas, detalles de época)
- Añade 1-2 keywords de ancla (como
Wes Anderson styleoKodak Portra 400) - Genera variantes
Este es el flujo que usa el 90% de los diseñadores de prompts profesionales.
Errores comunes en prompt inverso
| Error | Por qué falla | Cómo arreglarlo |
|---|---|---|
| Prompt demasiado genérico ("una mujer en un café") | Se pierde la identidad visual | Añade anclas de estilo y detalles de iluminación |
| Olvidar los detalles de cámara | La salida parece ilustración cuando la referencia es foto | Especifica siempre lente, apertura e iluminación si es fotográfico |
| Copiar palabras de mood pero no referencias de estilo | "Bonito, onírico" no le dice al modelo qué dibujar | Usa Studio Ghibli, Wes Anderson, Kodak — anclas concretas |
| Ignorar la composición | Las variantes no encajan con el encuadre de referencia | Especifica plano medio / amplio / primer plano / relación de aspecto |
| Olvidarse de la paleta | La temperatura de color se desvía | Incluye 2-3 colores concretos de paleta |
| Reproducir literalmente una IP con copyright | Infracción de marca / copyright | Invierte el estilo, no la IP — genera "in the style of" en lugar de "of" |
Cuándo NO deberías hacer prompt inverso
Hay límites éticos y legales reales:
- Obras con copyright — hacer prompt inverso de una escena de Studio Ghibli para producir una réplica casi idéntica es infracción. Usa el ancla de estilo en su lugar.
- Fotos de personas reales — hacer prompt inverso de la foto de un famoso para recrearlo es una violación del derecho de imagen.
- Logos / personajes protegidos — Mickey, Pikachu, etc. están vetados independientemente de cómo llegues a ellos.
- Fotos pertenecientes a otros fotógrafos — aunque no sean famosos, reproducir la composición exacta de alguien es cuestionable.
La regla segura: haz prompt inverso de estéticas y estilos, no de obras protegidas concretas.
Biblioteca de plantillas de prompt inverso
Copia y pega estas para los escenarios habituales:
Prompt inverso de una imagen fotográfica
Analyze this image and write a detailed GPT Image 2 prompt that
would reproduce its style. Include: 1) subject and scene, 2)
specific photographic style reference (e.g., Kodak Portra 400,
Wes Anderson, National Geographic), 3) lens / aperture / lighting,
4) color palette in 2-3 hex values or descriptive colors, 5)
composition and aspect ratio. Format as a single comma-separated
prompt.Prompt inverso de una ilustración estilizada
Analyze this illustration and write a GPT Image 2 prompt to
reproduce its style with a different subject. Identify: 1) the
art style (Studio Ghibli, Pixar, ukiyo-e, watercolor, etc.), 2)
line work and texture, 3) color palette, 4) lighting/mood, 5)
composition. Format as a single comma-separated prompt with
[SUBJECT] as a placeholder I'll replace.Prompt inverso de una imagen de marca / comercial
Analyze this commercial image and identify the brand visual
language. Write a reproducible GPT Image 2 prompt covering: 1)
subject placement, 2) background and props, 3) lighting setup
(e.g., softbox, hard light, natural), 4) color palette of the
brand, 5) typography placement (where text appears, even if I'll
add the actual text later), 6) overall mood. Format as a
comma-separated prompt.Flujo de prompt inverso por lotes
Si tienes 10 imágenes de referencia y quieres construir una biblioteca de prompts a partir de ellas:
import os
from openai import OpenAI
client = OpenAI()
def reverse_prompt(image_path: str) -> str:
with open(image_path, "rb") as f:
image_data = base64.b64encode(f.read()).decode()
response = client.chat.completions.create(
model="gpt-4o",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Write a detailed comma-separated GPT Image 2 prompt to reproduce this image's style."},
{"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"}},
],
}],
)
return response.choices[0].message.content
# Build a prompt library from a folder of reference images
prompts = {}
for filename in os.listdir("references"):
if filename.endswith((".jpg", ".png", ".jpeg")):
prompts[filename] = reverse_prompt(f"references/{filename}")
# Save as a JSON prompt library
import json
with open("prompt_library.json", "w") as f:
json.dump(prompts, f, indent=2, ensure_ascii=False)En 5 minutos tienes una biblioteca de prompts que puedes usar durante el próximo año.
¿Quieres prompts ya extraídos de salidas reales?
Sáltate el paso del prompt inverso por completo — gpt-image2.art/explore tiene más de 100 salidas reales de GPT Image 2 con los prompts originales ya expuestos. Filtra por categoría y copia cualquier prompt como punto de partida.
¿Necesitas acceso a la API para prompt inverso por lotes?
Para pipelines de prompt inverso de alto volumen (especialmente desde regiones donde el acceso directo a OpenAI es inestable), escribe a support@gpt-image2.art para una API key gestionada con precios por volumen.
Lecturas recomendadas
Más publicaciones

¿De verdad GPT Image 2 ha destronado a Nano Banana? Mi veredicto
He repasado todos los hot takes, benchmarks y docs de OpenAI sobre GPT Image 2 frente a Nano Banana 2. El veredicto tiene más matices que 'le ha pasado por encima a Banana'.

API de GPT Image 2: guía completa (Python, Node.js, curl)
Guía completa para integrar la API de GPT Image 2. Autenticación, parámetros, ejemplos en Python/Node.js, edición de imágenes, generación por lotes, manejo de errores y consejos de coste.

¿Qué es GPT Image 2? Introducción completa
GPT Image 2 es el modelo multimodal de imagen de nueva generación de OpenAI — el primero capaz de gestionar de forma fiable texto no latino y maquetaciones complejas. Todo lo que necesitas saber.
Generate your first image with GPT Image 2 — right now
Reliable non-Latin text rendering, directed editing, and 50+ ready-to-use prompts. No downloads — just open in your browser.