A horas de su lanzamiento, GPT Image 1.5 destrona a Gemini y se convierte en la mejor IA generadora de imágenes

OpenAI está haciendo lo imposible para no perderse en la sombra de Google. Desde que la empresa liderada por Sundar Pichai presentó Gemini 3 Pro y destronó a todas las LLM de los principales rankings de LMArena, Sam Altman activó el “código rojo” exigiendo a su equipo innovaciones rápidas y superadoras. Así llegó la versión 5.2 de ChatGPT y, ahora, el lanzamiento de un modelo mejorado de ChatGPT Images, que promete realizar ediciones precisas manteniendo intactos los detalles y generando imágenes hasta 4 veces más rápido.

Los usuarios recibieron con brazos abiertos este “upgrade”, ubicando a GPT Image 1.5 en los primeros lugares de las categorías “Texto-to-Image” e “Image Edit” (“texto a imagen y edición de imágenes, traducido al español) de LMArena, superando a Gemini 3 Pro Image, que hasta ahora lideraba estas categorías. Así lo podemos ver en la siguiente imagen:

Según explica Fidji Simo, directora ejecutiva de aplicaciones de OpenAI, “nuestro nuevo modelo es más rápido y mejor al seguir instrucciones detalladas, lo que te permite realizar ediciones más precisas y transformaciones creativas. Mantiene la coherencia de elementos clave como la iluminación, la composición y la semejanza entre las entradas y las salidas, para que los resultados se acerquen mucho más a lo que imaginaste”.

A continuación, analizamos todas las mejoras de GPT Image 1.5

Ediciones precisas que respetan la foto original

La promesa central de GPT Image 1.5 es sencilla de entender y muy ambiciosa de cumplir: tocar solo lo que el usuario pide y dejar intacto todo lo demás. El modelo es capaz de mantener consistentes elementos como iluminación, composición y rasgos de las personas, incluso a lo largo de varias rondas de edición sobre la misma imagen.

Esto se traduce en casos de uso muy concretos:

  • Añadir o eliminar elementos
  • Combinar varias imágenes
  • Fusionar estilos
  • Reordenar sujetos
  • Transponer escenas completas

Todo ello sin perder coherencia visual ni continuidad narrativa entre una edición y la siguiente. En la práctica, esto permite flujos de trabajo encadenados: haces un cambio, luego otro, luego otro… y la imagen sigue “teniendo sentido”.

Transformaciones creativas sin sufrir con el prompt

La otra pata fuerte del modelo son las llamadas “creative transformations”: cambios profundos que añaden texto, modifican el layout o reinventan casi por completo una escena, pero conservando detalles importantes. Aquí el salto no es solo técnico, sino también de UX: el nuevo espacio de imágenes de ChatGPT incluye estilos y conceptos predefinidos para generar resultados sin necesidad de escribir prompts kilométricos.

Esto baja la barrera de entrada para usuarios menos expertos, ya que basta con elegir un estilo (cartel de película, anuncio de moda, póster retro, etc.) y dejar que el modelo haga el trabajo duro.

Mejor seguimiento de instrucciones complejas

Uno de los reproches clásicos a los generadores de imágenes era su obediencia selectiva: seguían parte del prompt y se olvidaban del resto. GPT Image 1.5 intenta cerrar esa brecha. OpenAI asegura que el modelo sigue instrucciones “más fiable y detalladamente” que la versión anterior, algo que se ve en ejemplos con especificaciones largas y estructuradas (como cuadrículas 6×6 donde cada casilla contiene un objeto concreto).

Este avance abre la puerta a composiciones complejas donde las relaciones entre elementos son críticas, desde infografías hasta escenas cargadas de objetos con posiciones precisas. Para diseñadores y equipos de producto, significa que la imagen generada se acerca más al briefing original y menos a la interpretación caprichosa de la máquina.

Un salto en el renderizado de texto

El texto dentro de las imágenes. GPT Image 1.5 da un paso más en la nitidez y legibilidad de textos densos o pequeños, algo clave para piezas como carteles, interfaces simuladas o gráficos informativos. En los ejemplos, el modelo es capaz de reproducir markdown complejo (titulares, subtítulos, tablas con números y porcentajes) como si fuera una maqueta de periódico real.

Además, OpenAI muestra cómo puede remaquetar un mismo contenido para titular otros lanzamientos, como el propio anuncio de GPT‑Image‑1.5.

Un nuevo espacio de creación dentro de ChatGPT

Más allá del modelo, hora ChatGPT cuenta con un nuevo espacio dedicado exclusivamente a imágenes, accesible desde la barra lateral tanto en web como en móvil. Desde ahí, los usuarios pueden explorar:

  • Filtros predefinidos
  • Sugerencias creativas que se actualizan según tendencias
  • Posibilidad de subir una imagen una sola vez y reutilizarla
  • Generación simultánea de varias imágenes sin bloquear el flujo

Mejoras de calidad: más caras, menos “rareza”

OpenAI también presume de mejoras en el manejo de muchas caras pequeñas en una misma escena, imágenes más “naturales” y menos artefactos visuales en situaciones complicadas, como reflejos o deslumbramientos. En pruebas comparativas, escenas complejas (como una calle abarrotada en Londres en los 70) se ven más nítidas, con más personajes bien definidos y una coherencia mayor en el conjunto.

En otros ejemplos, la compañía muestra cómo el modelo evita recortes prematuros en posters ilustrados y consigue resultados más útiles para usos científicos o educativos, aunque admite que todavía hay inexactitudes y margen de mejora. O sea, si bien se trata de un avance significativo, no se trata de la versión definitiva (sí, habrá que esperar más y más actualizaciones sobre las actualizaciones).

GPT Image 1.5 para desarrolladores y marcas

La versión de GPT Image 1.5 disponible vía API incorpora las mismas mejoras que el nuevo ChatGPT Images, con foco en preservación de marcas y visuales clave. Esto la hace especialmente atractiva para marketing, eCommerce y herramientas creativas que necesitan generar catálogos completos (variantes, escenas, ángulos) partiendo de una sola foto de producto.

Además, hay un incentivo directo: las entradas y salidas de imagen son ahora un 20% más baratas que en GPT Image 1.0, lo que permite iterar más sin disparar el presupuesto. OpenAI cita a empresas como Wix, Canva, Figma, Envato o Higgsfield como primeros adoptantes, y uno de los testimonios asegura que el modelo ofrece imágenes de alta fidelidad, con buena adherencia al prompt y detalles finos preservados, situándolo “entre los modelos de referencia” del sector.

Quién puede usar GPT Image 1.5 y cómo acceder

GPT Image 1.5 ya se está desplegando para todos los usuarios de ChatGPT a nivel global, tanto en web como en app móvil, sin necesidad de activar nada ni cambiar de modelo.

También está disponible para desarrolladores a través de la API bajo el nombre GPT Image 1.5. El acceso para cuentas Business y Enterprise llegará progresivamente.

La versión anterior de ChatGPT Images seguirá disponible como un GPT personalizado, pero todo apunta a que este nuevo modelo será el estándar de referencia a partir de ahora.

Foto: OpenAI

[…]

La entrada A horas de su lanzamiento, GPT Image 1.5 destrona a Gemini y se convierte en la mejor IA generadora de imágenes se publicó primero en Marketing4eCommerce.