Alibaba lanza Qwen-Image-Edit, su precisa herramienta de edición de imágenes con IA

Imagen compuesta por cuatro variaciones de una imagen principal (la de la esquina superior izquierda) de un panda rojo surfeando.

Alibaba acaba de presentar Qwen-Image-Edit, su herramienta de edición de imágenes con IA impulsada por su modelo Qwen-Image 20B. Esta novedad integra capacidades de edición y variación de imágenes, así como de inserción o modificación de texto de alto nivel, ofreciendo resultados precisos y consistentes.

Otro gran punto a favor de Qwen-Image-Edit es que puede usarse de forma gratuita a través de la plataforma Qwen Chat al seleccionar la función «Edición de imagen».

Capacidades de Qwen-Image-Edit

De acuerdo con la información compartida por Alibaba, «Qwen-Image-Edit extiende con éxito las capacidades únicas de renderizado de texto de Qwen-Image a tareas de edición de imágenes, permitiendo una edición precisa del texto. Además, Qwen-Image-Edit alimenta simultáneamente la imagen de entrada a Qwen2.5-VL (para el control semántico visual) y al codificador VAE (para control de la apariencia visual), logrando capacidades tanto de edición semántica como de apariencia».

La apariencia visual y la semántica visual se refieren a dos aspectos diferentes de la edición de imágenes, y el texto. Por su parte, la edición de la apariencia visual hace referencia a acciones como agregar, eliminar o modificar elementos de la imagen, mientras que la edición de la semántica visual se refiere a cambios como la variación de estilos o rotación de objetos.

Una vez que hemos dejado que nos explique la parte más técnica, vamos con lo divertido de verdad: ¡descubrir sus capacidades!

Consistencia

Hasta hace relativamente poco el crear variaciones de una imagen manteniendo la consistencia de personajes, objetos o escenarios era una tarea pendiente en las capacidades de las IAs generadoras de imágenes. Pero el rápido avance de esta tecnología ha logrado superar esta barrera, así lo demuestran modelos como Midjourney o GPT-4o y, ahora, Qwen-Image-Edit.

La herramienta de edición de imágenes con IA de Alibaba presenta un gran rendimiento en este aspecto, siendo capaz de generar variaciones que conserven las características deseadas mientras se modifican otras partes de la imagen. La propia compañía compartió este ejemplo en el que Qwen-Image-Edit creó varias versiones de Capibara, la mascota de los modelos Qwen, realizando diferentes actividades.

Imagen que muestra las capacidades de variación de imágenes con consistencia de Qwen-Image-Edit al crear variaciones del capibara mascota de Alibaba haciendo acciones como tocar la guitarra, pintar, regar una flor, etc.

Alibaba explica: «aunque la mayoría de los píxeles de la imagen editada difieren de los de la imagen de entrada (la imagen más a la izquierda), la consistencia del carácter de Capibara se conserva perfectamente. La potente función de edición semántica de Qwen-Image-Edit permite la creación sencilla y diversa de contenido original de PI (propiedad intelectual)».

Edición de texto precisa

Una de las grandes mejoras que integra Qwen-Image-Edit es la edición de texto. Esta capacidad le permite agregar, eliminar y modificar textos conservando la fuente, el tamaño y estilo originales. La única pega que podemos ponerle es que, de momento, tan solo funciona correctamente para textos en chino e inglés.

Ejemplo que muestra la función de edición de texto de esta IA

Síntesis de nuevas vistas

Las capacidades de edición de esta herramienta también le permiten rotar objetos y personajes, permitiendo crear obras en las que obtengamos una nueva perspectiva de su contenido y de sus protagonistas.

Imagen que muestra varios ejemplos de los resultados de Qwen-Image-Edit variando imágenes cambiando la perspectiva de personajes

Aplicación de nuevos estilos

Por supuesto, Qwen-Image-Edit también es capaz de aplicar nuevos estilos artísticos a una imagen mientras conserva el contenido de la misma. Tan solo debes indicarle qué estilo o textura quieres que tenga tu nueva obra y la IA la generará para ti.

Modificación del estilo artístico de una imagen

Así mismo también puedes pedirle a la herramienta que realice modificaciones de apariencia sobre un elemento concreto de la imagen. Por ejemplo, yo primero creé una imagen de un panda rojo surfeando estilo dibujo animado con la función «Generación de imágenes» y luego usé la función «Edición de imagen» para hacer que únicamente el panda rojo pasase a tener textura de peluche.

Variación del estilo de un panda rojo con Qwen-Image-Edit mientras el escenario de la imagen mantiene un estilo de dibujo animado

Añade o elimina elementos fácilmente

Otra posibilidad que ofrece Qwen-Image-Edit es la de añadir o eliminar objetos y personajes de las imágenes. Esto lo consigue manteniendo inalterada el resto de la obra, lo cual resulta de gran utilidad. Además, esta capacidad puede llevarse a planos más complejos al aplicarla, por ejemplo, en cambios de vestuario.

Ejemplo que muestra la función de variación de vestuario de esta IA

Sumado a esto, la herramienta también permite modificar escenarios y cambiar los fondos de las imágenes para situar a los elementos o personajes protagonistas en nuevos mundos o contextos.

Ejemplo en el que a la imagen del panda rojo haciendo surf le cambiamos el fondo para ubicar al panda rojo en una discoteca

Foto: Imágenes generadas con Qwen-Image-Edit

[…]

La entrada Alibaba lanza Qwen-Image-Edit, su precisa herramienta de edición de imágenes con IA se publicó primero en Marketing4eCommerce.