
Primero llegó la posibilidad de generar imágenes a partir de una simple instrucción de texto. Después, la facilidad para crear clips de vídeo con solo pedírselo a una IA. En paralelo, los modelos de inteligencia artificial perfeccionaron su capacidad de generar código a niveles cada vez más complejos.
Ahora la IA es capaz de generar mundos. Al menos, mundos virtuales, claro 🙂
Project Genie, la última evolución de la IA de Google
Project Genie es un nuevo paso adelante en la ambición de Google DeepMind por alcanzar la Inteligencia Artificial General. Basado en el potente modelo de mundos Genie 3, este prototipo experimental es capaz de simular entornos dinámicos que responden en tiempo real a las acciones del usuario.
Como si creases el mundo abierto de un videojuego a partir de puro lenguaje natural.
¿Qué es un “modelo de mundo”?
A diferencia de las IA tradicionales que predicen la siguiente palabra o píxel, un modelo de mundo como Genie 3 simula la física y las interacciones de un entorno. Esto le permite predecir cómo evolucionará un escenario y cómo le afectarán sus movimientos. Mientras que Google DeepMind ya había dominado entornos cerrados como el ajedrez o el Go, Genie 3 está diseñado para navegar por la diversidad del mundo real, desde la robótica hasta la recreación de entornos históricos.
Tres pilares para crear realidades

Project Genie es una aplicación web impulsada por la combinación de Genie 3, Nano Banana Pro y Gemini. y se apoya en tres grandes funcionalidades:
- World Sketching: Mediante texto o imágenes cargadas, puedes definir tu personaje y el paisaje. Gracias a la integración con Nano Banana Pro, es posible previsualizar y ajustar la escena, e incluso elegir la perspectiva (en primera o tercera persona) antes de entrar.
- World Exploration: Una vez generado, el mundo es totalmente navegable, como si entrases en Roblox o Minecraft. A medida que avanzas, la IA genera el camino en tiempo real basándose en lo que haces, permitiéndote además ajustar la cámara mientras te desplazas. Además (y esta, la de la consistencia temporal, es una capacidad bastante más impresionante de lo que parece) permite desandar tus pasos y retornar el camino andado. El mundo no desaparece a medida que lo dejas atrás. Tal y como en un videojuego
- World Remixing: Los usuarios pueden tomar mundos existentes y reinterpretarlos modificando sus instrucciones iniciales mediante lenguaje natural, desde las características del mundo al aspecto de sus personajes o inspirarse en una galería de opciones para construir nuevas experiencias. Tras acabar, pueden descargar vídeos de sus mundos y exploraciones.
Un camino responsable hacia la AGI
La relación entre avances como Project Genie y la Inteligencia Artificial General (AGI o IAG) no es directa, pero sí deja ver un camino que recorrer. Project Genie no es una AGI ni pretende serlo, pero aborda uno de los problemas fundamentales que cualquier inteligencia verdaderamente general debe resolver: entender cómo funciona un mundo y anticipar las consecuencias de sus acciones. Hasta ahora, la mayoría de los sistemas de IA se han centrado en describir la realidad a partir de patrones estadísticos. Los modelos de mundo, en cambio, intentan algo distinto: simular la causalidad, mantener coherencia en el tiempo y responder de forma consistente a la interacción.
Google DeepMind lleva años explorando esta vía porque entrenar una IA directamente en el mundo físico es costoso, lento y, en muchos casos, inviable. Los entornos simulados ofrecen un terreno seguro y escalable para experimentar, fallar y aprender sin consecuencias reales. Project Genie encaja en esta estrategia como un laboratorio de mundos donde futuros sistemas podrían entrenarse antes de enfrentarse a tareas reales, desde la robótica hasta la toma de decisiones complejas.
Aun así, conviene ser prudentes. Los mundos que genera Project Genie son limitados, de corta duración y carecen de la riqueza semántica, la memoria a largo plazo y los objetivos propios que exigiría una AGI. El sistema no comprende el mundo como lo haría un ser humano: lo simula. Pero incluso esa simulación representa un paso importante, porque sin un modelo interno del entorno, cualquier inteligencia, por avanzada que sea en lenguaje o razonamiento, seguirá siendo incapaz de actuar de forma autónoma y coherente.
A pesar de su potencial, Google subraya que todavía se trata de un prototipo de investigación. Como toda tecnología emergente, tiene limitaciones: las visualizaciones pueden no ser 100% fieles a la realidad, los personajes pueden presentar latencia en el control y las generaciones están limitadas actualmente a 60 segundos .
Actualmente, el acceso a Project Genie se está desplegando para suscriptores de Google AI Ultra en Estados Unidos (mayores de 18 años). El objetivo final es ambicioso: utilizar estos entornos para entrenar futuros sistemas de IA en escenarios seguros y diversos, acercándonos un paso más a una inteligencia capaz de comprender y actuar en nuestro mundo físico.
Imagen: Google
[…]
La entrada La IA de Google empieza a crear… mundos interactivos. Un vistazo a las posibilidades del nuevo Project Genie se publicó primero en Marketing4eCommerce.