Los investigadores de Microsoft han logrado lo que muchos en el campo de la inteligencia artificial consideraban un objetivo lejano: enseñar a la IA a comprender e interactuar con espacios tridimensionales de la misma manera que lo hacen los humanos. El avance se presenta en forma de Muse, un modelo de IA que puede comprender y generar secuencias de juego complejas manteniendo la física y los comportamientos de los personajes consistentes.
El modelo, detallado en un artículo publicado en Nature, aprendió completamente a partir de la observación de datos de juego humanos (durante más de siete años) del juego de Xbox Bleeding Edge. A diferencia de los modelos de IA tradicionales que funcionan con texto o imágenes estáticas, Muse desarrolla lo que los investigadores llaman una “comprensión práctica” de cómo interactúan los objetos, personajes y entornos en el espacio tridimensional a lo largo del tiempo.
Cómo Muse AI de Microsoft ve, aprende y juega como un humano
“La arquitectura del modelo es independiente del juego; el único requisito es el acceso a un conjunto de datos adecuado”, afirmó Katja Hofmann, directora de investigación principal de Microsoft Research, en una entrevista exclusiva con VentureBeat. “Diseñamos el modelo para utilizar el formato de datos más general, al que llamamos la ‘interfaz humana’ de elementos visuales y acciones del controlador”.
Este enfoque permite a Muse generar secuencias de juego consistentes que duran hasta dos minutos, un logro técnico significativo para mantener interacciones coherentes en el mundo 3D durante períodos prolongados. El sistema puede tomar solo un segundo de imágenes del juego como entrada y generar escenarios complejos que respetan la física del juego y los comportamientos de los personajes.
Sin embargo, existen limitaciones. “La resolución de la imagen está fijada en 300×180 píxeles”, dijo Hofmann a VentureBeat. “Existe un equilibrio entre el tamaño del modelo y la velocidad, lo que significa que nuestros modelos más grandes y consistentes también son los más lentos en el momento de la inferencia”.
Más allá de los juegos: cómo Muse podría dar forma a la arquitectura, el comercio minorista y la fabricación
El desarrollo de Muse se basó en un amplio aporte de los creadores de juegos. Los investigadores de Microsoft entrevistaron a 27 desarrolladores de juegos de todo el mundo, incluidos estudios de países desarrollados y en desarrollo, para asegurarse de que la tecnología satisficiera necesidades creativas reales.
Más allá de los juegos, Microsoft ve aplicaciones más amplias para esta tecnología. Peter Lee, presidente de Microsoft Research, destacó en una publicación de blog posibles usos en arquitectura, comercio minorista y fabricación: “Desde reconfigurar la cocina de su hogar hasta rediseñar un espacio minorista o construir un gemelo digital de una planta de producción para probar y explorar diferentes escenarios. Todas estas cosas ahora se están volviendo posibles con la IA”.
“La principal limitación para las aplicaciones más allá de los juegos es el acceso a datos de alta calidad”, dijo Hofmann a VentureBeat. “Los juegos son un área de aplicación excelente para impulsar avances, porque normalmente se pueden recopilar grandes cantidades de datos de alta calidad con mayor facilidad que en otros entornos 3D”.
Preservando la historia de los videojuegos y empoderando a los futuros creadores
En el caso específico de la industria de los videojuegos, Xbox está explorando cómo esta tecnología podría ayudar a preservar los juegos clásicos. “Gracias a este avance, estamos explorando el potencial de Muse para tomar juegos antiguos de catálogo de nuestros estudios y optimizarlos para cualquier dispositivo”, dijo Fatima Kardar, vicepresidenta corporativa de inteligencia artificial para juegos en Microsoft, en una publicación de blog.
El modelo logra tres innovaciones técnicas clave: mantener una física y una mecánica de juego coherentes a lo largo de secuencias extendidas; generar múltiples continuaciones variadas pero plausibles desde el mismo punto de partida; y permitir a los usuarios modificar el contenido generado manteniendo esos cambios de manera consistente.
“Personalmente, me fascina la capacidad de Muse de comprender en detalle un entorno 3D complejo simplemente observando los datos de juego de los jugadores”, afirmó Hofmann. “Nuestra investigación demuestra un paso emocionante hacia nuevas experiencias interactivas creadas por creativos que están hiperpersonalizadas para y por sus jugadores”.
Microsoft está lanzando los pesos del modelo y una herramienta de demostración para investigadores y creativos bajo una licencia de investigación de Microsoft, aunque todavía no es una oferta para clientes empresariales. Este lanzamiento tiene como objetivo fomentar una mayor investigación y exploración de las capacidades de la tecnología.
Este avance indica un cambio más amplio en las capacidades de la IA: desde la comprensión de contenido estático, como texto e imágenes, hasta la comprensión de entornos 3D dinámicos e interacciones humanas. Esto podría tener implicaciones de gran alcance para la forma en que diseñamos e interactuamos con los espacios virtuales en todas las industrias.
A medida que Microsoft avanza hacia la producción de esta investigación, enfatiza que la creatividad humana sigue siendo fundamental. La tecnología se posiciona como una herramienta de asistencia en lugar de un reemplazo para los diseñadores de juegos humanos, con el objetivo de aumentar el proceso creativo en lugar de automatizarlo.
Fuente.
VentureBeat (2025, 19 de febrero). La inteligencia artificial Muse de Microsoft puede diseñar mundos de videojuegos después de verte jugar. Recuperado el 20 de febrero de 2025, de: https://venturebeat.com/ai/microsofts-muse-ai-can-design-video-game-worlds-after-watching-you-play/