Google lanza Project Genie, su prototipo de IA para generar mundos interactivos

Usuarios de Estados Unidos con suscripción a Google AI Ultra podrán experimentar con la creación y exploración de escenarios virtuales realistas, gracias a la integración de inteligencia artificial avanzada en el nuevo prototipo, con una duración máxima de 60 segundos por sesión

Guardar

La decisión de Google de permitir el acceso público a Project Genie se relaciona con la intención de incrementar el número de personas que pueden experimentar y dar retroalimentación sobre el sistema, según explicó Shlomi Frutcher, director de Investigación de DeepMind, en una entrevista citada por TechCrunch. Este acceso, sin embargo, presenta restricciones, ya que solo los usuarios con una suscripción de Google AI Ultra en Estados Unidos pueden acceder al prototipo y solo por un periodo máximo de 60 segundos por sesión. Frutcher puntualizó que esta limitación temporal responde al objetivo de facilitar que llegue a una mayor cantidad de usuarios, dado que implica la asignación de un chip exclusivo para cada sesión.

El medio TechCrunch detalló que Project Genie es una iniciativa que fusiona varias tecnologías de inteligencia artificial desarrolladas por Google: el modelo Genie 3, el generador de imágenes Nano Banana y el asistente Gemini. Después del lanzamiento de Genie 3 en agosto por parte de Google DeepMind, el cual logró avances notables en la generación de entornos más realistas con un nivel de interacción en tiempo real durante varios minutos y con una resolución de 720p, la firma decidió abrir el acceso al público general. Inicialmente, Genie 3 solo estaba disponible para desarrolladores y generaba solo imágenes estáticas en 3D; su evolución permitió la creación de entornos dinámicos y respuestas inmediatas a las acciones del usuario.

Según consignó TechCrunch, los usuarios pueden experimentar diferentes funcionalidades dentro de Project Genie. El proceso de uso se divide en tres etapas principales. En primer lugar, mediante Nano Banana Pro, el usuario puede visualizar un boceto previo de su mundo virtual, incluyendo la posibilidad de definir tanto el entorno como los personajes y las formas de interacción. Esta fase de boceto facilita la personalización antes de pasar a la generación final del entorno.

La segunda modalidad consiste en la exploración libre del entorno virtual generado, apoyada en la capacidad de Genie 3 de crear y modificar escenas en tiempo real conforme el usuario interactúa con el entorno. Esto permite al participante desplazarse y probar diversas acciones, con el entorno respondiendo de forma adaptativa. Finalmente, la herramienta permite la reedición y combinación de mundos generados previamente, lo que facilita la personalización y reutilización de experiencias anteriores.

Según lo publicado, Google advirtió en su plataforma que Project Genie se encuentra en fase prototipo, lo que implica una serie de limitaciones técnicas. Los entornos generados pueden no resultar completamente fieles ni seguir las indicaciones del usuario de manera estricta, y el control sobre los personajes podría enfrentar ciertas deficiencias. Otro aspecto relevante es la posibilidad de experimentar mayor latencia durante su utilización.

La integración de varias capacidades de inteligencia artificial se presenta como uno de los ejes principales del proyecto, reportó TechCrunch. Al combinar el procesamiento visual y de imágenes, la generación de escenarios, y la asistencia conversacional de Gemini, Google busca ofrecer a los usuarios una experiencia más inmersiva y personalizable con herramientas que hasta hace poco estaban restringidas al desarrollo interno.

El acceso restringido a clientes con suscripción de Google AI Ultra, junto con la breve duración de las sesiones, responde tanto a la disponibilidad de recursos técnicos como a la necesidad de recopilar información directa de los participantes sobre el funcionamiento y los posibles fallos del sistema, confirmaron desde la compañía.

Project Genie representa una nueva fase en el desarrollo de herramientas de inteligencia artificial destinadas a la generación de mundos virtuales explorables. Según la información difundida por TechCrunch, la compatibilidad entre los diferentes módulos y la respuesta en tiempo real constituyen avances comparativos respecto a versiones previas de la tecnología.

Por el momento, el prototipo únicamente se encuentra disponible en Estados Unidos, bajo las condiciones mencionadas, mientras Google continúa recabando datos y opiniones con vistas al desarrollo futuro de la herramienta, según se desprende de la comunicación oficial de la empresa y de las declaraciones recogidas por TechCrunch.