Google DeepMind conectó su modelo de mundo Genie 3 con las imágenes de Street View para que los usuarios puedan generar entornos interactivos a partir de una ubicación real. El anuncio, hecho público el 20 de mayo de 2026 por la división de investigación de Google, convierte casi dos décadas de captura de calles, interiores y zonas remotas en material vivo para entrenar agentes de IA y demos creativas.

El flujo es directo: el usuario suelta un pin en el mapa, elige un estilo opcional como Ocean World, Desert Sands, Stone Age o B&W film, y describe un personaje. Genie 3 construye un mundo caminable cuyo punto de partida está atado al material real de Street View, gracias a una interfaz llamada Maps Imagery Grounding que los desarrolladores de Google ya usaban para crear visuales asistidos por IA.

¿Qué demos mostró Google?

Las primeras demostraciones públicas vienen de Bilawal Sidhu, ex jefe de producto de AR/VR y 3D Maps en Google, que publicó el 19 de mayo varias pruebas en X. La lista incluye una carrera con un Fórmula 1 de marca Google Maps por el Strip de Las Vegas, un paseo en patineta como ardilla por el Palacio de Bellas Artes, una travesía en bote por el lago Lady Bird de Austin y un recorrido dentro de la Casa Blanca usando los datos de Street View para interiores.

Google también mostró un Golden Gate inundado y los Stockyards de Fort Worth, Texas, recreados al estilo de los años 1920. Las texturas todavía son suaves, la geometría inestable y las transiciones a veces caen en lo surreal, problemas típicos de un prototipo experimental que el propio equipo reconoce.

El verdadero activo es la base de datos

La historia de fondo no es el modelo, sino los datos. Google lleva 18 años capturando Street View en rutas, edificios, vías navegables y zonas remotas. Esa biblioteca cumple ahora doble función: material de entrenamiento y ancla para generar mundos.

El uso primario que Google le ve no es de consumo masivo. Genie está pensado como campo de pruebas para agentes de IA y robots que necesitan razonar y aprender en entornos físicos. SIMA 2, el agente de DeepMind, ya lo usa como terreno de entrenamiento. Waymo, la unidad de autos autónomos, simula escenarios de calle con Genie. Con Street View incorporado, esos entrenamientos pueden anclarse a ubicaciones reales: una calle de San Francisco, una bocacalle de Phoenix, un puerto.

¿Quién puede usarlo hoy?

Project Genie con Street View está disponible globalmente para suscriptores de Google AI Ultra, el plan más caro de Google a USD 200 mensuales y restringido a mayores de 18 años. Pero la generación a partir de un punto real funciona, por ahora, solo en ubicaciones de Estados Unidos. DeepMind ya anunció que el equipo trabaja en una versión mejorada y que la expansión geográfica está en la hoja de ruta.

El gancho técnico para integradores latinoamericanos es claro: si Genie con Street View prueba que un modelo de mundo puede entrenar agentes con datos visuales anclados, abre una vía para que startups que arman flotas de robots de logística o limpieza levanten simuladores baratos sin construir su propio dataset desde cero. La barrera de entrada deja de ser la cámara y pasa a ser el acceso a una base de imágenes con escala real.

Comparativa de modelos de mundo en 2026

ModeloEmpresaAnclaje realUso primario
Genie 3 + Street ViewGoogle DeepMindMapas reales (solo EE.UU.)Agentes, autos autónomos
Genie 3 (base)Google DeepMindPrompt textualDemos creativas
CosmosNVIDIASim sintéticaRobots industriales
World Labs (Fei-Fei Li)IndependienteImágenes 2DEdición 3D

La ventaja de Google sobre los demás es justamente el archivo: ningún competidor tiene una flota de autos cartografiando calles en producción desde 2007. Para replicarlo, NVIDIA o World Labs tendrían que licenciar imágenes a Mapillary, comprar a TomTom o financiar capturas masivas.