Todos hemos abierto Street View para mostrarle a un amigo cómo se veía nuestra casa de infancia, o arrastrado el muñequito amarillo sobre las calles de París para verificar si reservamos el hotel en un buen barrio. Lo que Google DeepMind anunció este martes en Google I/O 2026 es algo más ambicioso: que Project Genie, su modelo de mundo de propósito general, pueda hacer eso mismo de forma interactiva, simulando la calle y su entorno con la posibilidad de cambiar el clima o ver cómo se vería bajo un escenario tipo El día después de mañana.
Para lograrlo, DeepMind conecta a Genie con Street View, el dataset de imágenes capturadas por 20 años de autos con cámaras y mochileros con tracker backpacks. Google asegura que ha acumulado más de 280.000 millones de imágenes en 110 países y los siete continentes. La nueva capacidad arranca hoy para usuarios de Google AI Ultra en Estados Unidos y se desplegará a Ultra global en las próximas semanas.
¿Para qué sirve un Genie anclado a la calle real?
La motivación principal son los agentes y los robots. Genie 3 ya está siendo usado por uno de los simuladores de Waymo para entrenar a sus autos autónomos en eventos extremadamente raros, como tornados o encuentros casuales con elefantes. Sumar Street View permite preparar al sistema para nuevas ciudades antes del despliegue físico.
Jack Parker-Holder, research scientist del equipo de open-endedness de DeepMind, lo planteó con un ejemplo concreto a TechCrunch:
"Es realmente potente para los casos de uso de agentes y robótica y también para que los humanos jueguen con él, esa siempre fue la tesis de Genie", dijo Parker-Holder. Imaginen, agregó, un robot recién desplegado en Londres, ciudad que ve poco sol: Genie podría simular esas raras ocasiones en que los rayos pegan en las casas victorianas, para que la luz no sorprenda al robot cuando ocurra en la calle.
"Simultáneamente, podrías decir 'voy a Nueva York, pero no en esta época del año, va a estar nevado, quiero ver cómo se ve esa cuadra en la nieve'", continuó.
¿Qué tan precisa es la simulación hoy?
Diego Rivas, product manager de DeepMind, advirtió que Street View dentro de Genie sigue siendo un experimento y hay mucho por mejorar en precisión. En las muestras que el equipo de Google mostró a TechCrunch, incluida la simulación submarina de un barrio donde vivió la periodista, los resultados son reconocibles, pero todavía se ven más como videojuego que como fotorrealismo.
Los modelos tampoco son physics-aware: no entienden causa y efecto. En una simulación de una mujer corriendo por un Joshua Tree nevado, ella atravesaba cactus y arbustos sin colisión. Es un contraste fuerte con el generador de imágenes Nano Banana de Google, que ya escribe texto correcto dentro de infografías, o con Veo, su modelo de video, que entiende que los barcos de papel flotan en corrientes de agua, el humo se dispersa en el aire y la tela cae sobre las formas.
La física no se programa en estos modelos: la aprenden por observación pasiva, como cualquier ser vivo. Parker-Holder estima el delta: "Para este tipo de modelo, está quizá entre seis y doce meses detrás del video en precisión y calidad, así que es algo que vamos a resolver".
El verdadero salto: continuidad espacial
Jonathan Herbert, director de Google Maps que partió como interno en el equipo de Street View hace 12 años, identificó el cambio fundamental: Genie todavía no reconstruye fielmente una calle, pero sí logra continuidad espacial. Si el usuario gira 360 grados, el modelo recuerda y simula correctamente lo que había detrás. A partir de ese punto, puede construir un entorno nuevo sobre esa base.
"Siempre pensamos en cómo construir el modelo más rico del mundo sobre los datos de Street View", afirmó Herbert. "Definitivamente fue una idea nuestra durante mucho tiempo usar los datos de Maps de formas nuevas y para nuevos tipos de investigación en IA".
¿Cómo se usa desde hoy?
Dentro de Project Genie, el usuario puede pulsar el pin de Maps para elegir un lugar en Estados Unidos, opcionalmente seleccionar un estilo (por ejemplo "Desert Sands" o "Stone Age") y describir un personaje (un animal favorito, un héroe de cómic, un monstruo de plastilina). Genie entonces genera un mundo con la ubicación inicial anclada en Street View. La capacidad se apoya en Maps Imagery Grounding, la misma tecnología que desarrolladores externos pueden integrar.
Los ejemplos que mostró Google: ver el Golden Gate Bridge bajo el océano con bancos de peces, o explorar los Fort Worth Stockyards de Texas como se habrían visto en los años 20, con saloons, autos antiguos y trading posts.
Lo que queda por confirmar para LatAm
Project Genie es exclusivo del plan Google AI Ultra, hoy rebajado a USD 200 mensuales (antes USD 250) y con un nuevo plan Ultra intermedio a USD 100 lanzado simultáneamente. La integración con Street View parte solo con lugares de Estados Unidos, con planes de expandirse a más países. Para usuarios chilenos, eso implica que el caso de uso más interesante (simular calles familiares de Santiago o Valparaíso para entrenar agentes locales) todavía no está disponible. Google no especificó fechas para la expansión geográfica de la feature, solo para los suscriptores Ultra globales.




