Punto clave de esta nota

Nvidia presentó Lyra 2.0, una IA que genera entornos 3D de hasta 90 metros usando una sola fotografía.

Punto clave de esta nota

El sistema soluciona la pérdida de memoria espacial almacenando la geometría 3D de cada cuadro previamente generado.

Punto clave de esta nota

Las escenas pueden exportarse como mallas a motores físicos como Isaac Sim para entrenar robots en simuladores.

Adiós al escaneo manual: IA de Nvidia crea mundos 3D con una foto

El nuevo modelo de inteligencia artificial de Nvidia genera escenarios de hasta 90 metros para simuladores físicos y entrenamiento robótico avanzado.

Daniela Díaz Gutiérrez

Editora de Tecnología (freelance) · Universidad Andrés Bello (UNAB)

Publicado el 26 de abril de 2026

Publicado el 26 de abril de 2026 · 07:05 a. m.3 min de lectura

Al grano

Nvidia presentó Lyra 2.0, una IA que genera entornos 3D de hasta 90 metros usando una sola fotografía.
El sistema soluciona la pérdida de memoria espacial almacenando la geometría 3D de cada cuadro previamente generado.
Las escenas pueden exportarse como mallas a motores físicos como Isaac Sim para entrenar robots en simuladores.

Por qué importa

Por qué importa: La creación de entornos de simulación para el entrenamiento de robots es un cuello de botella histórico. Escanear espacios del mundo real requiere hardware costoso, tiempo y un procesamiento intensivo de nubes de puntos. Con Lyra 2.0, Nvidia propone un atajo revolucionario: pasar de una simple imagen 2D a un entorno 3D navegable y exportable a motores físicos como Isaac Sim. Para el ecosistema maker y los desarrolladores en América Latina, esta tecnología promete democratizar el acceso a simulaciones avanzadas, permitiendo entrenar agentes de IA y modelos de robótica sin necesidad de laboratorios millonarios. Aunque por ahora se limita a escenas estáticas, la capacidad de corregir el drift geométrico marca un hito en la generación de mundos sintéticos a escala.

Puntos clave

Investigadores de Nvidia presentan Lyra 2.0, un sistema que genera entornos 3D coherentes con una extensión de hasta 90 metros a partir de una sola foto.

El sistema almacena la geometría 3D ya generada como orientación y se entrena específicamente contra pérdidas de calidad para resolver dos debilidades centrales de los modelos de video anteriores.

Según Nvidia, Lyra 2.0 supera a seis competidores y puede exportar las escenas generadas a motores de física como Isaac Sim para entrenar robots en entornos generados.

Investigadores de Nvidia han revelado Lyra 2.0, un sistema que genera grandes entornos 3D coherentes a partir de una sola fotografía. Las escenas resultantes pueden explorarse en tiempo real y usarse directamente en simulaciones de robots.

Los modelos de IA existentes para la generación de escenas 3D tienen dificultades con trayectorias de cámara largas: cuanto más se aleja la cámara virtual de su punto de partida, más se distorsionan los colores y las estructuras. Cuando la cámara regresa a una ubicación vista previamente, el modelo a menudo reinventa el entorno desde cero. Los investigadores de Nvidia buscan resolver este problema con Lyra 2.0.

El sistema toma una sola foto y genera videos controlados por cámara que simulan un recorrido virtual por una escena. Estos videos luego se convierten automáticamente en representaciones 3D que pueden visualizarse en tiempo real y utilizarse en entornos de simulación. Según el artículo de investigación, las escenas generadas pueden abarcar aproximadamente 90 metros.

Cómo Lyra 2.0 soluciona los dos mayores problemas en la generación de escenas 3D

Los modelos de video actuales fallan en dos desafíos fundamentales, según los investigadores. Primero, el modelo olvida las áreas vistas previamente en cuanto salen del encuadre. Segundo, los pequeños errores se acumulan durante la generación de video paso a paso, convirtiéndose en distorsiones significativas con el tiempo.

Para abordar el primer problema, Lyra 2.0 almacena la geometría 3D para cada cuadro generado. Cuando la cámara se mueve de regreso hacia un área visitada anteriormente, el sistema recupera los cuadros anteriores y utiliza su información espacial como referencia. El modelo de video sigue encargándose de la generación real de la imagen, lo que significa que los errores en la geometría almacenada no se transfieren directamente a los nuevos cuadros.

Para evitar la desviación (drift), los investigadores exponen deliberadamente el modelo a sus propios resultados defectuosos durante el entrenamiento. Esto le enseña a reconocer y corregir la degradación de calidad en lugar de transmitir los errores.

Lyra 2.0 supera a seis métodos de la competencia

En pruebas de rendimiento sobre dos conjuntos de datos, Lyra 2.0 supera a otros seis métodos —incluyendo GEN3C, Yume-1.5 y CaM— en casi todos los criterios medidos, como calidad de imagen, consistencia de estilo y control de cámara, según Nvidia. Una variante más rápida del modelo genera videos aproximadamente 13 veces más rápido con una calidad comparable.

Las escenas 3D generadas pueden explorarse paso a paso a través de una interfaz interactiva y exportarse como mallas (meshes) a motores de física como Nvidia Isaac Sim. Esto podría permitir que los robots se entrenen en entornos completamente generados sin necesidad de capturar datos 3D del mundo real, afirma la compañía. Por ahora, sin embargo, Lyra 2.0 solo soporta escenas estáticas.

Noticias de IA sin exageraciones

Suscríbete a THE DECODER para una lectura sin anuncios, un boletín semanal sobre IA, nuestro informe exclusivo "AI Radar" seis veces al año, acceso completo al archivo y acceso a nuestra sección de comentarios.

Vía The Decoder.

Publicado originalmente en The Decoder.

Etiquetas

#nvidia #ia-generativa #robotica #isaac-sim #modelos-3d

Sobre esta cobertura: Esta nota fue traducida del idioma original al español con apoyo de inteligencia artificial y revisada editorialmente por Daniela Díaz Gutiérrez, editora de tecnología (freelance) (Universidad Andrés Bello (UNAB)). La política editorial de MechaNoticias exige verificación humana de cifras, atribuciones y contexto antes de publicar.

Suscríbete y recibe las 5 noticias más importantes cada mañana

Selección editorial diaria con la cobertura técnica de IA, robótica, electrónica y microcontroladores que importa. Un solo correo en tu bandeja a primera hora. Sin clickbait, sin ruido.

Sin spam. Puedes cancelar con un click desde cualquier correo.

Comentarios

Sé el primero en aportar.

Formato: **negrita** *cursiva* `código` [link](url)

0/4000

Cargando comentarios…

Seguir leyendo

NVIDIA impulsa la manufactura con IA en Hannover Messe 2026

En Hannover Messe 2026, NVIDIA despliega infraestructuras de IA soberana, gemelos digitales en tiempo real y robots humanoides para transformar la industria global.

NVIDIA Bloghace 20 horas

NVIDIA y Google Cloud impulsan la IA agéntica y física

La alianza presenta infraestructura Vera Rubin, GPUs Blackwell y nuevas herramientas para escalar gemelos digitales y agentes autónomos en la nube.

NVIDIA Bloghace 20 horas

Antioch: La startup que busca ser el Cursor de la IA física

Con una ronda de 8,5 millones de dólares, Antioch desarrolla herramientas de simulación para programar agentes físicos con la facilidad del desarrollo de software.

TechCrunch AIhace 19 horas

Entrenamiento de RL con precisión FP8 de extremo a extremo

NVIDIA NeMo RL optimiza el rendimiento del aprendizaje por refuerzo mediante cuantización FP8, logrando mayor velocidad sin perder precisión en modelos de lenguaje.

NVIDIA Developerhace 20 horas

→Al grano

✦Por qué importa

Puntos clave

Cómo Lyra 2.0 soluciona los dos mayores problemas en la generación de escenas 3D

Lyra 2.0 supera a seis métodos de la competencia

Noticias de IA sin exageraciones

Suscríbete y recibe las 5 noticias más importantes cada mañana

Seguir leyendo

NVIDIA impulsa la manufactura con IA en Hannover Messe 2026

NVIDIA y Google Cloud impulsan la IA agéntica y física

Antioch: La startup que busca ser el Cursor de la IA física

Entrenamiento de RL con precisión FP8 de extremo a extremo

Al grano

Por qué importa