NVIDIA mostró una flota de robots agénticos que aprenden por sí mismos tareas de alta precisión en el mundo físico. El reel del demo del nuevo framework, llamado ENPIRE, incluye brazos robóticos eligiendo una tarjeta gráfica para encajarla en una placa madre, robots ordenando pines metálicos por tamaño y manipulando zip ties para cortarlos en el largo correcto.

Jim Fan, director de IA y Distinguished Scientist en NVIDIA, asegura que la demostración prueba que los investigadores pueden, en sus palabras, "habilitar AutoResearch en el mundo físico por primera vez".

¿Cómo funciona ENPIRE por dentro?

El proyecto entregó 8 agentes Codex a una flota de robots, una asignación de GPUs y un presupuesto generoso de tokens. La consigna fue simple: resolver una tarea lo más rápido posible, sin equivocarse.

"La flota de robots empieza a tomar vida: aprenden a buscar pistas visuales, resetean la escena, practican habilidades nuevas, ajustan el stack de control, leen papers online, debaten, reflexionan, se traban e intentan de nuevo directo en el hardware", explica Fan, basado en Stanford. "Lo único que hicimos fue darle a Codex una API al mundo de los átomos, el resto es emergencia".

El framework se apoya en cuatro módulos centrales:

  • Environment (EN): reset automático y verificación de la escena.
  • Policy Improvement (PI): refinamiento de la política de control.
  • Rollout (R): evaluación de políticas con uno o varios robots físicos operando en paralelo.
  • Evolution (E): los agentes analizan logs, consultan literatura científica y mejoran la infraestructura de entrenamiento y el código del algoritmo para corregir modos de falla.

¿Qué tan bien instala una GPU el robot?

La tarea más comentada es la del PC DIY. En la grabación, un brazo robótico elige una tarjeta gráfica y se la pasa a otro brazo que tiene una placa madre frente a él. El segundo brazo alinea con cuidado el conector PCIe de la tarjeta con el zócalo de la placa, baja gradualmente y la empuja en su lugar. El movimiento "se balanceó un poco" durante la inserción, según Tom's Hardware, aunque la pieza habría quedado bien instalada de todas formas.

Las otras pruebas de AutoResearch incluyen organizar pines finos por tipo y atar y cortar zip ties.

¿Qué agentes y modelos se compararon?

El paper asociado, ENPIRE: Agentic Robot Policy Self-Improvement in the Real World, detalla las técnicas y publica una tabla comparativa entre tres combinaciones de coding agent:

Los investigadores también testearon escalar el tamaño de la flota y concluyeron que ocho robots explorando en paralelo resuelven la tarea significativamente más rápido que menos unidades. Fan bromeó con que el objetivo final es entrenar a los robots para que todo el equipo se vaya de vacaciones "y Jensen ni se entere".

¿Reemplaza esto a las líneas de ensamblaje?

Acá conviene templar el entusiasmo. Los comentarios bajo la nota original de Tom's Hardware apuntan a lo obvio: una línea de ensamblaje bien diseñada, con plantillas y jigs, instalaría cientos de miles de GPUs en el mismo tiempo que un solo robot ENPIRE necesita para "aprender" cómo hacerlo. ENPIRE no apunta al volumen industrial. Apunta a que un agente descubra solo el procedimiento, lo iteree y lo deje codificado para reutilizarlo. La promesa es de generalización, no de throughput.