NVIDIA ENPIRE: robots aprenden solos a instalar GPUs

El framework entrega una flota de robots y un presupuesto de tokens a 8 agentes Codex para que descubran solos cómo alinear conectores PCIe, ordenar pines metálicos y cortar zip ties.

Publicado el 18 de junio de 2026 · 06:06 p. m.3 min de lectura

Al grano

NVIDIA presentó ENPIRE, framework agéntico donde 8 coding agents Codex se autoentrenan con una flota de robots para resolver tareas dexterosas.

El demo más viral muestra un brazo robótico alineando e insertando una tarjeta gráfica en el conector PCIe de una placa madre.

El paper compara Codex con GPT-5.5, Claude Code con Opus 4.7 y Kimi Code con Kimi K2.6 sobre la misma tarea física.

Por qué importa

Lo interesante de ENPIRE no es el robot instalando una RTX, es que el ciclo de mejora ya no necesita un investigador humano leyendo el log de fallas. Si el agente aprende solo a depurar el control stack en hardware, el cuello de botella deja de ser el ingeniero de robótica y pasa a ser el presupuesto de tokens. La gracia ya no está en la rutina física, está en el dataset físico que generan estos experimentos.

NVIDIA mostró una flota de robots agénticos que aprenden por sí mismos tareas de alta precisión en el mundo físico. El reel del demo del nuevo framework, llamado ENPIRE, incluye brazos robóticos eligiendo una tarjeta gráfica para encajarla en una placa madre, robots ordenando pines metálicos por tamaño y manipulando zip ties para cortarlos en el largo correcto.

Jim Fan, director de IA y Distinguished Scientist en NVIDIA, asegura que la demostración prueba que los investigadores pueden, en sus palabras, "habilitar AutoResearch en el mundo físico por primera vez".

¿Cómo funciona ENPIRE por dentro?

El proyecto entregó 8 agentes Codex a una flota de robots, una asignación de GPUs y un presupuesto generoso de tokens. La consigna fue simple: resolver una tarea lo más rápido posible, sin equivocarse.

"La flota de robots empieza a tomar vida: aprenden a buscar pistas visuales, resetean la escena, practican habilidades nuevas, ajustan el stack de control, leen papers online, debaten, reflexionan, se traban e intentan de nuevo directo en el hardware", explica Fan, basado en Stanford. "Lo único que hicimos fue darle a Codex una API al mundo de los átomos, el resto es emergencia".

El framework se apoya en cuatro módulos centrales:

Environment (EN): reset automático y verificación de la escena.
Policy Improvement (PI): refinamiento de la política de control.
Rollout (R): evaluación de políticas con uno o varios robots físicos operando en paralelo.
Evolution (E): los agentes analizan logs, consultan literatura científica y mejoran la infraestructura de entrenamiento y el código del algoritmo para corregir modos de falla.

¿Qué tan bien instala una GPU el robot?

La tarea más comentada es la del PC DIY. En la grabación, un brazo robótico elige una tarjeta gráfica y se la pasa a otro brazo que tiene una placa madre frente a él. El segundo brazo alinea con cuidado el conector PCIe de la tarjeta con el zócalo de la placa, baja gradualmente y la empuja en su lugar. El movimiento "se balanceó un poco" durante la inserción, según Tom's Hardware, aunque la pieza habría quedado bien instalada de todas formas.

Las otras pruebas de AutoResearch incluyen organizar pines finos por tipo y atar y cortar zip ties.

¿Qué agentes y modelos se compararon?

El paper asociado, ENPIRE: Agentic Robot Policy Self-Improvement in the Real World, detalla las técnicas y publica una tabla comparativa entre tres combinaciones de coding agent:

Codex con GPT-5.5
Claude Code con Opus 4.7
Kimi Code con Kimi K2.6

Los investigadores también testearon escalar el tamaño de la flota y concluyeron que ocho robots explorando en paralelo resuelven la tarea significativamente más rápido que menos unidades. Fan bromeó con que el objetivo final es entrenar a los robots para que todo el equipo se vaya de vacaciones "y Jensen ni se entere".

¿Reemplaza esto a las líneas de ensamblaje?

Acá conviene templar el entusiasmo. Los comentarios bajo la nota original de Tom's Hardware apuntan a lo obvio: una línea de ensamblaje bien diseñada, con plantillas y jigs, instalaría cientos de miles de GPUs en el mismo tiempo que un solo robot ENPIRE necesita para "aprender" cómo hacerlo. ENPIRE no apunta al volumen industrial. Apunta a que un agente descubra solo el procedimiento, lo iteree y lo deje codificado para reutilizarlo. La promesa es de generalización, no de throughput.

NVIDIA ENPIRE: robots aprenden solos a instalar GPUs

Al grano

Por qué importa

¿Cómo funciona ENPIRE por dentro?

¿Qué tan bien instala una GPU el robot?

¿Qué agentes y modelos se compararon?

¿Reemplaza esto a las líneas de ensamblaje?

Seguir leyendo

NVIDIA NeMo automatiza la investigación en RL con agentes

ENPIRE: NVIDIA hace que ocho robots se entrenen solos al 99% con agentes

NVIDIA lanza los Jetson T2000 y T3000 para IA en el borde

RoboLab de NVIDIA evalua robots generalistas en simulacion

→Al grano

✦Por qué importa

¿Cómo funciona ENPIRE por dentro?

¿Qué tan bien instala una GPU el robot?

¿Qué agentes y modelos se compararon?

¿Reemplaza esto a las líneas de ensamblaje?

Seguir leyendo

NVIDIA NeMo automatiza la investigación en RL con agentes

ENPIRE: NVIDIA hace que ocho robots se entrenen solos al 99% con agentes

NVIDIA lanza los Jetson T2000 y T3000 para IA en el borde

RoboLab de NVIDIA evalua robots generalistas en simulacion

Al grano

Por qué importa