Los humanoides ya pueden correr, bailar e incluso, ocasionalmente, patear a alguien. Pero para volverse verdaderamente útiles, van a tener que aprender a hacer las tareas menores que llenan la jornada de una oficina.
Flexion Robotics, una startup suiza fundada por ex-investigadores de robótica de NVIDIA, cree que tiene la solución. La compañía desarrolló una forma de entrenar robots para ejecutar tareas complejas que se descomponen en habilidades simples: abrir puertas, subir escaleras y cargar cajas. La clave es enseñar habilidades individuales en simulación y dejar que un algoritmo maestro decida cómo usarlas.
¿En qué se diferencia de la teleoperación?
La mayoría de los videos demo muestra humanoides entrenados para una tarea específica, como doblar poleras o cargar estantes. Típicamente eso se hace por teleoperación: una persona detrás del telón controla los movimientos del robot. Pero ese enfoque no funciona de manera confiable cuando el robot es puesto en escenarios que no vio antes. Flexion sostiene que su sistema es distinto, y más eficiente, porque entrena a los robots en simulación con instrucciones humanas mínimas.
El video de abajo muestra el software en acción. Un humanoide Unitree modificado opera solo tras recibir el siguiente comando: "Un paquete con snacks fue entregado para Flexion. Recuperalo usando la escalera y sube por el ascensor. Después desempacalo y guarda los ítems en el cajón vacío del estante del área de snacks".
!Robot recogiendo paquetes de forma autónoma
¿Cómo funciona el stack de Flexion?
El enfoque de Flexion combina varios sistemas de IA superpuestos.
El modelo principal descubre cómo ejecutar tareas digiriendo videos de humanos haciendo cosas distintas. El software después empareja habilidades aprendidas (que capturó en simulación) con lo visto en los videos y las ejecuta en el mundo real. Para llegar a la sala de correo de una oficina, por ejemplo, el modelo puede haber aprendido que necesita abrir ciertas puertas y usar el ascensor. El sistema también controla los motores del robot, permitiéndole caminar, mover extremidades y mantener el equilibrio.
Según Nikita Rudin, cofundador y CEO de Flexion y ex research scientist de robótica en NVIDIA, el "ingrediente secreto" del software es el uso extensivo de reinforcement learning: entrenar computadoras para dominar tareas por prueba y error. Cada capa del stack, desde el modelo maestro hasta la simulación y el control motor, usa este enfoque.
!Humanoide operando en un ambiente de oficina
¿Por qué el interés del mercado en foundation models robóticos?
Líderes de la industria como Elon Musk y Jensen Huang argumentan que los humanoides van a tener un impacto enorme en la economía porque podrían llegar a reemplazar buena parte del trabajo humano. Pero la demo de Flexion refleja que darles poder a los humanoides va a requerir avances fundamentales en IA.
"El humanoide en sí mismo no es lo interesante, lo revolucionario está en los modelos de IA que lo respaldan", dijo George Chowdhury, analista de ABI Research que sigue el mercado de humanoides. ABI Research estima que el mercado de foundation models para robots podría valer USD 150.000 millones hacia 2036.
Software universal para hardware fragmentado
Rudin dijo que Flexion está colaborando con varias empresas de robótica y anticipó que su stack funciona en distintos formatos de humanoide. Dado el número de sistemas ya en el mercado, eso podría hacer al software mucho más valioso comercialmente.
Chowdhury advirtió que Flexion va a tener que trabajar de cerca con los fabricantes de hardware para tener éxito, y que la competencia será intensa. Pero sin la capacidad de programar humanoides de la forma en que Flexion lo demuestra, cerró, "no hay mercado real acá".




