Gill Pratt dice que el momento de los robots humanoides finalmente ha llegado

En 2012, la Agencia de Proyectos de Investigación Avanzada de Defensa de EE. UU. Anunció el DARPA Robotics Challenge (DRC). La competencia multimillonaria y de varios años de duración por robótica para desastres dio como resultado el Atlas de Boston Dynamics, algunos momentos absolutamente increíbles de una de las primeras generaciones de robots humanoides útiles y un video de error que perdurará para siempre.

Gill Pratt, el arquitecto del concurso, tenía una idea muy clara de lo que la República Democrática del Congo iba a hacer por la robótica. "El motivo [del DARPA Robotics Challenge] es en realidad impulsar el campo y hacer realidad esta capacidad", dijo Pratt a IEEE Spectrum en 2012. En ese momento, señaló que antes del DARPA Grand Challenge en 2004 y del DARPA Urban Challenge en 2007, los automóviles sin conductor para entornos complejos esencialmente no existían. Vio que la República Democrática del Congo hacía lo mismo con la robótica.

Ha pasado aproximadamente una década desde la conclusión del DARPA Robotics Challenge, y muchos en la industria creen que los robots humanoides están a punto de tener el momento transformador que Pratt predijo. Pero como suele ocurrir en la robótica, las cosas tienden a ser mucho más difíciles de lo que parece que deberían ser. Spectrum sabe comunicó con Pratt, ahora director ejecutivo del Instituto de Investigación Toyota (TRI), para descubrir qué está frenando a la robótica humanoide, qué cree que estos robots deberían estar haciendo (o no haciendo) y cómo navegar la burbuja de la exageración humanoide.

¿Qué opinas de este momento de la robótica en el que nos encontramos?

Gill Pratt: Lo que ha cambiado en realidad no tiene que ver con los humanoides. Muchas personas llevan mucho tiempo construyendo robots de investigación con forma humanoide. Lo que es diferente ahora no es el cuerpo, sino el cerebro. Siempre hemos tenido esta disparidad en el campo de la robótica, donde los mecanismos que estábamos construyendo eran increíblemente capaces, pero realmente no teníamos los medios para hacer que la utilidad del robot igualara ese potencial. Ahora realmente lo hacemos, y eso sabe debe a la revolución de la IA que ha ocurrido en los últimos años.

Es muy tentador mirar hacia atrás 10 años y atribuir directamente a la República Democrática del Congo gran parte de lo que está sucediendo ahora con los humanoides comerciales. ¿Hay alguna razón para no hacer eso?

Gill Pratt posa con una versión anterior del robot Valkyrie DRC de la NASA. Gill Pratt

Pratt: No, pero quiere ser humilde al respecto. La República Democrática del Congo sabe centró en mitad de autonomía y mitad de teleoperación en tiempo real. Hubo supervisión remota y luego semiautonomía para amplificar esa supervisión y manejar tareas en tiempo real mientras la persona remota le decía al robot qué hacer. Todo eso fue antes de los avances que sabe han producido recientemente en la IA.

Lo que ha cambiado ahora es que tenemos una manera de enseñar esencialmente a los robots qué hacer y hacerlos competentes de una manera que no requiera escribir código; En su lugar, puedes simplemente demostrarle la tarea al robot. Con una cantidad suficiente de esos datos y nuevos métodos de inteligencia artificial, los robots pueden tener un rendimiento mucho mayor que nunca.

Pero esos datos son un cuello de botella, ¿verdad? How do we know what it should consist of, and what a sufficient amount is to get a robot to do something reliably?

Pratt: Esto refleja exactamente el debate que tiene lugar en los grandes modelos de lenguaje [LLM]. Hay ciertas personas que creen que si tomamos LLM (que son predictores autorregresivos que adivinan cuál debería ser la siguiente palabra basándose en palabras pasadas) y los parcheamos con una variedad de métodos para resolver sus alucinaciones, eventualmente llegaremos a un punto en el que podemos confiar en el sistema de inteligencia artificial. Y luego hay otras personas, y cree que Yann LeCun es el más conocido de ellos, que dicen que eso es una tontería y que necesitamos algo más. Su opinión, y está de acuerdo, es que necesitamos modelos mundiales. Necesitamos alguna forma para que el sistema de IA imagine, pruebe cosas y realmente razone.

Y sabe que estamos aplicando palabras como “razón” a lo que son esencialmente sistemas de comparación de patrones. Decir que existe un “razonamiento” es sólo una pegatina que ponemos en todo lo que hemos construido; no es un razonamiento verdadero.

Este es un ejemplo del pensamiento del "sistema uno" versus el "sistema dos", ¿verdad?

Pratt: Yes. El primer sistema es el pensamiento rápido y reflexivo que tenemos, que es el tipo de coincidencia de patrones que hacen los LLM actuales. El segundo sistema es el razonamiento lento que involucra la imaginación y los modelos del mundo. Eso es lo que no hemos hecho todavía. Los avances en el sistema uno han sido extraordinarios, pero todavía no tenemos el sistema dos. Estos intentos de parchear el sistema uno para convertirlo en sistema dos son como intentar apretar un globo lleno de agua; Lo aprietas por un lado y el agua sobresale por el otro lado. Sigues sorprendiéndote de que arreglas una cosa y otra sabe estropea, y el rendimiento general no mejora mucho.

¿Cómo ha abordado este problema en el TRI?

Pratt: Hace dos años, sabe nos ocurrió una política de difusión y luego sabe nos ocurrió lo que llamo grandes modelos de comportamiento (LBM). Eso implica tener un modelo entrenado en muchas tareas y mostrar que a medida que agrega cada tarea, en realidad ayuda con las otras tareas y reduce la cantidad de datos de entrenamiento necesarios para alcanzar un nivel determinado de rendimiento. Estos han sido increíbles avances en el sistema.

El gran avance sabe produjo cuando nos dimos cuenta de que la difusión podía aplicarse al comportamiento de los robots. Descubrimos que operar en el espacio del comportamiento, desde la visión hasta la acción, funcionó increíblemente bien. Eso dio inicio a todo el campo y, desde entonces, cree que cada demostración de robótica que hemos visto está utilizando algún tipo de política de difusión para hacer lo que está haciendo. Pero, de nuevo, sabe trata de una coincidencia de patrones de sistema uno: “Si ve el mundo así, actúo en el mundo así”. El robot no imagina, piensa y planifica como solía hacerlo la robótica tradicional con codificación manual. Simplemente está reaccionando.

Sin embargo, la coincidencia de patrones del sistema uno a menudo falla en el mundo real, como hemos visto con las dificultades de la conducción autónoma.

Pratt: Hace diez años, cuando comenzó el TRI, casi todo el mundo decía que la conducción automatizada estaba a la vuelta de la esquina.

Diez años después, cree que ya hemos llegado a ese punto, y las preguntas restantes son cuestiones comerciales: ¿Cuánto cuesta el hardware, el seguro, el soporte? ¿Tiene sentido económicamente? No necesariamente hemos resuelto la conducción automatizada, pero nuestras soluciones son lo suficientemente buenas, porque utilizamos humanos como respaldo. Cuando un vehículo automatizado sabe atasca en un automóvil estacionado en doble fila, llama a casa y le pide a una persona que tome una decisión del sistema dos. I think other robots could do that also. La mayor parte del tiempo hacen su trabajo solos y, de vez en cuando, levantan la mano para pedir ayuda.

Si apenas hemos logrado que los autos autónomos funcionen correctamente, ¿por qué dedicamos tanta atención al factor de forma humanoide con patas?

Pratt: Hemos construido el mundo con posibilidades físicas para nuestros cuerpos. Para que al robot le vaya bien en ese mundo, debería tener algo que aproveche esas posibilidades. También es más fácil que funcione el aprendizaje por imitación porque tenemos la misma forma. Y las piernas son buenas para ciertos ambientes; puedes superar obstáculos para mantener el equilibrio más rápido de lo que puedes rodar hasta un nuevo punto de apoyo con ruedas. Dicho todo esto, las piernas no siempre son lo más práctico. Es muy extraño ver tanta atención a los robots con patas en las fábricas, que son entornos planos perfectamente adaptados para ruedas.

Manejando el revuelo por la robótica humanoide

¿Crees que la cantidad de dinero que sabe invierte en humanoides con patas es algo bueno para la robótica?

Pratt: Tiene ventajas y peligros. Es maravilloso ver tantos recursos en el campo de la robótica y cree que ha ocurrido algo especial. Las cosas ya no son como eran antes y hay muchas posibilidades cuando piensas en personas que enseñan a los robots cómo hacer cosas.

Gill Pratt admira un robot en el tejado del Museo Ghibli de Tokio. Gill Pratt

¿Qué tipo de cosas deberían los humanos enseñar a hacer a los robots?

[...]

Gill Pratt dice que el momento de los robots humanoides finalmente ha llegado

Manejando el revuelo por la robótica humanoide

Seguir leyendo

Manufacturing Language Model: la apuesta de Launchpad Build AI

Apptronik suma a Daniel Chu como CPO en pleno salto comercial del Apollo

Antioch levanta USD 8,5M para simulación de robots en la nube

reBot Arm B601-DM: Brazo robótico open source para IA y teleoperación