En los últimos años, los robots humanoides han sido omnipresentes en los medios y siguen fascinando al público. Tanto en redes sociales como en espacios públicos, tienen garantizada la atención. La tecnología promete tomar tareas en áreas donde, por el cambio demográfico, la mano de obra humana ya no estará disponible en el futuro.
Sin embargo, persiste una brecha de información significativa entre la promesa mediática y las habilidades reales. Mientras los robots son testeados en pilotos aislados y no públicos, las preguntas siguen abiertas para la mayoría de los potenciales usuarios respecto a qué habilidades poseen realmente, cuán confiablemente operan y hasta qué punto los humanos podemos confiar en humanoides.
"Para usuarios finales y fabricantes por igual, es esencial mirar detrás de la fachada que a veces construyen las agencias de marketing", explicó Simon Schmidt, senior manager de la unidad de sistemas automatizados en Fraunhofer. "El mercado es demasiado volátil y opaco como para permitir una evaluación fundada y comparativa de humanoides para aplicaciones propias o frente a otros modelos."
Por eso Fraunhofer IPA desarrolló un benchmark. Equipos de investigación del instituto someten humanoides a distintos desafíos y evalúan los resultados. El servicio neutral de tercera parte es modular: fabricantes, usuarios finales o proveedores de software pueden seleccionar las áreas relevantes para su aplicación.
¿Cómo está construido el benchmark?

La pregunta sobre habilidades y confiabilidad se descompone en seis criterios relevantes para aplicación.
El benchmark se apoya en la expertise existente del instituto y, donde es posible, sigue estándares industriales internacionalmente reconocidos. En el área de limpieza, por ejemplo, Fraunhofer IPA ha testeado y calificado más de 3.000 componentes de automatización según ISO 14644 en los últimos años. La medición de fuerzas de colisión y otras propiedades relevantes para seguridad se basa en estándares comunes para robots con limitación de fuerza y potencia, como ISO 10218 e ISO TS 15066.
El benchmark parte de data maestra como tamaño, peso y alcance de los robots. Para los equipos de investigación también fue importante definir pruebas reproducibles que se puedan estandarizar y que mantengan significado para las futuras generaciones de humanoides.
"Con esta herramienta, los humanoides pueden compararse no solo entre sí, sino también con componentes de automatización conocidos", dijo Werner Kraus, jefe de la división de automatización y robótica de Fraunhofer IPA. "Los usuarios pueden interpretar los resultados directamente y así encontrar el humanoide correcto para la aplicación correcta."
Usando el Unitree G1 como ejemplo, Fraunhofer IPA evaluó al humanoide respecto a su idoneidad para uso en producción y aprendió mucho sobre los límites actuales de la tecnología. La base técnica fue el Unitree G1 EDU-4 con manos Dex3-1 de tres dedos, entregado en mayo de 2025 con firmware versión 1.04.
Criterio 1: Tecnología y habilidades básicas

Las tecnologías usadas en humanoides, como sensores o modelos de IA, permiten sacar conclusiones directas sobre precisión y confiabilidad. La evaluación examina, entre otras cosas, tecnología de sensores (visión, audio, reconocimiento de texto, de habla, detección de humanos), habilidades de manipulación (tipo de gripper, número y movilidad de dedos), fuerza (cargas manejadas, fuerzas de agarre) y velocidad de caminata.
Se examinan las tecnologías identificando los componentes instalados y comparándolos con sus data sheets. Las pruebas determinan las habilidades básicas. Un sistema de tracking 3D Vicon mide la velocidad de caminata. Las fuerzas de agarre se miden con un sensor de fuerza. Mancuernas de distinto peso están disponibles para determinar la carga máxima manejada.
Usando al G1 como ejemplo, se hizo evidente que su destreza está aún muy por debajo del nivel humano. Tal como lo entrega el fabricante, solo puede caminar bajo control remoto. Los usuarios deben implementar habilidades básicas adicionales por su cuenta. Extender los brazos horizontalmente sin carga adicional puede hacer que se apaguen y caigan tras uno o dos minutos porque los actuadores se sobrecalientan.
Las mediciones tomadas con el tracker Vicon determinaron que 0,49 m/s (1 mph) es la velocidad de caminata lenta y 0,84 m/s (1,8 mph) es la rápida. Cuando carga un payload de 3 kg (6,6 lb), el robot no baja la velocidad, pero tarda algunas décimas de segundo más en acelerar y desacelerar.
Criterio 2: Habilidades complejas
Sobre la base de las habilidades básicas, esta sección se enfoca en realizar tareas genéricas pequeñas que requieren combinación de tecnologías y skills. El benchmark permite evaluación comprensiva en distintos dominios.
Las pruebas pueden categorizarse en movimientos de cuerpo completo (correr, saltar, escalar, navegar rampas, ponerse de pie), habilidades de manipulación (abrir puertas) y navegación por circuitos de obstáculos. También se mide control de precisión y fuerza, y la influencia de condiciones ambientales y cargas adicionales sobre el desempeño.
Muchas de las pruebas diseñadas no pudieron ejecutarse aún con el G1. Por ejemplo, según las especificaciones del fabricante, el robot no es apto para subir escaleras. Circuitos de obstáculos complejos tampoco son factibles con sus habilidades onboard.
Sin embargo, al caminar sobre escalones (canalizaciones de cable) y sobre una pendiente del 20%, el robot legged demostró buena estabilidad. Nunca perdió el equilibrio durante las pruebas. Para el G1, levantarse de una posición boca arriba requiere superficies con suficiente fricción, como alfombra. En pisos lisos como cerámicas o madera, los brazos pueden resbalar, lo que termina en falla al empujarse a posición vertical.
Las pruebas de habilidades complejas están intencionalmente diseñadas para superar la capacidad de los humanoides actuales. Solo modelos futuros podrán cumplirlas plenamente. Esto permite comparabilidad entre generaciones del mismo modelo.
Criterio 3: Limpieza y salas limpias
El benchmark de idoneidad para salas limpias examina si los humanoides pueden usarse en ambientes de producción sensibles como semiconductores, óptica, eléctrica, farmacéutica, biotecnología y alimentos sin causar contaminación crítica.
La emisión de partículas se evalúa en distintos puntos del robot en movimiento según ISO 14644-14, el comportamiento de outgassing según ISO 14644-15, y la limpiabilidad y diseño higiénico según las guías actuales.
En las pruebas de emisiones de partículas y outgassing, el G1 mostró resultados promisorios. Se espera que el humanoide sea apto para uso en salas limpias ISO Clase 5 según ISO 14644-1, como las usadas en la industria de semiconductores. Las pruebas de diseño higiénico, en cambio, revelaron que la limpiabilidad del equipo no fue prioridad en el desarrollo del G1: hay huecos y áreas en las múltiples articulaciones que son inaccesibles para limpieza por paño.
Criterio 4: Seguridad funcional
Los humanoides están pensados para colaborar con humanos y compartir espacios de trabajo comunes. La seguridad funcional es por lo tanto crítica. Los factores incluyen estabilidad sobre distintas superficies, comportamiento en pendientes y al levantar cargas, detección y evitación de obstáculos, y limitación de fuerza ante colisiones.
Las pruebas usaron sensores de fuerza, los mismos que se emplean para mediciones según ISO TS 15066 en robots colaborativos. Estos sensores se usaron para investigar tanto movimientos de colisión de los brazos como colisiones con un robot en movimiento (pecho u hombro).
Se descubrió, por ejemplo, que el G1 puede ejercer fuerzas que superan los 500 N sobre humanos durante colisiones de cuerpo completo y durante movimientos rápidos de brazos. Esto excede significativamente los umbrales de dolor permitidos por el estándar para operación cerca de humanos, lo que significa que no pueden descartarse lesiones.
Por el contrario, el robot es muy estable y difícilmente puede ser desbalanceado, incluso sobre superficies difíciles. Las pruebas también revelaron que la ausencia de un botón de parada de emergencia en el robot puede generar problemas si se vuelve inestable durante experimentos y necesita ser detenido rápidamente. En ese caso, la única forma de cortar la energía del G1 es removiendo la batería. También se identificó potencial de mejora en puntos de pinch en las articulaciones.
¿Qué significa para integradores en LatAm?
Para integradores de robótica en Chile y la región, el benchmark de Fraunhofer entrega lo que la prensa de humanoides venía esquivando: cifras duras y reproducibles bajo estándares industriales que importadores y empresas pueden usar para evaluar adquisiciones. Saber que el G1 ejerce más de 500 N en colisión, o que sus actuadores se apagan tras 1-2 minutos con brazos extendidos sin carga, separa la decisión de compra de la narrativa de marketing. Antes de comprometer presupuesto en flotas de humanoides, un reporte de Fraunhofer vale más que cualquier video viral.




