Waymo libera Reference Driver: modelo de cómo reacciona el humano

El proyecto ReD, con la Universidad Técnica de Delft, simula la sorpresa cognitiva del conductor para fijar un benchmark común de evitación de colisiones para autos autónomos.

Publicado el 14 de junio de 2026 · 09:24 a. m.3 min de lectura

Al grano

Waymo publicó Reference Driver (ReD), un modelo cognitivo computacional que simula cómo un conductor humano competente reacciona a sorpresas inesperadas en la ruta.

ReD usa el marco de inferencia activa: el cerebro minimiza sorpresa continuamente, reevaluando el plan de manejo cuando la trayectoria actual aparenta estar fallando.

El modelo incluye juicio de looming a distancia, filtro de norma de tráfico y una pausa de 0,2 segundos al cambiar entre acelerador y freno.

Por qué importa

Liberar ReD como open source es una jugada inteligente de gobernanza: en lugar de pelear estándar contra estándar, Waymo ofrece su definición como base sobre la cual construir. El gesto le cobra costo a competidores como Tesla o Mobileye, que ahora tienen que demostrar por qué su modelo de comparación es mejor que el público. Para la regulación chilena de movilidad autónoma, todavía en etapa pre-piloto, tener un benchmark gratuito acelera el debate.

Waymo ya tenía una colección amplia de sistemas virtuales para entrenar sus vehículos autónomos: mundos 3D realistas para anticipar desastres y edge cases, y una representación virtual de un conductor hiperatento para correr pruebas internas de evitación de colisiones.

Esta semana publicó un paper en Nature Communications presentando Reference Driver (ReD), un modelo cognitivo computacional que describe cómo los humanos toman decisiones a fracciones de segundo para evitar choques. La compañía espera que el modelo sirva como benchmark contra el cual comparar sistemas autónomos para empujar a la industria hacia un estándar de seguridad compartido y científicamente sustentado.

El proyecto fue desarrollado con la Universidad Técnica de Delft en Países Bajos. La analogía elegida por Waymo es deliberada: si la industria automotriz usa dummies de prueba para evaluar la integridad estructural de los autos, ReD funciona como un dummy conductual para medir si un auto autónomo evita situaciones peligrosas antes de que escalen.

¿Cómo simula la sorpresa al volante?

ReD descansa sobre un marco neurocientífico llamado inferencia activa, popularizado por neurocientíficos como el profesor Karl Friston, quien describió a ReD como un "tour de force técnico" en un comunicado entregado por Waymo. El principio central: los cerebros humanos intentan minimizar continuamente la sorpresa a lo largo del tiempo.

Sobre esa base, el modelo apila varios rasgos cognitivos humanos:

Juicio de amenazas longitudinales por *looming*: los humanos estiman peligros por la velocidad con que un objeto se expande en su campo visual. ReD naturalmente le cuesta juzgar velocidades a larga distancia, igual que una persona.
Filtro de "norma de tráfico": sesga las predicciones hacia el comportamiento que respeta reglas, hasta que observa explícitamente un vehículo violando una norma.
Umbral de sorpresa: si la sorpresa acumulada cruza cierto valor, ReD reevalúa el plan de manejo en curso, asumiendo que la trayectoria actual está fallando.
Pausa de 0,2 segundos al cambiar entre el pedal del acelerador y el del freno, modelando el costo de operar ambos con un solo pie.

Mauricio Peña, jefe de seguridad de Waymo, explica que el objetivo no es competir con un humano sino tener una referencia:

"Evaluar la seguridad de un AV es multifacético, y entender cómo un humano maneja un conflicto es una pieza clave del puzzle. Al fijar este modelo de respuesta humana competente, podemos ayudar a la industria a moverse hacia un enfoque compartido y científicamente fundamentado para evaluar el comportamiento de evitación de colisiones", dice Peña.

Arkady Zgonnikov, profesor asistente de la Universidad Técnica de Delft, agrega:

"Al anclar nuestro modelo en inferencia activa logramos una representación holística de la respuesta humana a una colisión. Esto permite simular la sorpresa interna que siente un conductor durante un conflicto, entregando un benchmark más cercano a lo humano para sistemas de manejo autónomo, algo que antes era imposible de automatizar a escala".

¿Qué cambia respecto a modelos de seguridad anteriores?

Los modelos clásicos solo simulan emergencias. ReD, dice Waymo, calcula sorpresa de manera continua mientras minimiza energía libre, lo que le permite hacer evitación proactiva: anticipa riesgos temprano y ajusta el manejo antes de que la situación escale a un conflicto.

La empresa también colabora con investigadores, reguladores y organismos de estándares como la SAE para construir consenso en torno a este tipo de modelos de referencia, con el objetivo de fijar una definición compartida de qué constituye una respuesta "cuidadosa y competente" de un humano al volante. Como gesto coherente con esa promesa, Waymo está liberando ReD como open source y de uso público.

¿Por qué importa más allá de Estados Unidos?

En Chile y LatAm, donde la regulación de vehículos autónomos todavía no llega más allá de pilotos universitarios y proyectos en zonas francas, la disponibilidad de un benchmark abierto baja la barrera para validar sistemas locales. El proyecto AutoCarChile de la Universidad de Chile o iniciativas en logística minera podrían usar el repositorio público para someter sus stacks a escenarios sintéticos sin depender de licencias propietarias.

Para Waymo el movimiento también es estratégico: posicionar a la empresa como ancla académica del campo y diferenciarse de competidores que publican menos investigación revisada por pares, como Tesla. Es la continuación de un patrón visible: hace meses, Waymo había publicado un estudio sobre tiempos de respuesta y evitación de colisiones en revistas científicas, y luego un trabajo sobre prevención de lesiones usando humanos como benchmark. ReD es la pieza que faltaba: un sustituto cognitivo del conductor humano, abierto, reutilizable y verificable.

Waymo libera Reference Driver: modelo de cómo reacciona el humano

Al grano

Por qué importa

¿Cómo simula la sorpresa al volante?

¿Qué cambia respecto a modelos de seguridad anteriores?

¿Por qué importa más allá de Estados Unidos?

Seguir leyendo

NVIDIA Alpamayo: post-entrenar autos autónomos en lazo cerrado

Baidu Apollo Go supera a Waymo en el primer ranking de robotaxis

NVIDIA NeMo automatiza la investigación en RL con agentes

NVIDIA presenta RoboLab para evaluar robots de forma justa

→Al grano

✦Por qué importa

¿Cómo simula la sorpresa al volante?

¿Qué cambia respecto a modelos de seguridad anteriores?

¿Por qué importa más allá de Estados Unidos?

Seguir leyendo

NVIDIA Alpamayo: post-entrenar autos autónomos en lazo cerrado

Baidu Apollo Go supera a Waymo en el primer ranking de robotaxis

NVIDIA NeMo automatiza la investigación en RL con agentes

NVIDIA presenta RoboLab para evaluar robots de forma justa

Al grano

Por qué importa