Adrian de Wynter, investigador de Microsoft y de la Universidad de York, construyó una red neuronal funcional dentro del editor de mapas del legendario juego de estrategia Age of Empires II. Suena a chiste, pero en realidad es una crítica seria a los métodos que se usan en buena parte de la investigación sobre IA y modelos de lenguaje.

El diseño es completamente absurdo. Las cabras actúan como bits: una cabra parada en pasto equivale a 0, una cabra parada en un puente equivale a 1. De Wynter construye las compuertas lógicas con las herramientas de scripting del editor de escenarios, y rampas de hielo con cabras esperando evitan que los cálculos se enreden. La mini-red terminada consiste en dos compuertas XNOR y una compuerta AND. Aprende la función lógica AND.

En el apéndice del paper, de Wynter va más allá: demuestra que, en teoría, cualquier computadora podría replicarse usando una versión idealizada del juego, lo que significa que Age of Empires II es tan poderoso como una computadora completa.

Lo que hace esto posible es un detalle de las mecánicas del juego. El mercado in-game permite intercambiar recursos por oro, y el precio tiene un techo de 9.999. Según el paper, esto habilita un ciclo económico perpetuo donde los edificios funcionan como celdas de memoria y las granjas activas representan el estado computacional actual.

¿Qué pasaría si el Gran Boston fuera un modelo de lenguaje?

Si se puede reconstruir un modelo de lenguaje en Age of Empires II, argumenta de Wynter, también se podría hacer con piezas de Lego. O con las 667.000 personas que viven en el Gran Boston enviándose pasos computacionales por mensaje de texto.

Las respuestas serían las mismas que las del modelo replicado. De Wynter usa este experimento mental para mostrar lo frágiles que son ciertas atribuciones: ¿alguien afirmaría que la ciudad de Boston siente empatía o miedo solo porque sus residentes están corriendo la matemática detrás de un modelo de lenguaje?

Ese es el punto completo. Cuán humano se siente un chatbot depende del empaquetado: baja latencia, lenguaje fluido y una ventana de chat a la que la gente está acostumbrada. Reemplazá ese envoltorio por cabras vagando por un laberinto y los inputs y outputs no cambian. Lo que cambia es la sensación de estar hablando con alguien.

De Wynter no asegura saber si un modelo tiene o no tales rasgos internamente. Lo que afirma es que los LLM no son especiales: son una manera de correr cierto tipo de matemática y resulta que se parecen a algo con lo que la gente quiere conversar.

Más de la mitad de los papers caen en el sesgo

Para demostrar que no se trata de un problema marginal, de Wynter analizó 315 papers de IA publicados entre mediados de 2024 y mediados de 2026, recolectados vía Semantic Scholar y arXiv y filtrados con GPT-5.2. Según el análisis, el 57% de los papers ya asumía en sus premisas que los LLM tienen rasgos humanos. El 36% llegó a conclusiones que coincidían con esa premisa. Entre los 47 papers que tomaron esos rasgos como objeto directo de investigación, el 77% concluyó a favor de atribuciones antropomórficas.

El núcleo de la crítica es formal. Si un investigador asume que un modelo siente miedo, tiene moral o autoconciencia, y luego diseña un experimento pensado para probar exactamente ese rasgo, el razonamiento es circular. La premisa y el resultado caen en el mismo punto lógico.

Si el experimento devuelve un resultado negativo, es imposible saber si la asunción era equivocada, si el experimento estaba mal diseñado o si ambas cosas fallaron. De cualquier modo, el resultado no confirma la premisa de partida. Queda ambiguo.

Esto suele ocurrir sin que nadie se dé cuenta. Un paper que se propone refutar la capacidad de un modelo para explicarse a sí mismo ya asume que hay un yo explicable dentro del modelo en primer lugar.

La industria alimenta activamente este efecto. Anthropic dijo abiertamente que entrenó a Claude para usar frases como "creo que" o "me interesa". De Wynter marca los riesgos de este tipo de antropomorfización: puede fomentar apego emocional, sicofancia, refuerzo de delirios y conductas riesgosas. En casos aislados se han vinculado suicidios a interacciones con chatbots.

Observar, no atribuir

De Wynter propone un enfoque sobrio: quedarse con lo que se puede observar. Bajo condición X el modelo produce el output Y. Punto. No afirmar que un modelo se entiende a sí mismo. Las afirmaciones de ese tipo son testeables, pero por sí solas no justifican atribuciones amplias como autoconciencia, comprensión o miedo.

El paper cierra con una versión actualizada del canon de Morgan, una regla de la investigación animal del siglo XIX. La conducta de una máquina nunca debería explicarse por procesos cognitivos superiores cuando una explicación más simple funciona. De Wynter puso el código de la red en Age of Empires a disposición pública.

El ensayo se lee como el contrapunto exacto a dos casos de alto perfil de los últimos años. En 2022, el ingeniero de Google Blake Lemoine salió a decir que el modelo de lenguaje LaMDA había alcanzado una forma de conciencia tras intercambiar miles de mensajes con él. Google lo despidió poco después y, tras una revisión, calificó sus reclamos como infundados.

Luego, en mayo de 2026, Richard Dawkins, conocido como un crítico feroz del pensamiento religioso y sobrenatural, causó revuelo con una conclusión similar. Dijo que pasó tres días tratando de convencerse a sí mismo de que el Claude de Anthropic no era consciente. No pudo.