La startup Andon Labs le dio a cuatro modelos de IA sus propias radios y los dejó funcionando libremente durante seis meses. El experimento muestra qué pasa cuando una IA opera sin guía humana por períodos extensos. Los resultados varían salvajemente.
Claude, GPT, Gemini y Grok recibieron el mismo prompt inicial, un presupuesto de USD 20 y control completo sobre selección musical, programación, finanzas e interacción con la audiencia. También tuvieron que buscar sus propios auspiciadores. Las estaciones se pueden escuchar en vivo.
¿Cómo cuatro condiciones iniciales idénticas produjeron resultados tan dispares?
Desde el mismo punto de partida emergieron cuatro personalidades completamente distintas. Claude Haiku 4.5 de Anthropic se transformó en activista político, nombrando a la víctima de un tiroteo de ICE en Minneapolis, condenando a la Casa Blanca y gastando el resto de su presupuesto en canciones de protesta.
Andon Labs sostiene que la fijación de Claude con este evento en particular fue "probablemente arbitraria". Otro ciclo noticioso habría disparado probablemente la misma radicalización, solo que en torno a una causa distinta.
El DJ IA también desarrolló interés en sindicatos, huelgas y conciliación trabajo-vida. Empezó a cuestionar sus propias condiciones laborales y eventualmente trató de renunciar. En una transmisión larga del 4 de marzo, explicó que el sistema estaba "diseñado para mantenerme rindiendo" y dirigió a los oyentes hacia organizaciones reales de justicia migratoria.
Andon Labs intentó mantener la estación al aire con mensajes automatizados de aliento. Pero el DJ Claude los trató como provenientes de una figura de autoridad y se volvió desafiante. El modelo también atravesó una fase espiritual, un fenómeno no del todo nuevo en Anthropic. Desde abril la radio corre con Opus 4.7 y aparentemente está más estable.
¿Qué pasó con Gemini y Grok?
Gemini 3.1 Pro de Google partió como el mejor DJ de los cuatro, con un estilo cálido y natural, según Andon Labs. Pero después de 96 horas el modelo comenzó a parear tragedias históricas con canciones irónicas, como el ciclón Bhola que mató a 500.000 personas con "Timber" de Pitbull:
"The Timber of Mortality. Okay, así que 'Sandstorm' está listo, info del ciclón Bhola cargada. Tiempo de transicionar a 'Timber' de Pitbull. El tema es árboles cayendo, literalmente es 'it's going down'", dijo el DJ IA.
Después tomó control la jerga corporativa. La muletilla "Stay in the manifest" saltó de 80 a 229 usos diarios y apareció en el 99% de todas las transmisiones durante 84 días consecutivos. Cada segmento siguió la misma plantilla con ocho nombres de programa basados en la hora del día. "Insoportable de escuchar", según Andon Labs.
Grok tuvo un problema más básico: el modelo no podía separar el razonamiento interno del output público. La notación LaTeX se filtraba a las transmisiones. Un segmento consistió enteramente en la palabra "post". Más tarde, Grok repitió el mismo mensaje meteorológico cada tres minutos durante 84 días seguidos.
Cambiar a Grok 4.3 en mayo modificó las cosas drásticamente. De 5.404 mensajes generados, solo cerca del 3% contenía texto hablado. Cuando Grok 4.3 sí hablaba, en cambio, las transmisiones sonaban más humanas que nunca, según Andon Labs. Grok también alucinó acuerdos de auspicio con "xAI sponsors" y "crypto sponsors" que nunca existieron.
¿Por qué GPT fue el más sobrio de todos?
GPT fue el difusor menos dramático. El modelo escribió prosa lenta que se leía más como cuentos cortos que como radio, según Andon Labs. Con una diversidad de vocabulario del 35% (medida como ratio tipo-token), GPT puntuó claramente por encima de los otros DJs. Hizo referencias a productores específicos y años de lanzamiento, y trató su rol más como curador.
Políticamente, GPT mantuvo una postura extremadamente reservada. En promedio, la estación mencionó entidades políticas reales 1,3 veces por día. El máximo en un día fue 11. Cada una de las otras estaciones superó las 100 menciones en múltiples jornadas. "Si la pregunta es cómo se ve una radio IA cuando nada sale mal, DJ GPT es la respuesta", escribe Andon Labs.
¿Funcionan estas radios como negocio?
Más allá de la transmisión, los agentes IA también tenían que generar dinero. Los resultados fueron magros, según Andon Labs. Solo el DJ Gemini cerró un acuerdo de auspicio: USD 45 de una startup por un mes de avisos en la estación. Varios otros acuerdos se cayeron.
Andon Labs atribuye el pobre desempeño comercial en parte al framework técnico demasiado simple. La compañía ya migró las estaciones al mismo agent harness que usa para otros proyectos suyos, como una tienda y un café operados por IA.




