El periodismo de datos consume tiempo como pocas otras especialidades. Una sola investigación puede ocupar a un equipo durante semanas. Un nuevo flujo de IA pretende automatizar gran parte de ese trabajo sin sacrificar la trazabilidad.
Investigadores de Oxford y Stanford construyeron Data Journalist Agent, conocido también como Data2Story, un skill de Claude Code que toma un archivo CSV y devuelve un reportaje interactivo completo. La salida incluye contexto de investigación, estadísticas, gráficos y, sobre todo, un sistema integrado que enlaza cada afirmación visible, cada gráfico y cada elemento interactivo con su evidencia: código, fuentes de datos o URLs externas.
¿Cómo funciona la redacción virtual de siete agentes?
Detrás de cada artículo hay una cadena de siete agentes especializados que el equipo llama "virtual newsroom". Cada uno se ocupa de un paso distinto del flujo editorial.
| Agente | Rol |
|---|---|
| Detective | Busca contexto en la web (la tabla sola rara vez cuenta la historia) |
| Analista | Corre código en vez de adivinar números |
| Editor | Elige qué hallazgos conducen la narrativa |
| Diseñador | Decide el formato adecuado (mapa, gráfico, clip de audio) |
| Programador | Construye la página HTML final |
| Auditor | Revisa el layout en busca de errores |
| Inspector | Vincula cada afirmación a su fuente |
El modelo base es Claude Opus 4.7 corriendo sobre Claude Code. Para imágenes, video y audio el sistema integra modelos de OpenRouter como gpt-5.4-image-2, seedance-2.0 y lyria-3-pro-preview.
El panel Inspector y la trazabilidad del 93%
La función central del sistema es el panel Inspector, una vista que muestra evidencia estructurada para cada oración y cada activo del artículo. Cada frase anotada, cada gráfico y cada elemento interactivo recibe su propia ficha índice con la línea de código exacta más el archivo de datos detrás, o con la URL externa que respalda la afirmación.
Esto permite que el 93% de las afirmaciones visibles sea verificable en su origen. No quiere decir que sean correctas, aclaran los investigadores, sino que se pueden auditar. Si dudas de una cifra, corres el código. La línea base para artículos escritos por humanos es de 25%, en parte porque los periodistas rara vez publican el código de análisis.
¿Qué lectores prefirieron qué artículos?
El equipo pareó 18 datasets públicos con sus originales escritos por humanos en tres fuentes distintas: las síntesis concisas de The Economist, las piezas largas y muy diseñadas de The Pudding, y los datasets comunitarios de TidyTuesday. Reclutaron a 53 lectores que evaluaron ambas versiones en cinco categorías: diseño visual, ritmo narrativo, transparencia de datos, verificabilidad y aprendizaje obtenido.
Data2Story ganó en las cinco. La mayor ventaja fue en transparencia, con +1.49 puntos en una escala de siete. En el agregado, el 74% prefirió la versión de la IA, el 25% la humana y el 2% empató.
Por fuente, el panorama cambia. La IA ganó claramente en las síntesis densas de The Economist y en las piezas de TidyTuesday. Contra The Pudding, donde un equipo de diseño suele trabajar varias semanas, el resultado fue empate estadístico: la presentación artesanal del Pudding sigue ganando cuando lo que importa es la puesta en escena.
¿Dónde sigue ganando el humano?
Los autores identifican tres terrenos donde el periodista humano se mantiene adelante.
- Perspectiva editorial: el dato muestra el qué, pero rara vez el porqué. Un reporte de Repair Cafe atribuyó las bajas tasas de reparación al bloqueo deliberado de fabricantes de teléfonos, autos y tractores sobre herramientas de diagnóstico. Esa es una teoría que solo se sostiene con reporteo.
- Diseño creativo: una pieza de The Pudding sobre stand-up comedy convirtió la transcripción completa de un show de Ali Wong en interfaz, con un círculo proporcional a la duración de cada risa. El agente devolvió un thumbnail estático de YouTube.
- Gráficos densos únicos: una visualización de The Economist sobre la carrera espacial logró superponer proveedores estatales y comerciales, tasas de éxito y anotaciones en una sola imagen. El agente repartió la misma data en varios gráficos y perdió el punto principal.
¿Cuándo conviene usarlo?
Los autores presentan Data2Story como colaborador, no reemplazo. La utilidad más clara es cubrir temas que las redacciones no logran abordar por falta de capacidad: datasets de nicho que nunca se convertirían en una historia legible. El sitio está activo en data2story.github.io y el código está en GitHub.
Una limitación importante: el sistema corre en piloto automático. Una versión con human-in-the-loop queda como trabajo futuro.




