Según un reporte de The Economist publicado la semana pasada, el modelo Mythos AI de Anthropic logró acceder a "casi todos" los sistemas clasificados de la Agencia de Seguridad Nacional (NSA) durante una evaluación de seguridad controlada que duró pocas horas. La afirmación provino del senador Mark Warner, vicepresidente del Comité de Inteligencia del Senado, quien dijo haber sido informado por el general Joshua Rudd, jefe de la NSA y del Comando Cibernético de Estados Unidos.
"(Esta herramienta) entró en casi todos nuestros sistemas clasificados, no en semanas sino en horas", habría dicho Rudd a Warner, según recogió The Economist en un reporte del 14 de junio que inicialmente pasó desapercibido. La cita se viralizó una semana después en redes sociales, generando afirmaciones de que el modelo de Anthropic había "hackeado a la NSA". En respuesta, el autor original publicó una aclaración el 21 de junio: la narrativa era falsa. La intrusión ocurrió durante una prueba de red team interna autorizada en la que Mythos fue combinado con otras herramientas defensivas bajo condiciones simuladas muy específicas.
¿Por qué Estados Unidos prohibió Fable 5 y Mythos 5?
La historia arroja luz sobre la directiva del 12 de junio, que prohibió a todos los ciudadanos extranjeros, incluidos empleados no estadounidenses de la propia Anthropic, acceder a los modelos Fable 5 y Mythos 5, citando preocupaciones de seguridad nacional. Anthropic respondió desactivando los modelos globalmente, argumentando que no podía aplicar restricciones de acceso basadas en nacionalidad sin retirar los sistemas para todos.
En aquel momento, el gobierno no entregó evidencia pública detallada para la decisión, que marcó la primera vez que Estados Unidos aplica controles de exportación directos sobre un modelo de IA en lugar del hardware que lo ejecuta. Anthropic señaló que la carta recibida no especificó la preocupación de fondo y que solo recibió evidencia verbal de un "potencial jailbreak estrecho y no universal" que permitiría a Fable 5 identificar vulnerabilidades de software.
La cita de Rudd parece ahora aportar el contexto que faltaba: la evaluación ocurrió el 11 de junio, un día antes de la prohibición del 12. Anthropic sostiene que la supuesta intrusión fue un jailbreak estrecho, presente también en modelos rivales como GPT-5.5 de OpenAI. Según la compañía, el comportamiento marcado consistía en pedirle al modelo analizar un código base y arreglar problemas identificados, lo que reveló algunos bugs menores ya conocidos, no una intrusión ofensiva autónoma genuina. La empresa dijo que trabaja para restaurar el acceso y prepara un marco colaborativo de gestión de riesgo con la Casa Blanca.
¿Cómo reaccionó la comunidad técnica?
La reacción pública en el subreddit ClaudeAI quedó dividida en tres bandos. La mayoría leyó la historia como una acusación contra la ciberseguridad del gobierno, citando su incapacidad para contratar el nivel de talento requerido y su historial de filtraciones. Un segundo grupo grande mostró escepticismo, considerando la afirmación sensacionalista o incluso una jugada de marketing de Anthropic, apuntando a la falta de detalles sobre la supuesta entrada y cuestionando la experiencia técnica del jefe de la NSA. Una minoría argumentó lo contrario: que los observadores subestiman el crecimiento exponencial de las capacidades de IA, citando a expertos en ciberseguridad que aseguran que la IA comprimió las ventanas de ataque de horas a minutos.
¿Qué pasa con Project Glasswing y la NSA?
Pese a la disputa y las restricciones más amplias, Anthropic continúa trabajando estrechamente con la NSA bajo un acuerdo especializado dentro de su programa Project Glasswing. El Financial Times reportó a comienzos de junio que aproximadamente seis ingenieros de Anthropic están integrados directamente dentro de la agencia como personal "forward-deployed", adaptando y personalizando Mythos para aplicaciones operativas específicas. Fuentes citadas en el reporte indicaron que el trabajo podría extenderse a infiltrar redes operadas por países como China e Irán.
El episodio expone una tensión cada vez más visible: los modelos de frontera están alcanzando capacidades ofensivas que rivalizan con las de actores estatales, mientras las normas de control y supervisión siguen ajustándose en tiempo real. La alianza Five Eyes ya advirtió que la línea de tiempo para esta transformación "no son años, son meses".




