La directiva llegó el viernes a las 17:21 hora del este, según el comunicado de Anthropic. El gobierno de Estados Unidos, invocando autoridades de seguridad nacional, emitió una orden de control de exportaciones que obliga a la compañía a cortar el acceso a Fable 5 y Mythos 5 para cualquier extranjero, dentro o fuera del país. La orden incluye a los propios empleados extranjeros de Anthropic.
El efecto neto, explica la empresa, es que tuvo que desactivar abruptamente ambos modelos para todos sus clientes (chilenos, europeos, asiáticos y estadounidenses por igual) para garantizar el cumplimiento. El resto de la familia Claude, incluidos Opus 4.X, Sonnet 4.X y Haiku 4.5, no se ve afectado.
¿Qué provocó la suspensión?
Según Anthropic, la directiva surge porque el gobierno cree haber tomado conocimiento de un método para esquivar, o "jailbreakear", a Fable 5. La empresa revisó una demostración de la técnica y dice haber identificado un puñado de vulnerabilidades menores ya conocidas, todas relativamente simples.
"Otros modelos disponibles públicamente son capaces de descubrir las mismas vulnerabilidades sin necesidad de un bypass", argumenta el comunicado, en una referencia directa a GPT-5.5 de OpenAI y otros frontier models.
¿Qué dice Anthropic sobre sus propias defensas?
La compañía sostiene que su postura de seguridad, expuesta en su post de lanzamiento, descansa sobre varios pilares:
- Las salvaguardas son tan estrictas que muchos usuarios se quejaban de que resultaban demasiado amplias.
- En las semanas previas al lanzamiento, Anthropic trabajó con el propio gobierno estadounidense, el AISI del Reino Unido y múltiples organizaciones privadas para someter el modelo a red-teaming durante miles de horas en total.
- Los tests mostraron que las defensas de Fable son sustancialmente más efectivas que las de cualquier modelo desplegado previamente.
- Ningún tester logró encontrar un jailbreak universal, un método capaz de evadir ampliamente las salvaguardas y desbloquear capacidades cibernéticas amplias.
Anthropic admite, eso sí, que la resistencia perfecta al jailbreak no parece posible hoy para ningún proveedor: todos los modelos del sector son vulnerables a jailbreaks no universales que arrancan información en circunstancias específicas. Por eso adoptó una estrategia de defense in depth: hacer los bypasses ya sea muy estrechos, ya sea muy caros de producir, y complementar con monitoreo intensivo para detectar y cortar ataques exitosos. Esta es también la razón detrás de la retención obligatoria de 30 días de datos de clientes en Fable, una política que tiene costos comerciales reales pero permite investigar exploits a fondo.
¿Qué evidencia entregó el gobierno?
Hasta ahora, según Anthropic, el gobierno solo ha entregado evidencia verbal de un potencial jailbreak estrecho y no universal. La técnica consistiría esencialmente en pedirle al modelo que lea un código fuente específico y arregle defectos de software. La compañía afirma haber revisado un informe que cree que es la base de la directiva y haber validado que el nivel de capacidad mostrado está ampliamente disponible en otros modelos, incluyendo GPT-5.5 de OpenAI, y se usa todos los días por los defensores que mantienen los sistemas seguros.
"No hemos recibido siquiera una divulgación de un potencial jailbreak no universal preocupante que haya conducido a un resultado dañino", remata el comunicado.
El desacuerdo público con el regulador
Anthropic confirma que cumplirá la directiva y retirará el acceso a Fable 5 y Mythos 5 para todos los usuarios. Pero discrepa del estándar regulatorio que la fundamenta.
"Estamos en desacuerdo con que la identificación de un potencial jailbreak estrecho deba ser causa para retirar un modelo comercial desplegado para cientos de millones de personas", advierte la empresa. "Si este estándar se aplicara en toda la industria, creemos que esencialmente paralizaría todos los nuevos despliegues de modelos para todos los proveedores frontera."
La compañía cierra señalando que, si bien cree que el gobierno debe tener la facultad de bloquear despliegues inseguros como parte de un proceso estatutario "transparente, justo, claro y basado en hechos técnicos", esta acción no cumple esos principios. Y prometió compartir más detalles "en las próximas 24 horas".




