Anthropic anunció que está deshabilitando dos modelos de IA que lanzó esta misma semana, Claude Fable 5 y Mythos 5, para cumplir con una directiva de control de exportaciones que recibió el viernes por la tarde del gobierno de Estados Unidos, citando preocupaciones de seguridad nacional.

El incidente sin precedentes marca el último choque entre Anthropic y la administración Trump. Aunque la compañía dice que la orden le pedía suspender acceso a "cualquier nacional extranjero, dentro o fuera de Estados Unidos, incluyendo empleados extranjeros de Anthropic", optó por eliminar el acceso para todos sus clientes para asegurar el cumplimiento.

A comienzos de este año, el Departamento de Defensa de Trump etiquetó a Anthropic como un "riesgo de cadena de suministro" después de que la creadora de Claude intentara trazar líneas rojas sobre cómo el ejército estadounidense podía usar su tecnología. La designación efectivamente bloqueó a agencias gubernamentales y contratistas de usar la tecnología de Anthropic. La empresa respondió presentando demandas contra la administración Trump.

¿Qué dice la carta del gobierno?

El martes, Anthropic liberó públicamente Claude Fable 5, una versión del modelo Mythos con salvaguardas que impiden responder preguntas sobre ciberseguridad, biología y química. Antes del lanzamiento público, hecho según Anthropic en colaboración con el gobierno estadounidense, el modelo Mythos Preview había tenido un rollout limitado en abril.

En un post de blog publicado el viernes, Anthropic confirmó que recibió una carta del gobierno a las 17:21 ET. "La carta no aportó detalles específicos sobre su preocupación de seguridad nacional", escribió la compañía.

"Nuestro entendimiento es que el gobierno cree haber tomado conocimiento de un método para esquivar, o 'jailbreak', a Fable 5", agregó la empresa. "Revisamos una demostración de esta técnica específica siendo usada para identificar un pequeño número de vulnerabilidades menores ya conocidas. Estas vulnerabilidades parecen relativamente simples, y descubrimos que otros modelos públicamente disponibles también pueden encontrarlas sin requerir un bypass."

¿Qué tan grave es el jailbreak?

En el post, la empresa argumenta haber implementado salvaguardas fuertes para reducir la probabilidad de uso indebido de Claude Fable 5. Anthropic también afirma que el jailbreak detectado por el gobierno es angosto y no haría a un atacante significativamente más peligroso de lo que sería con otro modelo de IA disponible.

"A la fecha, el gobierno solo nos ha entregado evidencia verbal de un potencial jailbreak angosto y no universal, que esencialmente consiste en pedirle al modelo que lea un código base específico y arregle cualquier falla de software", indicó la empresa en su blog. "Nuestro entendimiento es que un potencial jailbreak fue compartido con el gobierno."

Los voceros de la Casa Blanca y del Departamento de Comercio de EEUU no respondieron inmediatamente al requerimiento de comentarios de Wired.

Contradicción con el discurso de Amodei

El CEO de Anthropic, Dario Amodei, sostuvo en un ensayo de política publicado esta misma semana que él y la empresa apoyan un proceso gubernamental justo, estructurado y transparente que pueda bloquear el lanzamiento de modelos de IA inseguros. En el post de blog del viernes, Anthropic argumentó que "esta acción no se ajusta a esos principios".

Tabla comparativa: precedente regulatorio en IA

  • Acción contra Anthropic (junio 2026): directiva verbal, sin detalles públicos, jailbreak descrito como angosto. Tiempo entre lanzamiento y bloqueo: 4 días.
  • Bloqueo a chips NVIDIA H20 China (octubre 2025): vía export control formal, con plazos y excepciones publicadas.
  • Pause Italy a ChatGPT (2023): razón pública (GDPR), plazo de remediación de 1 mes.

El caso Anthropic es el primero documentado donde el gobierno de EEUU obliga a desactivar un modelo de IA comercial post-lanzamiento vía export control, sin publicar la metodología técnica del jailbreak. Para integradores LatAm que estaban evaluando Claude Fable 5 desde el martes, el corte significa renegociar planes de migración: el modelo simplemente ya no está accesible vía API.