Anthropic enfrenta a la Casa Blanca por el jailbreak de Fable 5

Funcionarios de Trump acusan a la firma de liberar Fable 5 sin esperar al clearinghouse previsto en la executive order cyber, mientras 100 expertos en seguridad piden levantar los controles de export.

Publicado el 17 de junio de 2026 · 04:24 p. m.3 min de lectura

Al grano

Funcionarios de la administración Trump acusan a Anthropic de liberar Fable 5 sin esperar la aprobación del clearinghouse de la executive order cyber, según Axios.

El gobierno alega que la firma sabía de un riesgo de jailbreak y guardó silencio; el aviso habría llegado desde Amazon y otras tech.

Más de 100 expertos en ciberseguridad firmaron una carta abierta pidiendo levantar los controles de export sobre Fable y Mythos.

Por qué importa

La verdad sobre LLMs inhackeables es la incómoda: nadie sabe construirlos. OpenAI lo dijo de sus modelos propios, ningún paper académico promete prompt injection resuelto. Que la Casa Blanca pretenda ese estándar antes de un release internacional sugiere desconocimiento del estado del arte, no celo regulatorio. La conversación útil sería sobre velocidad de contramedidas, no sobre invulnerabilidad.

"Todos decían que Anthropic era un mal actor. Algunos de nosotros decíamos que era hora de darles una chance. Ahora esa gente se está cuestionando esa decisión. Nos cagaron."

Así resumió un funcionario de la administración Trump el conflicto entre la Casa Blanca y Anthropic, según un reporte de Axios.

Funcionarios del gobierno acusan a la firma de ignorar la executive order cyber recientemente firmada por Trump. Esa orden ejecutiva planteó una supervisión gubernamental supuestamente voluntaria de los modelos IA. Anthropic recibió bien la propuesta, pero liberó Fable 5 sin esperar al clearinghouse designado que debía dar el visto bueno.

¿Qué dice el gobierno?

Un funcionario también acusa a Anthropic de haber sabido que un jailbreak podía ocurrir. "Llegaron a cada bifurcación del camino y tomaron la equivocada". El soplo sobre ese jailbreak, cuya existencia y severidad todavía no están confirmadas, habría llegado desde Amazon y otras compañías tech.

Las fuentes del gobierno también criticaron la comunicación entre las dos partes. "Es como si hablaran idiomas distintos". El Departamento de Comercio y empleados de Anthropic estarían en conversaciones, con más reuniones planificadas que involucrarán a la CIA y al asesor científico Michael Kratsios.

¿Se puede construir un LLM "inhackeable"?

La acusación de que Anthropic conocía el riesgo de jailbreak y guardó silencio dice más sobre el entendimiento del gobierno respecto de la IA que sobre Anthropic. Cualquiera que trabaje cerca de modelos IA sabe que pueden ser hackeados.

OpenAI advirtió que la prompt injection, un método de ataque relacionado, puede que nunca se resuelva del todo. No hay fix para la seguridad de los LLM todavía.

La pregunta real es qué tan severa es la brecha y qué tan rápido entran las contramedidas. Pero si el gobierno de EE.UU. insiste en que los modelos IA de frontera deben ser "inhackeables" antes de salir internacionalmente, hay conversaciones difíciles por delante.

Tampoco es que Anthropic esté en una posición cómoda. Dario Amodei, CEO de la firma, dijo en 2023 que "un jailbreak podría ser cuestión de vida o muerte" si alguien consiguiera saltarse los protocolos de seguridad en ciencia, tecnología y biología.

Más de 100 expertos defienden a Anthropic

En paralelo, más de 100 expertos en seguridad y ejecutivos de la industria tech publicaron una carta abierta dirigida al Secretario de Comercio Lutnick y al National Cyber Director Cairncross, pidiendo que se levanten los controles de export sobre Fable y Mythos.

Los firmantes argumentan que, si bien los modelos de Anthropic son buenos encontrando fallas de seguridad en software, no son únicamente buenos en eso. Otros modelos como GPT-5.5, Opus, Sonnet y el chino Kimi 2.7 pueden hacer lo mismo.

Anthropic también construyó varios safeguards en Fable que la comunidad de seguridad descartó como exagerados el día del lanzamiento. Los firmantes advierten que los controles de export están dejando a los defensores sin las mejores herramientas, mientras que los modelos de pesos abiertos chinos están solo a unos meses de distancia de los mejores modelos estadounidenses.

Entre los firmantes figuran:

Alex Stamos (Corridor)
Rachel Tobac (SocialProof Security)
Katie Moussouris (Luta Security)
Dan Lorenc (Chainguard)
Joe Levy (Sophos)

Comparativa: qué modelos pueden hacer security research hoy

Modelo	Origen	Acceso	Capacidad reportada en sec research
Fable 5 (Anthropic)	EE.UU.	Sujeto a export controls	Alta
Mythos (Anthropic)	EE.UU.	Sujeto a export controls	Alta
GPT-5.5 (OpenAI)	EE.UU.	API global	Alta
Opus (Anthropic)	EE.UU.	API	Alta
Sonnet (Anthropic)	EE.UU.	API	Media-alta
Kimi 2.7 (Moonshot)	China	Open weights	Alta

La tabla muestra el dilema regulatorio: bloquear Fable y Mythos no elimina el acceso a capacidades equivalentes, solo desplaza a los defensores hacia opciones menos controladas.

¿Qué consecuencias tiene para Chile y la región?

Para integradores, equipos de ciberseguridad y agencias chilenas que evalúan adoptar modelos de frontera para security research, la disputa expone una incomodidad concreta. Si Anthropic queda bajo restricciones más duras desde Washington, el acceso vía API podría volverse impredecible: cambios de términos, blackouts regionales y límites de uso pueden materializarse en cuestión de semanas. La salida sensata es diversificar el stack ya hoy con al menos dos proveedores (Anthropic + un alternativo como OpenAI o un open-weights chino accesible), porque depender de un único modelo de frontera para detección de vulnerabilidades expone la operación a decisiones políticas tomadas a miles de kilómetros de Santiago.

Anthropic enfrenta a la Casa Blanca por el jailbreak de Fable 5

Al grano

Por qué importa

¿Qué dice el gobierno?

¿Se puede construir un LLM "inhackeable"?

Más de 100 expertos defienden a Anthropic

Comparativa: qué modelos pueden hacer security research hoy

¿Qué consecuencias tiene para Chile y la región?

Seguir leyendo

Anthropic reactiva Fable 5 tras retirar EE.UU. los controles

Anthropic detalla las 4 categorías cyber que filtra Fable 5

NSA confirma jailbreak de Fable 5 y exige a Anthropic blindarlo

Anthropic bloqueada: la causa nunca fue un jailbreak técnico

→Al grano

✦Por qué importa

¿Qué dice el gobierno?

¿Se puede construir un LLM "inhackeable"?

Más de 100 expertos defienden a Anthropic

Comparativa: qué modelos pueden hacer security research hoy

¿Qué consecuencias tiene para Chile y la región?

Seguir leyendo

Anthropic reactiva Fable 5 tras retirar EE.UU. los controles

Anthropic detalla las 4 categorías cyber que filtra Fable 5

NSA confirma jailbreak de Fable 5 y exige a Anthropic blindarlo

Anthropic bloqueada: la causa nunca fue un jailbreak técnico

Al grano

Por qué importa