"Todos decían que Anthropic era un mal actor. Algunos de nosotros decíamos que era hora de darles una chance. Ahora esa gente se está cuestionando esa decisión. Nos cagaron."
Así resumió un funcionario de la administración Trump el conflicto entre la Casa Blanca y Anthropic, según un reporte de Axios.
Funcionarios del gobierno acusan a la firma de ignorar la executive order cyber recientemente firmada por Trump. Esa orden ejecutiva planteó una supervisión gubernamental supuestamente voluntaria de los modelos IA. Anthropic recibió bien la propuesta, pero liberó Fable 5 sin esperar al clearinghouse designado que debía dar el visto bueno.
¿Qué dice el gobierno?
Un funcionario también acusa a Anthropic de haber sabido que un jailbreak podía ocurrir. "Llegaron a cada bifurcación del camino y tomaron la equivocada". El soplo sobre ese jailbreak, cuya existencia y severidad todavía no están confirmadas, habría llegado desde Amazon y otras compañías tech.
Las fuentes del gobierno también criticaron la comunicación entre las dos partes. "Es como si hablaran idiomas distintos". El Departamento de Comercio y empleados de Anthropic estarían en conversaciones, con más reuniones planificadas que involucrarán a la CIA y al asesor científico Michael Kratsios.
¿Se puede construir un LLM "inhackeable"?
La acusación de que Anthropic conocía el riesgo de jailbreak y guardó silencio dice más sobre el entendimiento del gobierno respecto de la IA que sobre Anthropic. Cualquiera que trabaje cerca de modelos IA sabe que pueden ser hackeados.
OpenAI advirtió que la prompt injection, un método de ataque relacionado, puede que nunca se resuelva del todo. No hay fix para la seguridad de los LLM todavía.
La pregunta real es qué tan severa es la brecha y qué tan rápido entran las contramedidas. Pero si el gobierno de EE.UU. insiste en que los modelos IA de frontera deben ser "inhackeables" antes de salir internacionalmente, hay conversaciones difíciles por delante.
Tampoco es que Anthropic esté en una posición cómoda. Dario Amodei, CEO de la firma, dijo en 2023 que "un jailbreak podría ser cuestión de vida o muerte" si alguien consiguiera saltarse los protocolos de seguridad en ciencia, tecnología y biología.
Más de 100 expertos defienden a Anthropic
En paralelo, más de 100 expertos en seguridad y ejecutivos de la industria tech publicaron una carta abierta dirigida al Secretario de Comercio Lutnick y al National Cyber Director Cairncross, pidiendo que se levanten los controles de export sobre Fable y Mythos.
Los firmantes argumentan que, si bien los modelos de Anthropic son buenos encontrando fallas de seguridad en software, no son únicamente buenos en eso. Otros modelos como GPT-5.5, Opus, Sonnet y el chino Kimi 2.7 pueden hacer lo mismo.
Anthropic también construyó varios safeguards en Fable que la comunidad de seguridad descartó como exagerados el día del lanzamiento. Los firmantes advierten que los controles de export están dejando a los defensores sin las mejores herramientas, mientras que los modelos de pesos abiertos chinos están solo a unos meses de distancia de los mejores modelos estadounidenses.
Entre los firmantes figuran:
- Alex Stamos (Corridor)
- Rachel Tobac (SocialProof Security)
- Katie Moussouris (Luta Security)
- Dan Lorenc (Chainguard)
- Joe Levy (Sophos)
Comparativa: qué modelos pueden hacer security research hoy
| Modelo | Origen | Acceso | Capacidad reportada en sec research |
|---|---|---|---|
| Fable 5 (Anthropic) | EE.UU. | Sujeto a export controls | Alta |
| Mythos (Anthropic) | EE.UU. | Sujeto a export controls | Alta |
| GPT-5.5 (OpenAI) | EE.UU. | API global | Alta |
| Opus (Anthropic) | EE.UU. | API | Alta |
| Sonnet (Anthropic) | EE.UU. | API | Media-alta |
| Kimi 2.7 (Moonshot) | China | Open weights | Alta |
La tabla muestra el dilema regulatorio: bloquear Fable y Mythos no elimina el acceso a capacidades equivalentes, solo desplaza a los defensores hacia opciones menos controladas.
¿Qué consecuencias tiene para Chile y la región?
Para integradores, equipos de ciberseguridad y agencias chilenas que evalúan adoptar modelos de frontera para security research, la disputa expone una incomodidad concreta. Si Anthropic queda bajo restricciones más duras desde Washington, el acceso vía API podría volverse impredecible: cambios de términos, blackouts regionales y límites de uso pueden materializarse en cuestión de semanas. La salida sensata es diversificar el stack ya hoy con al menos dos proveedores (Anthropic + un alternativo como OpenAI o un open-weights chino accesible), porque depender de un único modelo de frontera para detección de vulnerabilidades expone la operación a decisiones políticas tomadas a miles de kilómetros de Santiago.




