Después de dos semanas de bloqueo, el gobierno de Estados Unidos autorizó a Anthropic a volver a ofrecer Fable 5 a usuarios de todo el mundo. El modelo, actualmente el más potente de la compañía, ya está de nuevo disponible desde la Plataforma Claude, Claude.ai, Claude Code y Claude Cowork.
Los planes Pro, Max, Team y algunos Enterprise pueden usar Fable 5 hasta el 7 de julio consumiendo hasta el 50% del cupo semanal. Pasada esa fecha, el modelo se cobrará mediante créditos de uso. El acceso desde AWS, Google Cloud y Microsoft Foundry se restablecerá "lo antes posible", según la compañía.
¿Qué diferencia hay entre Fable 5 y Mythos 5?
Mythos 5, la versión menos restringida del mismo modelo base, sigue disponible sólo para un grupo acotado de organizaciones estadounidenses. Esa lista, aprobada por el gobierno el 26 de junio, se enmarca en el programa Glasswing, cuyos socios reciben acceso anticipado a modelos frontera. Anthropic sigue negociando con Washington para ampliar la nómina y no está claro si la Unión Europea se sumará.
¿Por qué se activó el veto en primer lugar?
Anthropic confirmó que la suspensión partió de un hallazgo de seguridad reportado por investigadores de Amazon. El equipo consiguió saltar las barandas de seguridad de Fable 5 y, en una prueba específica, el modelo no sólo identificó varias vulnerabilidades de software, sino que además redactó código para explotar una de ellas.
El gobierno y la compañía dedicaron dos semanas a auditar el hallazgo. La conclusión fue incómoda para el argumento de la exclusividad: muchos modelos menos capaces detectaron los mismos fallos, incluidos Claude Opus 4.8, GPT-5.5 y Kimi K2.7. En la demostración concreta del exploit, todos los modelos evaluados produjeron el mismo resultado, incluso el mucho más pequeño Claude Haiku 4.5.
Nuevo clasificador: 99% de bloqueo con un costo real
Anthropic entrenó un clasificador de seguridad reforzado que bloquea la técnica reportada por Amazon en más del 99% de los intentos. Cuando el filtro rechaza una consulta, el usuario recibe un aviso y la petición se enruta a Opus 4.8, el modelo previo. La contraparte del ajuste es un costo real de utilidad: el clasificador marca con más frecuencia peticiones inofensivas de programación y debugging cotidiano.
No es un dato menor. Los propios usuarios ya se venían quejando de que Fable 5 era demasiado restrictivo en su primer lanzamiento. El diagrama que publicó Anthropic muestra que el margen de seguridad de Fable 5 es mucho más amplio que el de las barandas estándar: se filtran más pedidos peligrosos, pero también se detienen más inofensivos.
"Es probablemente imposible" hacer un modelo a prueba de jailbreaks
Anthropic reconoce en su comunicado que "probablemente es imposible construir un modelo de IA totalmente robusto (o sea, impermeable) frente a jailbreaks". Ese consenso ya circulaba en la industria antes de que Fable 5 saliera al mercado, pero es la primera vez que la propia empresa lo pone por escrito con esas palabras.
La compañía plantea que el sector necesita un estándar compartido para calificar jailbreaks y activar contramedidas. Dice estar construyendo ese marco junto a Amazon, Microsoft, Google y otros socios de Glasswing. En paralelo, montó un equipo de monitoreo 24/7 sobre canales de reporte de jailbreaks y lanzó un nuevo programa en HackerOne donde investigadores de seguridad pueden reportar potenciales cyber jailbreaks específicos de Fable 5.
Regulación como pedido explícito
Anthropic también reforzó su vínculo con el gobierno estadounidense a partir de la orden ejecutiva que rige la revisión de modelos frontera. Los compromisos anunciados: acceso pre-release para socios gubernamentales en áreas sensibles a seguridad, notificación rápida de jailbreaks descubiertos, cómputo y equipo dedicado a investigación conjunta, y colaboración en el estándar de la industria.
La empresa quiere todo eso escrito en "regulación robusta" y aplicado por igual a cada proveedor de modelos frontera. "La intervención gubernamental en el lanzamiento de modelos exige un proceso duradero y transparente que dé a los defensores cibernéticos y a otros la certeza que necesitan sobre el acceso a modelos potentes", afirma Anthropic en su comunicado.




