Fable 5 vuelve al mundo tras 2 semanas de veto por jailbreak

El gobierno de EE.UU. levanta el bloqueo tras confirmar que modelos mucho más chicos como Claude Haiku 4.5 replican el mismo exploit; Mythos 5 sigue restringida.

Publicado el 1 de julio de 2026 · 06:31 p. m.3 min de lectura

Al grano

Fable 5, el modelo más potente de Anthropic, vuelve a estar disponible en el mundo desde el 1 de julio.

El veto de dos semanas partió de un jailbreak reportado por investigadores de Amazon que produjo código de exploit funcional.

Anthropic entrenó un clasificador que bloquea la técnica en más del 99% de los casos y redirige la consulta a Opus 4.8.

Por qué importa

El desenlace deja incómodos a los dos lados. Anthropic vende Fable 5 como un salto de capacidad frente al catálogo abierto, pero admite que un jailbreak descubierto por Amazon lo replican también modelos de la casa varios órdenes de magnitud más chicos. La lección no es 'construir un modelo infalible': la superficie ofensiva de la IA ya se democratizó, y el control efectivo pasa por auditoría cruzada y regulación por defecto, no por embargos de dos semanas.

Después de dos semanas de bloqueo, el gobierno de Estados Unidos autorizó a Anthropic a volver a ofrecer Fable 5 a usuarios de todo el mundo. El modelo, actualmente el más potente de la compañía, ya está de nuevo disponible desde la Plataforma Claude, Claude.ai, Claude Code y Claude Cowork.

Los planes Pro, Max, Team y algunos Enterprise pueden usar Fable 5 hasta el 7 de julio consumiendo hasta el 50% del cupo semanal. Pasada esa fecha, el modelo se cobrará mediante créditos de uso. El acceso desde AWS, Google Cloud y Microsoft Foundry se restablecerá "lo antes posible", según la compañía.

¿Qué diferencia hay entre Fable 5 y Mythos 5?

Mythos 5, la versión menos restringida del mismo modelo base, sigue disponible sólo para un grupo acotado de organizaciones estadounidenses. Esa lista, aprobada por el gobierno el 26 de junio, se enmarca en el programa Glasswing, cuyos socios reciben acceso anticipado a modelos frontera. Anthropic sigue negociando con Washington para ampliar la nómina y no está claro si la Unión Europea se sumará.

¿Por qué se activó el veto en primer lugar?

Anthropic confirmó que la suspensión partió de un hallazgo de seguridad reportado por investigadores de Amazon. El equipo consiguió saltar las barandas de seguridad de Fable 5 y, en una prueba específica, el modelo no sólo identificó varias vulnerabilidades de software, sino que además redactó código para explotar una de ellas.

El gobierno y la compañía dedicaron dos semanas a auditar el hallazgo. La conclusión fue incómoda para el argumento de la exclusividad: muchos modelos menos capaces detectaron los mismos fallos, incluidos Claude Opus 4.8, GPT-5.5 y Kimi K2.7. En la demostración concreta del exploit, todos los modelos evaluados produjeron el mismo resultado, incluso el mucho más pequeño Claude Haiku 4.5.

Nuevo clasificador: 99% de bloqueo con un costo real

Anthropic entrenó un clasificador de seguridad reforzado que bloquea la técnica reportada por Amazon en más del 99% de los intentos. Cuando el filtro rechaza una consulta, el usuario recibe un aviso y la petición se enruta a Opus 4.8, el modelo previo. La contraparte del ajuste es un costo real de utilidad: el clasificador marca con más frecuencia peticiones inofensivas de programación y debugging cotidiano.

No es un dato menor. Los propios usuarios ya se venían quejando de que Fable 5 era demasiado restrictivo en su primer lanzamiento. El diagrama que publicó Anthropic muestra que el margen de seguridad de Fable 5 es mucho más amplio que el de las barandas estándar: se filtran más pedidos peligrosos, pero también se detienen más inofensivos.

"Es probablemente imposible" hacer un modelo a prueba de jailbreaks

Anthropic reconoce en su comunicado que "probablemente es imposible construir un modelo de IA totalmente robusto (o sea, impermeable) frente a jailbreaks". Ese consenso ya circulaba en la industria antes de que Fable 5 saliera al mercado, pero es la primera vez que la propia empresa lo pone por escrito con esas palabras.

La compañía plantea que el sector necesita un estándar compartido para calificar jailbreaks y activar contramedidas. Dice estar construyendo ese marco junto a Amazon, Microsoft, Google y otros socios de Glasswing. En paralelo, montó un equipo de monitoreo 24/7 sobre canales de reporte de jailbreaks y lanzó un nuevo programa en HackerOne donde investigadores de seguridad pueden reportar potenciales cyber jailbreaks específicos de Fable 5.

Regulación como pedido explícito

Anthropic también reforzó su vínculo con el gobierno estadounidense a partir de la orden ejecutiva que rige la revisión de modelos frontera. Los compromisos anunciados: acceso pre-release para socios gubernamentales en áreas sensibles a seguridad, notificación rápida de jailbreaks descubiertos, cómputo y equipo dedicado a investigación conjunta, y colaboración en el estándar de la industria.

La empresa quiere todo eso escrito en "regulación robusta" y aplicado por igual a cada proveedor de modelos frontera. "La intervención gubernamental en el lanzamiento de modelos exige un proceso duradero y transparente que dé a los defensores cibernéticos y a otros la certeza que necesitan sobre el acceso a modelos potentes", afirma Anthropic en su comunicado.

Fable 5 vuelve al mundo tras 2 semanas de veto por jailbreak

Al grano

Por qué importa

¿Qué diferencia hay entre Fable 5 y Mythos 5?

¿Por qué se activó el veto en primer lugar?

Nuevo clasificador: 99% de bloqueo con un costo real

"Es probablemente imposible" hacer un modelo a prueba de jailbreaks

Regulación como pedido explícito

Seguir leyendo

NVIDIA FOX: el cerebro agéntico para fábricas autónomas

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

NVIDIA empuja a las telcos a vender tokens AI en vez de GPU por hora

NVIDIA libera Fleet Intelligence para monitorear sus GPUs

→Al grano

✦Por qué importa

¿Qué diferencia hay entre Fable 5 y Mythos 5?

¿Por qué se activó el veto en primer lugar?

Nuevo clasificador: 99% de bloqueo con un costo real

"Es probablemente imposible" hacer un modelo a prueba de jailbreaks

Regulación como pedido explícito

Seguir leyendo

NVIDIA FOX: el cerebro agéntico para fábricas autónomas

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

NVIDIA empuja a las telcos a vender tokens AI en vez de GPU por hora

NVIDIA libera Fleet Intelligence para monitorear sus GPUs

Al grano

Por qué importa