
NSA confirma jailbreak de Fable 5 y exige a Anthropic blindarlo
La administración Trump pasa la pelota a la empresa, pero especialistas en ciberseguridad sostienen desde 2024 que diseñar guardrails imposibles de saltar no es técnicamente alcanzable.
15 notas publicadas

El bloqueo a Claude Fable 5 y Mythos 5 esconde una verdad incómoda: los modelos con capacidades avanzadas de hacking pronto serán la norma, dicen Schneier, Wheeler y otros expertos.

Una directiva entregada el viernes a las 17:21 ET obliga a desactivar globalmente los dos modelos más potentes de la empresa por preocupaciones de seguridad nacional.

Ben Thompson sostiene que Anthropic no sufrió un revés con la suspensión de Fable 5: el imperativo económico y de datos del laboratorio se nutre precisamente de su marketing de seguridad.

La citación liderada por la fiscal Letitia James de Nueva York pide documentos sobre publicidad, datos de salud, manejo de menores y sicofancia del modelo de ChatGPT.

Andy Jassy y ejecutivos de otras cinco firmas alertaron a la Casa Blanca por supuestos riesgos del modelo, aunque Amazon es uno de los mayores inversionistas de Anthropic.

La orden de control de exportaciones cita riesgos de seguridad nacional. Anthropic cumple pero discrepa: dice que el supuesto jailbreak ya existe en GPT-5.5 y otros modelos comerciales.

Un paper de seguridad interno y una llamada del CEO Andy Jassy a la administración Trump precipitaron la orden de control de exportación que dejó a Anthropic sin Fable 5 ni Mythos 5 para extranjeros.

La directiva de control de exportaciones prohíbe el acceso a cualquier extranjero, incluidos empleados de Anthropic, y deja a la empresa sin opción de bloqueo selectivo en tiempo real.

La empresa recibió una directiva de export control citando seguridad nacional y un supuesto jailbreak. Anthropic argumenta que la vulneración es menor y contradice principios de proceso justo.

La Casa Blanca había convocado a CEOs para la firma del jueves; un llamado de último minuto del exasesor de IA convenció al presidente de cancelar el decreto a horas de la ceremonia.

Takaichi instruyó al ministro Matsumoto a auditar sistemas del gobierno y de infraestructura crítica, anticipando un aumento exponencial en la velocidad y escala de los ataques.

Un neurocientífico de Yale propone cuatro reglas mínimas para chatbots: identidad clara, detección de crisis, límites conversacionales y auditoría externa.

El gobierno de Estados Unidos teme que la limitada capacidad de cómputo de la empresa termine restringiendo su propio acceso al modelo, según un reporte del Wall Street Journal.

Las demandas alegan que los sistemas de seguridad de ChatGPT detectaron señales de riesgo en la cuenta de la atacante medio año antes del tiroteo, pero OpenAI no alertó a las autoridades.
Otros temas que aparecen junto a #regulacion ia en nuestra cobertura editorial.