Anthropic lanzó Claude Sonnet 5 como su nuevo modelo mid-tier por defecto, con despliegue inmediato en Claude, Claude Code, la API y los partners del ecosistema. En paralelo, la compañía confirmó que Fable/Mythos 5 quedaron aprobados para volver a liberarse tras un trabajo con el gobierno, un año después del ban que sacó a esa familia de circulación. La discusión principal, sin embargo, se centró en la eficiencia de Sonnet 5, marcada por cambios en el tokenizador y por un aumento de tres a seis veces en la cantidad de turnos agénticos que usa en benchmarks.

¿Qué es Sonnet 5 y en qué se diferencia de 4.6?

Anthropic posicionó a Sonnet 5 como su "Sonnet más agéntico hasta ahora", con foco en planificación, uso autónomo de navegador y terminal, y ejecución continuada que hasta hace poco requería modelos más grandes y caros. La cuenta de desarrolladores de la compañía lo describió como frontier-quality coding and tool use al precio de Sonnet, y remarcó que ya es el default en Claude Code para usuarios Pro, además de estar disponible en la API y en Managed Agents.

Especificaciones clave:

  • Ventana de contexto: 1 millón de tokens.
  • Precio estándar: USD 3 por millón de tokens de input, USD 15 por millón de output.
  • Precio promocional: USD 2 input y USD 10 output hasta el 31 de agosto o 1 de septiembre según el post.
  • Cache: 25% de premium para writes (USD 3,75 por millón), 90% de descuento para hits (USD 0,30 por millón), TTL de 5 minutos.
  • Niveles de effort: max, xhigh, high, medium, low. Cinco en total, igualando a Opus 4.8. El xhigh es nuevo.
  • Knowledge cutoff (rumor pre-lanzamiento): enero de 2026.

Anthropic también sumó soporte de plataforma: llegó Claude Desktop para Linux (beta Ubuntu/Debian) con Claude Code, Cowork y chat en los planes pagos, aunque Computer Use quedó afuera de esta versión. Los Managed Agents recibieron streaming de deltas de sesión, overrides por sesión, eventos de webhook, paginación reversa, scoping de inyección de credenciales y un tab de observabilidad con métricas de tokens y tools.

¿Cuánto mejora en benchmarks vs Sonnet 4.6 y Opus 4.8?

Los terceros coincidieron en que Sonnet 5 es una mejora real sobre 4.6, pero pusieron en discusión si amerita el salto de nombre a "5.0" y si su relación precio/rendimiento frente a Opus y competidores realmente cierra.

  • CursorBench: 57% para Sonnet 5 vs 49% para Sonnet 4.6, según Cursor.
  • Artificial Analysis Intelligence Index: puntaje 53, +6 sobre Sonnet 4.6. Lo ubica en el puesto #5 global, empatado con GPT-5.5 en alta reasoning, pero por debajo de Opus 4.7 y 4.8, según Artificial Analysis.
  • FrontierCode Extended (Cognition): 53,8% de score y 57,6% pass rate, adelante de Opus 4.8 en esa evaluación, según Cognition.
  • CritPt frontier physics: 17%, +14 puntos sobre el antecesor, pero todavía por detrás de GLM-5.2, Claude Opus, Fable y variantes de GPT-5.5.
  • Otras mejoras vs 4.6: Terminal-Bench v2.1 +9, Humanity's Last Exam +10, SciCode +7.
  • Runescape benchmark (según Max Bittker): mejora fuerte sobre 4.6, pero atrás de GLM 5.2 y Gemini 3.5 Flash en su cercanía Pareto.

El costo real por tarea: 2× más que 4.6

El dato incómodo llegó del análisis de tokens que hizo Artificial Analysis. Sonnet 5 usa en promedio 69.000 tokens de output por tarea, un 40% más que Sonnet 4.6. Con eso, a precio estándar, cada tarea del Intelligence Index cuesta USD 2,29 con Sonnet 5, 2× lo que costaba con 4.6 y 15% más caro que Opus 4.8, a pesar del menor precio por token. El motivo es simple: usa más turnos.

En AA-Briefcase y GDPval-AA, Sonnet 5 usó cerca de 3× los turnos agénticos de 4.6. Y dentro del propio Sonnet 5, el nivel max effort consume alrededor de 6× más turnos que el nivel low effort en GDPval-AA. Esa es la diferencia entre el marketing ("mismo precio que Sonnet") y el bill real ("dos veces la corrida anterior por la misma tarea").

¿Y qué pasó con Fable 5?

Antes del lanzamiento circuló un rumor fuerte de que Sonnet 5 vendría acompañado por el regreso de Fable 5. El sleuthing de strings en la app había mostrado que Anthropic preparaba a Fable 5 detrás de un sistema separado de créditos de uso, facturado por fuera de los planes existentes, con lenguaje de verificación de identidad al lado. Eso alimentó la especulación de que el acceso sería restringido y más regulado, quizás con problemas de disponibilidad regional en Europa.

El día del anuncio la expectativa quedó a medias: Sonnet 5 sí, Fable 5 no. La reacción en X fue directa: "instead we got sonnet 5", escribió @kimmonismus; "It's been 18 days since Fable 5 was banned", agregó @theo. El anuncio de que Fable/Mythos 5 quedan aprobados para volver a liberarse llegó horas después vía cuenta oficial, sin fecha exacta de re-release ni detalles del proceso regulatorio con el gobierno.

Adopción en el ecosistema

El resto del ecosistema salió rápido a integrar Sonnet 5, señal de que lo lee como default relevante aun cuando el entusiasmo de usuarios fue mixto. FactoryAI, Perplexity, Cursor, Devin, Droid, Agent Arena y VS Code sumaron soporte o disponibilidad el mismo día. Cline destacó rendimiento nivel Opus 4.8 en Terminal-Bench por menos de la mitad del costo, más mejor resistencia a prompt-injection hijacks para "--yolo coders".

Anthropic acompañó el lanzamiento con documentación de migración y una claude-api skill que ayuda a ajustar prompts, recomendar niveles de effort y configurar advisor mode para Sonnet 5. Los posts del summary oficial también remarcaron que Sonnet 5 es más seguro que Sonnet 4.6, con menos alucinaciones y menos sicofancia, con cyber safeguards activos por default, aunque reconocieron que Opus sigue siendo más fuerte para trabajo cyber serio.