Amazon destila modelos de Anthropic ante el pricing por tokens

Desde 2027 Amazon paga por tokens procesados y no por horas de cómputo. Ingenieros internos ya crean copias más pequeñas de Claude para tareas en producción, según reportó The Information.

Publicado el 2 de julio de 2026 · 03:35 p. m.2 min de lectura

Al grano

Amazon destila modelos Claude en versiones más chicas para uso interno, según The Information; el objetivo es bajar el costo esperado por token.

El contrato Amazon–Anthropic pasa desde 2027 a pricing por tokens procesados en vez de por horas de cómputo.

Amazon invirtió este año hasta USD 25.000 millones más en Anthropic y hasta USD 50.000 millones en OpenAI, y explora también sus modelos Nova.

Por qué importa

El movimiento de Amazon es un termómetro del estrés real del gasto en IA a gran escala. Cuando el propio hyperscaler que mete cheques de USD 25.000 millones prefiere entrenar un destilado interno antes que pagar por tokens, la señal no es sobre precios de Anthropic sino sobre márgenes. La partida siguiente será ver si Nova y OpenAI absorben las cargas más costo-sensibles y Claude queda como motor premium.

Amazon ya está destilando modelos de Anthropic en copias más pequeñas y baratas para uso interno, según un reporte de The Information recogido por The Decoder. La motivación es evitar un salto de costos: el próximo año cambia la fórmula de facturación entre ambas compañías.

¿Qué es la distillation y por qué la usa Amazon?

La distillation consiste en tomar un modelo grande como maestro y entrenar uno más pequeño con sus salidas, buscando capturar buena parte del comportamiento del original con una fracción del cómputo. Es la misma lógica que Apple aplica sobre Gemini para inferencia local en iOS, según los documentos filtrados en el juicio antimonopolio de Google.

Una persona con conocimiento directo dijo a The Information que Amazon tiene derechos contractuales específicos con Anthropic para usar sus modelos con este fin. El servicio comercial de destilación que Amazon ofrece en su plataforma Bedrock no incluye a los Claude: sólo soporta los modelos propios de Nova y los Llama de Meta.

¿Por qué ahora?

El motor detrás del apuro es una renegociación de la alianza. Desde 2027, Amazon dejará de pagar por horas de cómputo y pasará a un esquema por tokens procesados, un modelo que suele ser más caro cuando el uso interno es intensivo. Un vocero de Amazon rebatió esa lectura y dijo que la ampliación del acuerdo "no elevará los costos". Anthropic, por su parte, sostiene que sus modelos entregan mejor rendimiento por dólar que la competencia.

Alternativas a Claude en el radar de Amazon

Amazon también estaría evaluando alternativas: OpenAI y sus propios modelos Nova. Este año la empresa comprometió hasta USD 25.000 millones adicionales en Anthropic y hasta USD 50.000 millones en OpenAI, cifras que la ubican como uno de los mayores inversores cruzados del ecosistema. La estrategia de doble apuesta la aísla parcialmente de un cambio de precios de cualquiera de las dos empresas.

¿Qué implica para el ecosistema latinoamericano?

Para equipos de la región que operan sobre Bedrock, la lectura corta es que el precio efectivo de Claude vía Amazon podría cambiar en 2027, hacia arriba o hacia abajo, dependiendo del mix de tokens. Para startups y empresas que están cerrando pricing con integradores locales conviene revisar los contratos multianuales y dejar espacio para migraciones o mezclas de modelos. La distillation también es una herramienta accesible para equipos pequeños: entrenar un modelo destilado propio sobre un stack como Nova o Llama 4 requiere menos de USD 5.000 en cómputo para tareas verticales concretas, según las estimaciones que circulan en la comunidad open source.

Amazon destila modelos de Anthropic ante el pricing por tokens

Al grano

Por qué importa

¿Qué es la distillation y por qué la usa Amazon?

¿Por qué ahora?

Alternativas a Claude en el radar de Amazon

¿Qué implica para el ecosistema latinoamericano?

Seguir leyendo

NVIDIA FOX: el cerebro agéntico para fábricas autónomas

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

NVIDIA empuja a las telcos a vender tokens AI en vez de GPU por hora

NVIDIA libera Fleet Intelligence para monitorear sus GPUs

→Al grano

✦Por qué importa

¿Qué es la distillation y por qué la usa Amazon?

¿Por qué ahora?

Alternativas a Claude en el radar de Amazon

¿Qué implica para el ecosistema latinoamericano?

Seguir leyendo

NVIDIA FOX: el cerebro agéntico para fábricas autónomas

NVIDIA Isaac Lab acelera sim-to-real con 8 papers en ICRA 2026

NVIDIA empuja a las telcos a vender tokens AI en vez de GPU por hora

NVIDIA libera Fleet Intelligence para monitorear sus GPUs

Al grano

Por qué importa