Amazon ya está destilando modelos de Anthropic en copias más pequeñas y baratas para uso interno, según un reporte de The Information recogido por The Decoder. La motivación es evitar un salto de costos: el próximo año cambia la fórmula de facturación entre ambas compañías.
¿Qué es la distillation y por qué la usa Amazon?
La distillation consiste en tomar un modelo grande como maestro y entrenar uno más pequeño con sus salidas, buscando capturar buena parte del comportamiento del original con una fracción del cómputo. Es la misma lógica que Apple aplica sobre Gemini para inferencia local en iOS, según los documentos filtrados en el juicio antimonopolio de Google.
Una persona con conocimiento directo dijo a The Information que Amazon tiene derechos contractuales específicos con Anthropic para usar sus modelos con este fin. El servicio comercial de destilación que Amazon ofrece en su plataforma Bedrock no incluye a los Claude: sólo soporta los modelos propios de Nova y los Llama de Meta.
¿Por qué ahora?
El motor detrás del apuro es una renegociación de la alianza. Desde 2027, Amazon dejará de pagar por horas de cómputo y pasará a un esquema por tokens procesados, un modelo que suele ser más caro cuando el uso interno es intensivo. Un vocero de Amazon rebatió esa lectura y dijo que la ampliación del acuerdo "no elevará los costos". Anthropic, por su parte, sostiene que sus modelos entregan mejor rendimiento por dólar que la competencia.
Alternativas a Claude en el radar de Amazon
Amazon también estaría evaluando alternativas: OpenAI y sus propios modelos Nova. Este año la empresa comprometió hasta USD 25.000 millones adicionales en Anthropic y hasta USD 50.000 millones en OpenAI, cifras que la ubican como uno de los mayores inversores cruzados del ecosistema. La estrategia de doble apuesta la aísla parcialmente de un cambio de precios de cualquiera de las dos empresas.
¿Qué implica para el ecosistema latinoamericano?
Para equipos de la región que operan sobre Bedrock, la lectura corta es que el precio efectivo de Claude vía Amazon podría cambiar en 2027, hacia arriba o hacia abajo, dependiendo del mix de tokens. Para startups y empresas que están cerrando pricing con integradores locales conviene revisar los contratos multianuales y dejar espacio para migraciones o mezclas de modelos. La distillation también es una herramienta accesible para equipos pequeños: entrenar un modelo destilado propio sobre un stack como Nova o Llama 4 requiere menos de USD 5.000 en cómputo para tareas verticales concretas, según las estimaciones que circulan en la comunidad open source.




