Los precios de servir IA por suscripción están en problemas. El costo por token bajó, sí, pero el consumo subió mucho más rápido. La firma SemiAnalysis compró cada plan de Anthropic y OpenAI y midió cuánto saldría usarlos al máximo a precios de API: por ejemplo, Claude Max 20x cuesta USD 200 mensuales y exprimirlo equivale a un gasto de USD 8.000 al mes en tokens API. ChatGPT Pro 20x, también de USD 200 al mes, tiene un techo de gasto cercano a USD 14.000 mensuales.

¿Quién pierde plata con cada plan?

Según el análisis de SemiAnalysis, los márgenes brutos colapsan rápido:

  • Anthropic queda en cero al 20% de utilización en Claude Pro y Claude Max 5x.
  • OpenAI entra en pérdidas si la utilización supera el 11,4% en ChatGPT Plus y ChatGPT Pro 5x.
  • En los planes top, la situación es más cruda: Anthropic toca 0% de margen bruto con 10% de utilización; OpenAI entra en rojo sobre 5,7%.
  • Subir precios o recortar funciones, en este momento, no parece estar sobre la mesa para ninguna de las dos compañías.

La nota positiva: a medida que llegan modelos nuevos y entran más data centers en operación, el costo de servir modelos existentes baja. SemiAnalysis proyecta que servir modelos al nivel de Opus 4.8 a USD 20 al mes podría volverse rentable pronto. Los frontier como Mythos, en cambio, seguirán siendo caros y probablemente queden reservados a acceso vía API por token.

¿Por qué las empresas grandes están huyendo del API premium?

La IA agéntica gasta hasta mil veces más tokens que el chat tradicional. Microsoft, Meta y Amazon ya frenaron el "tokenmaxxing" porque los costos se desbordaron. Una empresa anónima incluso quemó USD 500 millones en un mes después de no imponer límites de uso a sus empleados.

La respuesta del mercado es pragmática: usar herramientas que enrutan tareas a modelos baratos cuando el caso lo permite. Un reporte del Wall Street Journal afirma que la práctica puede reducir costos hasta 95% alternando entre modelos según el tipo de pregunta.

"No necesitas un modelo que sepa gravedad cuántica", dijo a la publicación Vishal Misra, vicedecano de la Universidad de Columbia. "Estos modelos open-source son muy capaces, y la capacidad de cobrar una prima alta por IA va a disminuir".

¿Cuál es el caso DeepSeek V4?

Flo Crivello, fundador de Lindy —startup de asistentes ejecutivos IA—, contó al WSJ que la compañía migró a DeepSeek V4 porque demostró ser tan capaz como Claude Sonnet pero diez veces más barato. Lindy conserva los modelos de Anthropic para trabajo avanzado como programación, pero el cambio para el resto del flujo "le ahorró a la empresa millones de dólares", según Crivello.

Otras firmas están dando el salto siguiente: armar su propia IA sobre modelos open-source, entrenados con datos internos y afinados a sus necesidades. La inversión inicial es alta, pero el ahorro a mediano plazo y la independencia de proveedores son lo que pesa en la decisión.

¿Qué cambia para integradores LatAm?

El contexto regional vuelve la lógica de switcheo aún más atractiva. La paridad del peso chileno frente al dólar empuja al alza el costo de cualquier plan API en USD, y los planes de suscripción rara vez ofrecen tarifas locales. Un equipo chileno que arme un agente de soporte puede empezar con DeepSeek V4, Qwen3.5 o Kimi K2 por una fracción del costo de Sonnet y reservar Anthropic o OpenAI para los casos de razonamiento más exigentes.

El movimiento también explica por qué Sam Altman, CEO de OpenAI, viene hablando del costo de tokens y dice que la empresa busca formas de ayudar a los usuarios a "obtener más valor por menos gasto" en ChatGPT. El problema es estructural: las suscripciones planas premiaban a los usuarios livianos y subsidiaban a los pesados; con la IA agéntica, todos pasan a ser usuarios pesados.

En paralelo, el modelo de negocio podría virar hacia formatos por consumo. Si el rango de gasto real va de USD 200 a USD 14.000 mensuales según uso, el plan plano deja de tener sentido económico. Esperá ofertas híbridas: piso por suscripción más una franja de tokens medidos con tarifa preferencial.