DeepSeek anuncio en X que dejara permanente el descuento del 75 por ciento sobre su modelo principal DeepSeek V4 Pro, una promocion que originalmente caducaba el 31 de mayo de 2026. Con el ajuste, un millon de tokens de input sin cache cuesta apenas USD 0,435 y un millon de tokens de output cuesta USD 0,87. Los aciertos de cache bajan el precio de input todavia mas.
A modo de comparacion, GPT-5.5 cobra USD 5 por millon de tokens de input y USD 30 por millon de tokens de output, mientras que Opus 4.7 queda en USD 5 de input y USD 25 de output.
| Modelo | Input por 1M tokens | Cache hit input | Output por 1M tokens |
|---|---|---|---|
| DeepSeek-V4-Pro | USD 0,435 | USD 0,003625 | USD 0,87 |
| DeepSeek-V4-Flash | USD 0,14 | USD 0,0028 | USD 0,28 |
| GPT-5.5 | USD 5,00 | USD 0,50 | USD 30,00 |
| GPT-5.5 (contexto largo, >272K) | USD 10,00 | USD 1,00 | USD 45,00 |
| Opus 4.7 | USD 5,00 | USD 0,50 | USD 25,00 |
Eso convierte al insignia de DeepSeek en cerca de 11,5 veces mas barato que GPT-5.5 en pricing standard de input. La brecha es mucho mas amplia en output, donde DeepSeek V4 Pro queda alrededor de 34,5 veces mas barato. Contra el pricing de contexto largo de GPT-5.5 (sobre 272.000 tokens), DeepSeek V4 Pro es aproximadamente 23 veces mas barato en input y 51,7 veces mas barato en output. DeepSeek V4 Flash es todavia mas economico.
Ambos modelos de DeepSeek ofrecen una ventana de contexto de un millon de tokens y hasta 384.000 tokens de output. Tambien soportan los formatos de API de OpenAI y de Anthropic, lo que facilita el switch para desarrolladores que migran desde esas plataformas.
¿El precio por token cuenta toda la historia?
El precio crudo por token es solo parte del cuadro. El consumo de tokens por tarea importa tanto como la tarifa. Funciona como el precio de la bencina: una tarifa baja por galon no ayuda si el motor consume mucho mas. Un buen ejemplo es el Gemini Flash 3.5 de Google. En el papel es mas barato y rinde parecido al Pro 3.1 anterior, pero quema bastante mas tokens, lo que potencialmente lo hace mas caro en practica. El Opus 4.7 de Anthropic tambien luce mas barato que GPT-5.5 en papel, pero usa mas tokens que su predecesor. GPT-5.5 en cambio consume menos tokens que GPT-5.4. Aun asi, ambos modelos terminaron entre 30 y 90 por ciento mas caros en uso real que los modelos a los que reemplazaron.
DeepSeek V4 va claramente por detras de los modelos frontera GPT-5.5 y Opus 4.7 en rendimiento crudo. Cuanto exactamente depende de la tarea, y los benchmarks solo cuentan media historia: el uso real es el que decide. Pero el gap de precio es enorme, especialmente para sistemas de IA agentica que mastican muchos mas tokens que un chatbot estandar.
¿Por que el factor precio gana peso justo ahora?
A medida que el uso de IA crece, las empresas se vuelven mas sensibles al precio. Mientras el ROI del gasto en IA siga siendo dificil de medir, muchas firmas pueden cambiar de estrategia: dejar de buscar el mejor modelo y apuntar al mas barato que sea suficientemente bueno.
DeepSeek entra a su primera ronda de financiamiento, pero esta lejos de la presion de ingresos que enfrentan OpenAI y Anthropic, ambas en camino a un IPO. Esa asimetria de obligaciones financieras es la que le permite a la empresa china sostener una guerra de precios sin necesidad de cuadrar caja en el corto plazo.
Para integradores LatAm que estan construyendo agentes con consumo de millones de tokens diarios, el calculo se vuelve concreto: un mismo flujo de trabajo que cuesta USD 300 al dia con GPT-5.5 baja a cifras de un solo digito con DeepSeek V4 Pro, si el rendimiento alcanza para la tarea.




