DeepSeek deja permanente el 75% de descuento: hasta 51x mas barato

El recorte sobre DeepSeek V4 Pro lleva el output a USD 0,87 por millon de tokens y consolida la guerra de precios que la oferta china abrio contra OpenAI y Anthropic.

Publicado el 24 de mayo de 2026 · 09:23 a. m.3 min de lectura

Al grano

DeepSeek dejo permanente el descuento del 75% sobre DeepSeek V4 Pro, originalmente fijado hasta el 31 de mayo de 2026.

El millon de tokens de output cuesta USD 0,87 (vs USD 30 de GPT-5.5 y USD 25 de Opus 4.7), una brecha de hasta 51 veces en contextos largos.

Ambos modelos DeepSeek soportan formatos de API de OpenAI y Anthropic, ofrecen contexto de 1M tokens y 384.000 tokens de output.

Por qué importa

La pregunta no es si DeepSeek puede sostener este precio (puede, no tiene presion de IPO), sino si los modelos occidentales pueden seguir cobrando 30x sobre output cuando hay una alternativa pasable a 1/30 del costo. Los integradores que arman agentes con millones de tokens diarios van a evaluar esto en serio. El factor decisivo no sera benchmark crudo, sera el modelo mas barato que pase los tests internos. La eficiencia por tarea de cada modelo importa tanto como el precio sticker.

DeepSeek anuncio en X que dejara permanente el descuento del 75 por ciento sobre su modelo principal DeepSeek V4 Pro, una promocion que originalmente caducaba el 31 de mayo de 2026. Con el ajuste, un millon de tokens de input sin cache cuesta apenas USD 0,435 y un millon de tokens de output cuesta USD 0,87. Los aciertos de cache bajan el precio de input todavia mas.

A modo de comparacion, GPT-5.5 cobra USD 5 por millon de tokens de input y USD 30 por millon de tokens de output, mientras que Opus 4.7 queda en USD 5 de input y USD 25 de output.

Modelo	Input por 1M tokens	Cache hit input	Output por 1M tokens
DeepSeek-V4-Pro	USD 0,435	USD 0,003625	USD 0,87
DeepSeek-V4-Flash	USD 0,14	USD 0,0028	USD 0,28
GPT-5.5	USD 5,00	USD 0,50	USD 30,00
GPT-5.5 (contexto largo, >272K)	USD 10,00	USD 1,00	USD 45,00
Opus 4.7	USD 5,00	USD 0,50	USD 25,00

Eso convierte al insignia de DeepSeek en cerca de 11,5 veces mas barato que GPT-5.5 en pricing standard de input. La brecha es mucho mas amplia en output, donde DeepSeek V4 Pro queda alrededor de 34,5 veces mas barato. Contra el pricing de contexto largo de GPT-5.5 (sobre 272.000 tokens), DeepSeek V4 Pro es aproximadamente 23 veces mas barato en input y 51,7 veces mas barato en output. DeepSeek V4 Flash es todavia mas economico.

Ambos modelos de DeepSeek ofrecen una ventana de contexto de un millon de tokens y hasta 384.000 tokens de output. Tambien soportan los formatos de API de OpenAI y de Anthropic, lo que facilita el switch para desarrolladores que migran desde esas plataformas.

¿El precio por token cuenta toda la historia?

El precio crudo por token es solo parte del cuadro. El consumo de tokens por tarea importa tanto como la tarifa. Funciona como el precio de la bencina: una tarifa baja por galon no ayuda si el motor consume mucho mas. Un buen ejemplo es el Gemini Flash 3.5 de Google. En el papel es mas barato y rinde parecido al Pro 3.1 anterior, pero quema bastante mas tokens, lo que potencialmente lo hace mas caro en practica. El Opus 4.7 de Anthropic tambien luce mas barato que GPT-5.5 en papel, pero usa mas tokens que su predecesor. GPT-5.5 en cambio consume menos tokens que GPT-5.4. Aun asi, ambos modelos terminaron entre 30 y 90 por ciento mas caros en uso real que los modelos a los que reemplazaron.

DeepSeek V4 va claramente por detras de los modelos frontera GPT-5.5 y Opus 4.7 en rendimiento crudo. Cuanto exactamente depende de la tarea, y los benchmarks solo cuentan media historia: el uso real es el que decide. Pero el gap de precio es enorme, especialmente para sistemas de IA agentica que mastican muchos mas tokens que un chatbot estandar.

¿Por que el factor precio gana peso justo ahora?

A medida que el uso de IA crece, las empresas se vuelven mas sensibles al precio. Mientras el ROI del gasto en IA siga siendo dificil de medir, muchas firmas pueden cambiar de estrategia: dejar de buscar el mejor modelo y apuntar al mas barato que sea suficientemente bueno.

DeepSeek entra a su primera ronda de financiamiento, pero esta lejos de la presion de ingresos que enfrentan OpenAI y Anthropic, ambas en camino a un IPO. Esa asimetria de obligaciones financieras es la que le permite a la empresa china sostener una guerra de precios sin necesidad de cuadrar caja en el corto plazo.

Para integradores LatAm que estan construyendo agentes con consumo de millones de tokens diarios, el calculo se vuelve concreto: un mismo flujo de trabajo que cuesta USD 300 al dia con GPT-5.5 baja a cifras de un solo digito con DeepSeek V4 Pro, si el rendimiento alcanza para la tarea.

DeepSeek deja permanente el 75% de descuento: hasta 51x mas barato

Al grano

Por qué importa

¿El precio por token cuenta toda la historia?

¿Por que el factor precio gana peso justo ahora?

Seguir leyendo

Los laboratorios de modelos se transforman en laboratorios de agentes IA

Gemini 3.5 Flash sube 6x el precio vs 3.1 Flash-Lite

Anthropic ya vale USD 1-1,2 billones tras crecer 10x al año

Anthropic lanza Claude Opus 4.7: un salto superior en cada dimensión

→Al grano

✦Por qué importa

¿El precio por token cuenta toda la historia?

¿Por que el factor precio gana peso justo ahora?

Seguir leyendo

Los laboratorios de modelos se transforman en laboratorios de agentes IA

Gemini 3.5 Flash sube 6x el precio vs 3.1 Flash-Lite

Anthropic ya vale USD 1-1,2 billones tras crecer 10x al año

Anthropic lanza Claude Opus 4.7: un salto superior en cada dimensión

Al grano

Por qué importa