Mientras los precios de componentes se disparan por la demanda del sector IA, el costo de los sistemas de inferencia y entrenamiento aumenta a la par. Un análisis de Morgan Stanley Research estima que un rack VR200 NVL72 de próxima generación basado en Vera Rubin costará a los hiperescaladores aproximadamente USD 7,8 millones por unidad, según un informe difundido por el analista Aaron Wei y reportado por Tom's Hardware.

La cifra es tangiblemente más alta que los USD 4 millones por GB300 NVL72 de la generación actual y el dato más revelador del análisis es que cada VR200 carga tanta DRAM y NAND que la memoria pasa a representar aproximadamente el 25% del costo total del sistema.

¿Cuánto cuesta cada Rubin GPU?

Nvidia planea cobrar precios de mayoreo a los clientes hiperescala que adquieran chips dentro de chasis VR200 NVL72:

  • USD 55.000 por Rubin GPU (72 unidades por rack)
  • USD 5.000 por Vera CPU (36 unidades por rack)

Aunque los racks VR200 NVL72 usan el chasis Oberon ya familiar de la generación previa, incorporan componentes más sofisticados de switching, networking, PCB, refrigeración, fuentes de poder y empaquetado de chips. Eso incrementa el costo total del bill-of-material (BOM) y por extensión el precio final del sistema.

El análisis de Morgan Stanley sitúa el VR200 NVL72 en USD 7,8 millones, más alto que los USD 7 millones que una fuente del medio reportó en marzo pasado. La diferencia se explica casi totalmente por el aumento en el costo de memoria.

¿Por qué la memoria explota al 25% del costo?

El costo de memoria dentro de cada rack VR200 NVL72 alcanza aproximadamente USD 2 millones, un alza del 485% versus el costo de memoria en GB300 NVL72. Hay tres razones concretas que explican este salto.

Razón 1: LPDDR5X se triplica en capacidad por rack

Cada rack VR200 NVL72 contiene 54 TB de LPDDR5X, frente a los 17 TB del GB200 NVL72. Un aumento de tres veces en la capacidad por rack.

SemiAnalysis estima que Nvidia pagó USD 8 por GB de LPDDR5X en el Q1, aunque ese precio probablemente sube en los próximos trimestres a medida que la demanda se expande. Eso ya cambia el balance:

SistemaMemoria LPDDR5XCosto a USD 8/GBA USD 10/GB
GB200 NVL7217 TBUSD 136.000USD 170.000
VR200 NVL7254 TBUSD 408.000USD 540.000

Y vale notar que USD 10 por GB puede subestimar el precio real, ya que Nvidia agrega su propio markup cuando los módulos llegan en formato SOCAMM2, que es el que usa exclusivamente con sus Vera CPU.

Razón 2: 3D NAND llega por primera vez al rack

Cada VR200 NVL72 carga aproximadamente USD 1 millón o más en almacenamiento 3D NAND. Eso es prácticamente cero en el GB200 NVL72, que no incorporaba NAND on-rack significativa. Es una decisión arquitectónica nueva: Nvidia está integrando storage caliente directamente al rack para reducir los hops a almacenamiento externo durante cargas de inferencia.

Razón 3: HBM4 sobre las GPU Rubin

Sumado a los anteriores, las GPU Rubin del propio rack incorporan memoria HBM4 que también es más cara que el HBM3E de la generación anterior, aunque Morgan Stanley no desglosa explícitamente el costo de HBM en su modelo.

Sumando LPDDR5X, 3D NAND y HBM4, los USD 2 millones de memoria por rack son consistentes: el sistema usa muchísima LPDDR5X y storage NAND, en momentos en que la memoria se vende a precios récord.

¿Qué pasa con el spot de DRAM y LPDDR5X?

Los precios actuales en el mercado spot ya están dando señales:

  • Precio contrato de DDR5: entre USD 12 y USD 16 por GB, según Framework, dependiendo de factores y suerte.
  • Precio spot DDR5: aproximadamente USD 20 por GB en promedio, según DRAMeXchange.
  • LPDDR5X: más caro que DDR5 base, y aún más caro cuando va montado en módulos SOCAMM2 con el markup de Nvidia agregado.

Para integradores y operadores LatAm que arman racks white-box con servidores AMD EPYC o Intel Xeon, la lectura es directa: cualquier proyecto de inferencia local que requiera DRAM densa va a sufrir el mismo bandazo de precios que sufren los hiperescaladores. Solo que sin las cuotas preferentes que tienen Nvidia, Microsoft o Google con sus proveedores de memoria.

¿Qué dice el análisis sobre los volúmenes?

Morgan Stanley no proyectó cuántos racks VR200 NVL72 envasaría Nvidia en 2026, pero el dato más útil para inversores es que el costo aumentó casi 2× generación-tras-generación (de USD 4M a USD 7,8M). Si Nvidia mantiene sus márgenes brutos del 70-75% históricos en datacenter, eso implica que el precio de catálogo por rack se mueve a la franja de USD 12-15 millones por unidad.

A ese precio, los compromisos de despliegue anunciados, como las decenas de miles de millones de capex de Meta y Microsoft para 2026, traducen a volúmenes finitos: cientos a pocos miles de racks por hiperescalador, no decenas de miles. El cuello de botella real, igual que con las generaciones anteriores, sigue siendo la asignación CoWoS de TSMC.