El giro hacia la IA agéntica genera un nuevo requerimiento de CPU para la AI factory: cores rápidos, ancho de banda de memoria masivo y la capacidad de sostener alto rendimiento cuando todos los cores están activos.

Los primeros benchmarks publicados hoy por Phoronix muestran que el CPU NVIDIA Vera cumple con ese requerimiento. Para este primer vistazo público, el alcance del benchmark se concentró en las cargas agénticas para las que Vera fue diseñado en el data center moderno.

Vera entrega el throughput que las AI factories necesitan optimizando además la potencia de plataforma. Combina 88 cores NVIDIA Olympus custom, 1,2 TB/s de ancho de banda de memoria y una fabric on-chip de alta velocidad, dando como resultado una plataforma CPU que combina rendimiento por core y ancho de banda de memoria en una envolvente de potencia eficiente.

¿Qué son los cores NVIDIA Olympus?

En el corazón de Vera están los cores CPU NVIDIA Olympus de diseño propio. Totalmente compatibles con la arquitectura de instrucciones Armv9.2, Olympus está pensado para el trabajo CPU secuencial que sustenta la IA agéntica: runtimes con muchas ramificaciones, código en sandbox, procesamiento de datos y orquestación.

El die monolítico de Vera, sus cores anchos, su predicción avanzada de ramas y la segunda generación de Scalable Coherency Fabric de NVIDIA ayudan a que los datos sigan moviéndose por los 88 cores.

El testing de Phoronix sobre un Vera single-socket, con un TDP de 450 vatios y menos de 30 vatios de potencia de memoria, mostró un rendimiento sobresaliente dentro de ese perfil de potencia, junto a ganancias generacionales en un amplio abanico de cargas que incluyen compilación de código, compresión de archivos, transcodificación de video, Python, Java y gestión de bases de datos.

Son exactamente el tipo de tareas CPU-pesadas que los agentes y las AI factories ejecutan a diario: compilar código, correr runtimes, comprimir datos, consultar bases de datos y coordinar stacks de software grandes.

"Entrando a esto, realmente no sabía qué esperar del NVIDIA Vera con los nuevos cores Olympus", escribió Michael Larabel, fundador y autor principal de Phoronix. "Pero al final quedé con la sensación de que esta es la competencia más formidable que han tenido los procesadores Intel y AMD x86_64".

La ventaja "increíble" en memoria

Las cargas agénticas no están limitadas únicamente por cantidad de cores. Necesitan alta utilización de cores y ancho de banda de memoria sostenido, lo que hace que el rendimiento de memoria por vatio sea crítico para la eficiencia global del CPU.

Vera incorpora un subsistema de memoria LPDDR5X de segunda generación, lo que reduce drásticamente la energía por bit en comparación con DDR5. Esto le permite ofrecer hasta 1,2 TB/s de ancho de banda, el doble del peak de los CPUs tradicionales, con menos de 30 vatios de potencia de memoria, frente a los más de 100 vatios del DDR5 tradicional.

En el test STREAM TRIAD de Phoronix, Vera sostuvo el 90% de su ancho de banda peak, el porcentaje más alto del rated peak en cualquier CPU testeado por Phoronix, y entregó más de 4x el ancho de banda por core comparado con CPUs x86 tradicionales.

"NVIDIA Vera con su memoria LPDDR5X mostraba su increíble ventaja en performance de memoria frente a los actuales Intel Xeon y AMD EPYC", escribió Larabel.

El peak no es toda la historia. Las cargas de AI factory corren muchas sandboxes, llamadas a herramientas y servicios de datos en paralelo. En testing separado, Prime Intellect encontró que Vera mantenía alto ancho de banda y latencia de memoria baja y consistente a medida que más cargas corrían en paralelo, el tipo de rendimiento predecible que la IA agéntica necesita.

¿Cuánto sube respecto a Grace y cómo se compara con x86?

Comparado con la generación previa NVIDIA Grace, Vera entregó un aumento de 1,6x en media geométrica en los tests de Phoronix, una ganancia generación-sobre-generación notable.

"La diferencia de Grace a Vera consistentemente superó mis expectativas para el rendimiento gen-on-gen que típicamente vemos en procesadores", escribió Larabel. "El CPU Vera de NVIDIA con sus cores Olympus diseñados en casa termina pegando con una contundencia y competitividad frente a CPUs Intel/AMD x86_64 que nunca había visto en ningún otro procesador ARM o no-x86_64".

Vera lideró el campo de CPUs testeados, entregando una ventaja de rendimiento global de 1,5x comparada con un procesador x86 de última generación de 128 cores. Las ganancias aparecieron en cargas reales de desarrolladores. El single-socket Vera compiló un kernel Linux por defecto en apenas 20 segundos, el resultado más rápido medido por Phoronix en ese test. Vera entregó 2x mayor velocidad de compilación de kernel Linux por core comparado con un procesador de 128 cores.

"En base geométrica, el NVIDIA Vera entregó un 10% mejor rendimiento que el procesador AMD EPYC 9575F de alta frecuencia a 5,0 GHz", escribió Larabel.

¿Cuándo llega y de qué partners?

En NVIDIA GTC, NVIDIA anunció un soporte ecosistémico amplio para Vera, que abarca AI natives, centros de supercomputación, proveedores de servicios cloud y proveedores de infraestructura.

NVIDIA ya entregó los primeros CPUs Vera a empresas líderes en IA y proveedores cloud, un hito relevante de cara a la disponibilidad de partners en el segundo semestre del año.

Vera estará disponible desde los partners en sistemas de doble y un solo socket, con opciones de enfriamiento por aire y líquido para soportar despliegues de AI factory, desde data centers empresariales estándar hasta infraestructura agéntica de alta densidad.

Más información sobre NVIDIA Vera.