Mission, Vision y Veritas son los nombres de los nuevos supercomputadores del Laboratorio Nacional Los Alamos (LANL) que se construirán con HPE y NVIDIA, aprovechando NVIDIA Vera CPUs para acelerar el descubrimiento científico y desbloquear la IA agéntica para la ciencia.

Los supercomputadores usarán la arquitectura HPE Cray Supercomputing GX5000 con la plataforma NVIDIA Vera Rubin, combinando CPUs NVIDIA Vera, GPUs NVIDIA Rubin y red NVIDIA Quantum-X800 InfiniBand.

Bajo la configuración planificada, Mission incluirá nodos GPU NVIDIA Vera Rubin y 2.300 CPUs NVIDIA Vera standalone usando el blade HPE Cray Supercomputing GX240. Veritas contará con aproximadamente 1.150 CPUs NVIDIA Vera standalone para complementar los nodos NVIDIA Vera Rubin.

Veritas llegará junto a Mission y Vision, sirviendo al programa Laboratory Directed Research and Development y ayudando a acelerar la IA agéntica para la ciencia. El sistema probará estas tecnologías para uso en sistemas más grandes que se están construyendo en LANL.

¿Qué hace agéntica a la nueva infraestructura?

Los investigadores están sumando una herramienta nueva para la ciencia: agentes de IA que pueden formar hipótesis, elegir herramientas, lanzar simulaciones, analizar resultados y refinar el siguiente paso. El trabajo público de LANL sobre URSA, el Universal Research and Scientific Agent, que corre en Venado y pronto en Mission y Vision, apunta en esa dirección: un framework de IA modular y dirigido por retroalimentación, diseñado para ayudar a los científicos a generar hipótesis, planificar experimentos, ejecutar simulaciones y analizar resultados.

LANL demostró que la CPU Vera entregó 7x más rendimiento en cargas URSA que las CPUs del supercomputador x86 Crossroads.

¿Qué rendimiento muestra Vera CPU para simulación?

En pruebas tempranas de NVIDIA Vera CPU sobre Branson, una herramienta open source de simulación de transferencia de calor por Monte Carlo, Vera supera por más de 3x a las CPUs usadas en el supercomputador x86 Crossroads.

Estos resultados fueron posibles gracias a Vera, incluyendo su núcleo personalizado Olympus, memoria LPDDR5 y rápido fabric on-chip.

Una sola CPU Vera supera por más de 3x a una sola CPU x86 mientras entrega más de 4x la memoria por core y 6x la memoria por nodo. En última instancia, esto significa resultados científicos más rápidos para LANL.

Todos los supercomputadores del laboratorio fueron codiseñados por arquitectos de hardware, desarrolladores de software de sistemas, científicos de dominio, científicos computacionales y matemáticos aplicados, ayudando a asegurar que los sistemas estén formados por cargas de trabajo científicas reales, no solo por benchmarks abstractos.

Continuidad con generaciones anteriores de LANL

Mission, esperado operativo en 2027, será el quinto Advanced Technology System dentro del programa Advanced Simulation and Computing de la National Nuclear Security Administration y reemplazará a Crossroads para cargas clasificadas de seguridad nacional.

Vision, también esperado operativo en 2027, servirá como recurso para ciencia fundamental, incluyendo materiales y ciencia nuclear, modelado de energía, investigación biomédica e IA. Esto permitirá que más científicos prueben métodos, entrenen modelos y exploren ideas antes de moverse a trabajos de mayores consecuencias.

El trabajo extiende más de una década de colaboración profunda entre LANL y NVIDIA en CPUs, desde Grace hasta Vera, usando codiseño extremo para las cargas de simulación de LANL.

Los tres nuevos supercomputadores se construyen sobre Venado, el supercomputador HPE Cray EX instalado en Los Alamos en 2024 con Superchips NVIDIA GH200 Grace Hopper y NVIDIA Grace CPU.