
Blackwell HGX B200 marca récord STAC-AI en finanzas
El benchmark STAC-AI LANG6 con Llama 3.1 8B y 70B muestra hasta 2,8x más rendimiento por GPU frente a Hopper en cargas de inferencia con documentos EDGAR.
6 notas publicadas

La nueva GPU Server Edition acelera Parabricks, Minimap2, fq2bam y DeepVariant; con cuEquivariance y Openfold3 también gana 2,3x sobre la L4 al inferir estructuras de proteínas.

El kernel Triton desarrollado por Meta para GPUs Blackwell aprovecha el patrón block-diagonal de los modelos de ranking para eliminar pasos enteros del algoritmo y acelerar 2,50x el backward pass.

El nuevo plugin topology/block de Slurm trata cada dominio NVLink coherente del rack como una unidad rígida, evitando que un job atraviese fronteras y pierda el ancho de banda de 1,8 TB/s por GPU.

Una Cluster Acceleration Structure reduce el costo de la BVH en ray tracing sobre geometría densa, y los RT Cores Blackwell duplican la tasa de intersección rayo-triángulo.

La alianza presenta infraestructura Vera Rubin, GPUs Blackwell y nuevas herramientas para escalar gemelos digitales y agentes autónomos en la nube.
Otros temas que aparecen junto a #blackwell en nuestra cobertura editorial.