Saltar al contenido
Etiqueta

#entrenamiento llm

1 nota publicada

FP8 y NVFP4 en Transformers: hasta 3,48x con Blackwell B300
IA

FP8 y NVFP4 en Transformers: hasta 3,48x con Blackwell B300

NVIDIA muestra cómo medir GEMM por GEMM la ganancia real de las precisiones bajas en CodonFM 5B, separando el costo de cuantización del rendimiento puro del kernel.

NVIDIA Developer

Etiquetas relacionadas

Otros temas que aparecen junto a #entrenamiento llm en nuestra cobertura editorial.