
IA
DFlash: hasta 15x más inferencia LLM en NVIDIA Blackwell
El método de speculative decoding por bloques desplaza a EAGLE-3 y libera 20 checkpoints abiertos en Hugging Face para Hopper y Blackwell.
NVIDIA Developer
1 nota publicada
Otros temas que aparecen junto a #speculative decoding en nuestra cobertura editorial.