Saltar al contenido
Etiqueta

#speculative decoding

1 nota publicada

DFlash: hasta 15x más inferencia LLM en NVIDIA Blackwell
IA

DFlash: hasta 15x más inferencia LLM en NVIDIA Blackwell

El método de speculative decoding por bloques desplaza a EAGLE-3 y libera 20 checkpoints abiertos en Hugging Face para Hopper y Blackwell.

NVIDIA Developer

Etiquetas relacionadas

Otros temas que aparecen junto a #speculative decoding en nuestra cobertura editorial.