
IA
DiffusionGemma: generación de texto 4 veces más rápida
Google DeepMind publica un modelo experimental MoE de 26B parámetros bajo Apache 2.0 que genera bloques de 256 tokens en paralelo, alcanzando 1.000 tok/s en una NVIDIA H100.
Google DeepMind
1 nota publicada
Otros temas que aparecen junto a #diffusiongemma en nuestra cobertura editorial.