
DiffusionGemma: Google adapta difusión de imágenes al texto
El nuevo modelo MoE de pesos abiertos genera párrafos enteros en paralelo mediante denoising, corre con 18 GB de VRAM y entrega hasta 4× más velocidad que Gemma 4 26B en una sola H100.
6 notas publicadas

El modelo experimental de pesos abiertos genera 256 tokens en paralelo y supera a Gemma 4 en velocidad, aunque pierde calidad en los benchmarks de Google.

Google DeepMind publica un modelo experimental MoE de 26B parámetros bajo Apache 2.0 que genera bloques de 256 tokens en paralelo, alcanzando 1.000 tok/s en una NVIDIA H100.

Un entusiasta de LLMs locales empaquetó un Jetson Orin NX Super 16GB, más de 30 sensores y un avatar de ojos saltones en una maleta para conversar sin WiFi ni red celular.

El último boletín de Interconnects repasa los lanzamientos del mes en pesos abiertos y discute por qué los benchmarks del CAISI muestran una brecha más grande que la real.

Connor Gallic relata cómo gastó un día intentando inyectarle un cuerpo a su agente local antes de tirarlo todo y darle archivos JSON que el propio agente puede leer y reescribir.
Otros temas que aparecen junto a #gemma en nuestra cobertura editorial.