
NVIDIA Cosmos 3: el omni-modelo abierto para IA física
Cosmos 3 unifica generación de mundos, razonamiento físico y predicción de acciones en una sola arquitectura MoT. Versiones Nano (16B) y Super (64B) liberadas hoy en Hugging Face.
9 notas publicadas
Hugging Face abre una serie de tres partes sobre profiling con PyTorch, empezando por matmul más bias en bf16 sobre una NVIDIA A100 80GB.
Hugging Face liberó un PR en TRL que codifica solo los pesos que cambiaron como safetensors disperso y los sube a un Hub Bucket. El trainer y el rollout dejan de necesitar el mismo data center.
Hugging Face publicó el stack speech-to-speech cascade con Silero, Parakeet-TDT, Qwen3-TTS y llama.cpp para correr el robot sin enviar audio a la nube.

Modelos abiertos como Cosmos, GR00T y RynnBrain empujan a la robótica al mismo punto de inflexión que ya vivió el resto de la IA.

Cualquier persona describe el comportamiento del robot en lenguaje natural y un agente de IA escribe, prueba y despliega el código completo, sin SDK ni experiencia previa.

El modelo de reconocimiento de voz NeMo Canary-Qwen-2.5B alcanza estado del arte en inglés con 46x sobre tiempo real, y libera pesos en Hugging Face bajo la licencia abierta de NVIDIA.

Con actuadores Damiao, soporte para LeRobot de Hugging Face y diseño modular, este brazo de 6 ejes busca reducir las barreras en investigación de robótica.

Las herramientas de IA autónoma amenazan el modelo de negocios de la industria tecnológica india, obligando a reentrenar a miles de nuevos empleados.
Otros temas que aparecen junto a #hugging face en nuestra cobertura editorial.