
IA
Sakana AI y NVIDIA aceleran 20% la inferencia de LLMs con TwELL
Un kernel CUDA llamado TwELL aprovecha la sparsity de activaciones para acelerar inferencia 20,5% y entrenamiento 21,9% en GPUs H100, sin perder precisión en benchmarks.
MarkTechPost
1 nota publicada
Otros temas que aparecen junto a #sakana ai en nuestra cobertura editorial.