
IA
TokenSpeed alcanza 580 tps con Qwen3.5-397B-A17B en GPU
El motor open source de LightSeek, escrito desde cero en SPMD con compilacion estatica, ataca workloads agenticos con prefix cache hibrido y disaggregacion prefill-decode para Mamba.
PyTorch Blog