
IA
MiniMax M3: MoE de 428B con 1M de contexto en Blackwell
Sirve contextos de 1 millón de tokens con costo por token 20 veces menor que M2, y se despliega en NVIDIA Dynamo, TensorRT-LLM, SGLang y vLLM con pesos abiertos en Hugging Face.
NVIDIA Developer