Etiqueta

#tensorrt llm

1 nota publicada

MiniMax M3: MoE de 428B con 1M de contexto en Blackwell

Sirve contextos de 1 millón de tokens con costo por token 20 veces menor que M2, y se despliega en NVIDIA Dynamo, TensorRT-LLM, SGLang y vLLM con pesos abiertos en Hugging Face.

NVIDIA Developerhace 2 días

Etiquetas relacionadas

Otros temas que aparecen junto a #tensorrt llm en nuestra cobertura editorial.

#minimax1 #Nvidia1 #LLM1 #Blackwell1 #moe1