Saltar al contenido
Etiqueta

#tensorrt llm

1 nota publicada

MiniMax M3: MoE de 428B con 1M de contexto en Blackwell
IA

MiniMax M3: MoE de 428B con 1M de contexto en Blackwell

Sirve contextos de 1 millón de tokens con costo por token 20 veces menor que M2, y se despliega en NVIDIA Dynamo, TensorRT-LLM, SGLang y vLLM con pesos abiertos en Hugging Face.

NVIDIA Developer

Etiquetas relacionadas

Otros temas que aparecen junto a #tensorrt llm en nuestra cobertura editorial.