Etiqueta

#helion

1 nota publicada

PyTorch integra Helion en vLLM para acelerar inferencia FP8

La integración con vLLM aceleró normalización, cuantización fusionada y scaled_mm en H100, mientras que B200 sigue limitado por el backend GEMM de Triton sobre Blackwell.

PyTorch Blog12 jun

Etiquetas relacionadas

Otros temas que aparecen junto a #helion en nuestra cobertura editorial.

#pytorch1 #vllm1 #Fp81 #qwen31