Saltar al contenido
Etiqueta

#modelopt

1 nota publicada

Cuantización FP8: Optimiza modelos con NVIDIA TensorRT
IA

Cuantización FP8: Optimiza modelos con NVIDIA TensorRT

Aprende a exportar modelos cuantizados mediante ModelOpt a ONNX y compílalos con TensorRT para maximizar el throughput y reducir el uso de VRAM en GPUs NVIDIA.

NVIDIA Developer

Etiquetas relacionadas

Otros temas que aparecen junto a #modelopt en nuestra cobertura editorial.