Etiqueta

#modelopt

1 nota publicada

Cuantización FP8: Optimiza modelos con NVIDIA TensorRT

Aprende a exportar modelos cuantizados mediante ModelOpt a ONNX y compílalos con TensorRT para maximizar el throughput y reducir el uso de VRAM en GPUs NVIDIA.

NVIDIA Developer10 jun

Etiquetas relacionadas

Otros temas que aparecen junto a #modelopt en nuestra cobertura editorial.

#nvidia-tensorrt1 #Ia Local1 #cuantizacion1 #Edge Computing1 #deep-learning1