Etiqueta

#cuantizacion

3 notas publicadas

Cuantización FP8: Optimiza modelos con NVIDIA TensorRT

Aprende a exportar modelos cuantizados mediante ModelOpt a ONNX y compílalos con TensorRT para maximizar el throughput y reducir el uso de VRAM en GPUs NVIDIA.

NVIDIA Developer10 jun

NVIDIA Model Optimizer: cómo cuantizar CLIP en FP8

Receta paso a paso de post-training quantization con ModelOpt que lleva CLIP-ViT-L-14 de FP16 a FP8 sin perder calidad en clasificación zero-shot ni retrieval.

NVIDIA Developer9 may

Tencent libera IA de 440 MB que traduce 33 idiomas offline

El modelo open-source Hy-MT1.5 corre íntegro en el celular, soporta 1.056 pares de traducción y supera a Google Translate en benchmarks oficiales.

The Decoder4 may

Etiquetas relacionadas

Otros temas que aparecen junto a #cuantizacion en nuestra cobertura editorial.

#tencent1 #traduccion-ia1 #Open Source1 #Edge Ai1 #Nvidia1 #model-optimizer1 #clip1 #Fp81