
IA
NVIDIA Model Optimizer: cómo cuantizar CLIP en FP8
Receta paso a paso de post-training quantization con ModelOpt que lleva CLIP-ViT-L-14 de FP16 a FP8 sin perder calidad en clasificación zero-shot ni retrieval.
NVIDIA Developer
2 notas publicadas
Otros temas que aparecen junto a #fp8 en nuestra cobertura editorial.