Saltar al contenido
Etiqueta

#fp8

2 notas publicadas

NVIDIA Model Optimizer: cómo cuantizar CLIP en FP8
IA

NVIDIA Model Optimizer: cómo cuantizar CLIP en FP8

Receta paso a paso de post-training quantization con ModelOpt que lleva CLIP-ViT-L-14 de FP16 a FP8 sin perder calidad en clasificación zero-shot ni retrieval.

NVIDIA Developer

Etiquetas relacionadas

Otros temas que aparecen junto a #fp8 en nuestra cobertura editorial.