
IA
Microsoft Lens demuestra que captions detallados importan más que escala
El modelo text-to-image de 3.800 millones de parámetros iguala a rivales 20 veces más grandes. La clave: 800 millones de captions de 100 palabras generados por GPT-4.1.
The Decoder