
IA
ByteDance: preguntar a un LMM enseña mejor que transcribir
MMProLong, un modelo de 7B parámetros, supera a InternVL3-38B y Gemma3-27B en documentos de hasta 512.000 tokens entrenándose con pares pregunta-respuesta en vez de OCR puro.
The Decoder
1 nota publicada
Otros temas que aparecen junto a #long context en nuestra cobertura editorial.