Etiqueta

#long context

1 nota publicada

ByteDance: preguntar a un LMM enseña mejor que transcribir

MMProLong, un modelo de 7B parámetros, supera a InternVL3-38B y Gemma3-27B en documentos de hasta 512.000 tokens entrenándose con pares pregunta-respuesta en vez de OCR puro.

The Decoderayer

Etiquetas relacionadas

Otros temas que aparecen junto a #long context en nuestra cobertura editorial.

#Bytedance1 #LLM1 #multimodal1 #Qwen1