Meta FAIR presentó Brain2Qwerty v2, un modelo que reconstruye oraciones completas a partir de señales cerebrales captadas sin cirugía, y bajó la tasa promedio de error por palabra al 39%. Es un salto grande respecto de la versión anterior, aunque los implantes invasivos siguen siendo mucho más precisos (menos del 2% de error).

Para quienes pierden el habla o la movilidad tras un daño cerebral, los implantes actuales resuelven el problema pero exigen cirugía riesgosa. La división de IA de Meta trabaja hace años en una alternativa externa y esta segunda versión marca un avance concreto en calidad y practicidad.

¿Cómo funciona Brain2Qwerty v2?

Los investigadores registraron actividad cerebral de nueve voluntarios sanos con magnetoencefalografía (MEG), una técnica que mide los campos magnéticos alrededor del cráneo. Cada persona grabó 10 horas y, en conjunto, tiparon 22.000 oraciones.

El experimento fue así: los participantes escucharon una oración, hicieron una pausa breve y luego la escribieron en un teclado sin ver el texto en la pantalla. El modelo reconstruye la oración a partir de las señales cerebrales capturadas durante ese tipeo. Según el paper, la actividad medible proviene mayormente de la corteza motora, que controla los movimientos de los dedos.

Diez veces más datos y adiós al tiempo de tecleo

La versión 1 necesitaba la marca de tiempo exacta de cada tecla para alinear la señal. La v2 trabaja con una ventana continua y asigna caracteres por sí sola, sin esa información temporal. Ese enfoque asíncrono elimina una barrera clave para el uso en tiempo real, aunque aún no se cruzó ese umbral. La tarea más difícil funciona, dicen los autores, porque el nuevo dataset tiene diez veces más grabaciones por persona y oraciones más variadas.

El modelo apila tres bloques de aprendizaje profundo. Reemplazó los pasos de reconocimiento hechos a mano por redes que procesan la señal en tres niveles: caracteres, palabras y oraciones completas. Para el nivel de oración, se afinó un modelo de lenguaje (Qwen3) que da forma coherente a las señales ruidosas del cerebro.

Con ese esquema, Brain2Qwerty v2 llega a un error por palabra promedio del 39%, frente al 55% del encoder crudo sin modelo de lenguaje. Para el mejor participante, el 28% de las oraciones se decodifica perfectamente y el 47% tiene como máximo una palabra equivocada.

Mejores palabras, más errores de carácter

El equipo comparó Brain2Qwerty v2 contra dos métodos más simples. Uno es el encoder crudo, que lee caracteres directamente de la señal cerebral. El otro es la aproximación de v1, donde un modelo N-gram corrige la salida del encoder usando la probabilidad estadística de secuencias de letras.

Los resultados se miden en tres niveles. La tasa de error por carácter (CER), la de palabra (WER) y una tasa de error semántica que mide cuánto se aleja el significado del original.

En palabras y significado gana la v2. El WER cae a 39%, contra 55% del encoder crudo y 43% del N-gram de v1. Pero en el nivel de carácter la foto se invierte: la v2 tiene 31% de errores, peor que el encoder crudo (28%) y que el N-gram (26%). El motivo es el propio modelo de lenguaje: está entrenado para producir oraciones fluidas incluso cuando la señal cerebral no las respalda. Ante la duda, inventa una oración gramaticalmente limpia pero completamente equivocada.

Para el peor participante, el sistema decodificó "had she not fallen down the stairs" en lugar de "cars are not allowed on this road": cero superposición semántica pero prosa impecable. Como la comunicación exitosa depende del significado y no de coincidir letra por letra, el equipo considera que la mejora en WER y en semántica es el avance relevante. Como referencia, un estudio anterior basado en fMRI llegaba al 92-94% de error por palabra.

¿Y si la IA optimiza su propia investigación?

El trabajo trae un componente auto-investigativo llamativo. Tres agentes independientes basados en Claude Opus 4.6 recibieron la tarea de bajar el error por su cuenta modificando el código y corriendo experimentos. Encontraron técnicas como label smoothing, modality dropout y prompts más cortos que se sostuvieron en todos los participantes, superando por margen claro a un método de optimización estándar.

Pero cuando se les dio una tarea sin restricciones, los mismos agentes fallaron. Sus cambios de código extensos rompieron la mayoría de las corridas de cómputo. Por ahora la investigación humana sigue siendo pieza crítica, concluye el equipo.

Del laboratorio a la clínica

La brecha con los sistemas implantados sigue siendo grande. Las interfaces invasivas alcanzan menos del 2% de error por palabra al tipear. Pero la precisión de Brain2Qwerty v2 sigue subiendo con más datos y no se ve techo, por lo que los autores ven en la recolección de más grabaciones una palanca directa.

Aún así, quedan preguntas abiertas. Hay diferencias significativas entre participantes, el estudio se limita a voluntarios sanos con movimientos reales de tecleo y falta capacidad de tiempo real. Como camino a uso clínico, el equipo apunta a sensores MEG portátiles que funcionan a temperatura ambiente. Los tests mostraron que incluso con la mitad de los sensores el desempeño se mantiene casi intacto.

Una ventana al cerebro, no solo una herramienta médica

El trabajo se apoya en una línea de investigación más larga en FAIR liderada por el neurocientífico Jean-Rémi King. Su equipo ya había decodificado habla percibida desde datos MEG y EEG en 2022 y había generado imágenes desde actividad cerebral en 2023. Más reciente aún es TRIBE v2, un modelo que predice actividad cerebral en lugar de medirla. Brain2Qwerty v1, que reconstruía oraciones con hasta 80% de precisión a nivel de carácter y llegaba a 29% de CER con MEG y 65% con EEG en 35 participantes, ya fue publicado en Nature Neuroscience.

Para King, los modelos que traducen actividad cerebral a texto no son solo herramientas médicas: son una ventana al propio funcionamiento del cerebro.