Meta revela modelos de IA que convertem atividade cerebral em texto com precisão incomparável

Trabalhando com pesquisadores internacionais, a Meta anunciou marcos importantes na compreensão da inteligência humana por meio de dois estudos revolucionários: eles criaram modelos de IA capazes de ler e interpretar sinais cerebrais para reconstruir sentenças digitadas e mapear os processos neurais precisos que transformam pensamentos em palavras faladas ou escritas.
O primeiro dos estudos, realizado pelo laboratório Fundamental Artificial Intelligence Research (FAIR) da Meta em Paris, em colaboração com o Basque Center on Cognition, Brain and Language em San Sebastian, Espanha, demonstra a capacidade de decodificar a produção de sentenças a partir de gravações cerebrais não invasivas. Utilizando magnetoencefalografia (MEG) e eletroencefalografia (EEG), os pesquisadores registraram a atividade cerebral de 35 voluntários saudáveis enquanto digitavam sentenças.
O sistema utiliza uma arquitetura de três partes: um codificador de imagens, um codificador cerebral e um decodificador de imagens. O codificador de imagens cria um conjunto rico de representações independentes do cérebro. O codificador cerebral aprende a alinhar os sinais de MEG a essas representações. Por fim, o decodificador de imagens gera uma imagem plausível com base nas representações cerebrais.

Os resultados são impressionantes: o modelo de IA pode decodificar até 80% dos caracteres digitados por participantes cujas atividades cerebrais foram registradas com MEG, sendo pelo menos duas vezes mais eficaz do que os sistemas tradicionais de EEG. Essa pesquisa abre novas possibilidades para interfaces cérebro-computador não invasivas, que poderiam ajudar a restaurar a comunicação para indivíduos que perderam a capacidade de falar.
O segundo estudo se concentra em entender como o cérebro transforma pensamentos em linguagem. Utilizando IA para interpretar os sinais de MEG enquanto os participantes digitavam sentenças, os pesquisadores conseguiram identificar os momentos precisos em que os pensamentos são convertidos em palavras, sílabas e letras individuais.
A pesquisa revela que o cérebro gera uma sequência de representações, começando pelo nível mais abstrato (o significado de uma sentença) e transformando-as progressivamente em ações específicas, como os movimentos dos dedos no teclado. O estudo também demonstra que o cérebro utiliza um “código neural dinâmico” para encadear representações sucessivas enquanto mantém cada uma delas por períodos prolongados.
Embora a tecnologia seja promissora, ainda existem desafios antes de sua aplicação em ambientes clínicos. O desempenho de decodificação ainda é imperfeito, e o MEG exige que os sujeitos estejam em uma sala com blindagem magnética e permaneçam imóveis. O próprio scanner de MEG é grande, caro e precisa operar em uma sala blindada, pois o campo magnético da Terra é um trilhão de vezes mais forte que o do cérebro.
A Meta planeja abordar essas limitações em pesquisas futuras, melhorando a precisão e confiabilidade do processo de decodificação, explorando técnicas alternativas de imagem cerebral não invasivas mais práticas para o uso diário e desenvolvendo modelos de IA mais sofisticados que possam interpretar melhor sinais cerebrais complexos. A empresa também pretende expandir suas pesquisas para incluir uma gama mais ampla de processos cognitivos e explorar aplicações potenciais em áreas como saúde, educação e interação humano-computador.
Embora mais pesquisas sejam necessárias antes que esses avanços possam ajudar pessoas com lesões cerebrais, eles nos aproximam de construir sistemas de IA que possam aprender e raciocinar de forma mais semelhante aos humanos.