Tether lança IA médica local que supera Google em testes
A Tether anunciou avanços relevantes em inteligência artificial aplicada à saúde com os modelos QVAC MedPsy-1.7B e MedPsy-4B. Desenvolvidos pelo grupo de pesquisa da empresa, os sistemas foram projetados para operar diretamente em dispositivos de baixo consumo, como smartphones e wearables. Dessa forma, eliminam a necessidade de processamento em nuvem e reforçam a privacidade dos dados clínicos.
Segundo a empresa, os modelos não apenas funcionam localmente, como também superam soluções maiores do mercado em testes de desempenho, incluindo sistemas do Google. Além disso, a proposta combina raciocínio médico avançado com eficiência operacional. Assim, reduz a dependência de infraestrutura externa e amplia o acesso a ferramentas clínicas inteligentes.
Eficiência redefine a IA médica
Em primeiro lugar, a Tether adotou uma abordagem distinta das soluções tradicionais, que dependem de grandes modelos hospedados em servidores remotos. Ao passo que concorrentes ampliam o tamanho dos sistemas, a empresa priorizou eficiência computacional. Isso ocorre porque dados sensíveis, como prontuários e diagnósticos, exigem proteção rigorosa.
Atualmente, muitos sistemas de IA enviam essas informações para a nuvem, o que pode gerar riscos de privacidade e desafios regulatórios. Nesse sentido, a execução local surge como alternativa mais segura. Além disso, o mercado de IA em saúde deve crescer de cerca de US$ 36 bilhões para mais de US$ 500 bilhões até 2033, reforçando a necessidade de soluções eficientes e escaláveis.
O CEO da Tether, Paolo Ardoino, destacou o foco na otimização dos modelos. “Com o QVAC MedPsy, nosso foco foi melhorar a eficiência no nível do modelo, em vez de simplesmente aumentar seu tamanho”, afirmou. Dessa maneira, a empresa desafia a lógica dominante do setor.
Desempenho superior com menos parâmetros
O modelo mais leve, com 1,7 bilhão de parâmetros, foi projetado para rodar diretamente em smartphones. Ainda assim, alcançou pontuação de 62,62 em sete benchmarks médicos padrão. Esse resultado supera o modelo MedGemma-1.5-4B-it, do Google, por mais de 11 pontos.
Além disso, apresentou desempenho superior ao MedGemma 27B em tarefas clínicas reais, como o HealthBench Hard. Em outras palavras, mesmo sendo significativamente menor, entrega resultados mais consistentes em cenários práticos.
Já o modelo de 4 bilhões de parâmetros atingiu 70,54 nos mesmos testes. Com isso, também ultrapassou o MedGemma-27B, que possui quase sete vezes mais parâmetros. Ademais, demonstrou forte desempenho em avaliações como HealthBench, HealthBench Hard e MedXpertQA.
Os resultados abrangem oito conjuntos de testes, incluindo MedQA, MedMCQA, MMLU Health, PubMedQA e AfriMedQA. O treinamento utilizou dados clínicos selecionados, supervisão estruturada e aprendizado por reforço. Dessa forma, os modelos combinam precisão técnica com eficiência prática. Para quem acompanha avanços em inteligência artificial, o movimento indica uma mudança relevante no desenvolvimento de soluções médicas.
Menor consumo e maior velocidade
Outro destaque está na eficiência operacional. Os modelos produzem respostas mais curtas, porém completas, o que reduz o tempo de processamento e o consumo de bateria. Consequentemente, melhora a experiência em dispositivos móveis.
O modelo de 4 bilhões gera respostas com cerca de 909 tokens, enquanto sistemas comparáveis chegam a aproximadamente 2.953 tokens. Isso representa uma redução superior a três vezes. Do mesmo modo, o modelo menor apresenta média de 1.110 tokens, contra 1.901 de concorrentes diretos.
Essa otimização permite menor latência e menor custo computacional. Portanto, viabiliza o uso em dispositivos comuns sem necessidade de conexão constante com servidores externos.
“Essa combinação reduz diretamente os requisitos de computação, latência e custo. Permite que o modelo rode localmente em hardware padrão, sem depender de infraestrutura remota”, explicou Ardoino.
Privacidade como diferencial estratégico
A execução local representa uma mudança estrutural para o setor de saúde. Em vez de transferir dados sensíveis para a nuvem, hospitais e profissionais podem processar informações no próprio ambiente onde os dados já estão armazenados. Assim, reduzem riscos de vazamento e aumentam a conformidade regulatória.
Além disso, o acesso a análises clínicas se torna mais rápido e confiável. Em contrapartida, soluções baseadas em nuvem dependem de conectividade e infraestrutura robusta, o que pode limitar sua aplicação em regiões com menos recursos.
A Tether também divulgou os modelos sob licença aberta na plataforma Hugging Face. Os arquivos foram lançados no formato quantizado GGUF, com versões compactadas de aproximadamente 1,2 GB e 2,6 GB, facilitando a instalação em dispositivos móveis sem perda significativa de qualidade.
Em conclusão, os dados indicam que os modelos da Tether combinam desempenho competitivo com execução local. Além disso, superam sistemas maiores em benchmarks médicos e reduzem significativamente o consumo de recursos. Como resultado, apontam para uma nova direção na inteligência artificial aplicada à saúde, com foco em eficiência, privacidade e acessibilidade.