0G treina modelo de IA de 107B com China Mobile

A 0G Labs afirmou que concluiu o treinamento descentralizado de um modelo de inteligência artificial com 107 bilhões de parâmetros em parceria com a China Mobile. Segundo a empresa, esse foi o primeiro caso bem-sucedido acima de 100 bilhões de parâmetros nesse formato. O projeto terminou em julho de 2025. Além disso, a metodologia técnica apareceu em um artigo publicado no arXiv em 26 de junho de 2025, sob o código arXiv:2506.21263.

O anúncio ganhou relevância porque modelos desse porte normalmente exigem grande concentração de GPUs avançadas e redes de altíssima velocidade. A 0G Labs, entretanto, seguiu outro caminho. A empresa coordenou clusters descentralizados de GPUs NVIDIA A800, distribuídos geograficamente e conectados por links padrão de 1 Gbps. Assim, o experimento buscou provar que um modelo de larga escala também pode treinar com sincronização menos frequente entre nós.

Arquitetura tenta reduzir o gargalo de comunicação

No método tradicional AllReduce, os nós compartilham atualizações de gradiente de forma constante. Por isso, a arquitetura exige comunicação intensa entre máquinas e redes muito rápidas. A 0G Labs, por outro lado, desenvolveu a arquitetura DiLoCoX para contornar essa limitação. Nesse modelo, os clusters operam com maior autonomia antes da sincronização global.

De acordo com a descrição do trabalho, o framework combina vários recursos técnicos. Em primeiro lugar, ele usa paralelismo em pipeline, que divide o modelo em estágios processados por dispositivos diferentes. Em segundo lugar, aplica uma política de otimizador duplo, com estratégias distintas para etapas locais e globais. Além disso, o sistema usa sobreposição com atraso de um passo. Dessa forma, mantém parte da computação em andamento enquanto a sincronização ocorre em segundo plano. Por fim, a compressão adaptativa de gradientes reduz o volume de dados trocado entre clusters.

A 0G Labs afirma que esse conjunto elevou em 357 vezes a eficiência de comunicação frente a métodos tradicionais baseados em AllReduce, sem comprometer a convergência do modelo. Esse ponto importa porque o maior gargalo do treinamento descentralizado em redes comuns está na quantidade de informação que circula entre participantes.

China Mobile dá escala prática ao experimento

A participação da China Mobile leva o anúncio além de uma demonstração isolada de laboratório. Afinal, a companhia é a maior operadora de rede móvel do mundo e possui infraestrutura distribuída com torres, data centers de borda e backbone de rede em larga escala. Dessa forma, se o treinamento descentralizado de IA funcionar sobre links de banda padrão, empresas de telecomunicações podem hospedar redes distribuídas de treinamento.

Na avaliação do CEO da 0G Labs, Michael Heinrich, o resultado tem implicações diretas para a democratização do treinamento de grandes modelos de linguagem.

“DiLoCoX representa um passo decisivo na democratização do treinamento de LLMs.”

A declaração reforça a tese central da empresa. Em outras palavras, o desenvolvimento de modelos muito grandes poderia deixar de ser exclusividade de grupos com acesso a infraestruturas centralizadas muito caras. Nesse sentido, a proposta dialoga com discussões mais amplas sobre descentralização tecnológica, computação distribuída e infraestrutura digital aberta. Esses temas também atravessam o debate sobre inteligência artificial.

0G tenta desafiar a concentração do treinamento de IA

O experimento confronta a concentração atual do treinamento de inteligência artificial. Hoje, poucos operadores conseguem reunir grandes quantidades de hardware em ambientes altamente integrados. No caso da 0G Labs, clusters de GPUs NVIDIA A800 treinaram um modelo acima de 100 bilhões de parâmetros em locais separados geograficamente. A NVIDIA A800 é uma versão compatível com restrições de exportação da NVIDIA disponível na China. Ainda assim, os clusters operaram por conexões de 1 Gbps.

Em março de 2026, a 0G Labs anunciou planos para repetir publicamente o treinamento do modelo com transparência total. Além disso, a empresa assumiu o compromisso de liberar suas tecnologias em código aberto. Se isso ocorrer como prometido, o ecossistema poderá verificar de forma independente os números divulgados e testar a metodologia em novos ambientes.

Reprodutibilidade será o teste decisivo

Esse ponto é decisivo porque a principal dúvida envolve a reprodutibilidade. Um ganho de 357 vezes em eficiência de comunicação é expressivo. Por isso, o setor precisa de validação externa antes de tratar o resultado como uma mudança estrutural. O artigo no arXiv oferece a base inicial para esse escrutínio técnico. No entanto, a confirmação mais importante dependerá da capacidade de outras equipes reproduzirem o desempenho em condições comparáveis.

Até lá, o anúncio da 0G Labs e da China Mobile se destaca por apresentar uma alternativa concreta ao modelo dominante de treinamento centralizado. Os dados divulgados apontam conclusão em julho de 2025, documentação pública desde 26 de junho de 2025, uso de clusters NVIDIA A800 em links de 1 Gbps e alegação de ganho de 357 vezes em eficiência de comunicação. Agora, o mercado acompanha a prometida reexecução pública para avaliar se o DiLoCoX poderá ampliar o acesso ao treinamento de modelos de IA em larga escala.

Webitcoin