No fértil terreno encontrado pela inteligência artificial (IA) do tipo geradora de conteúdo nos últimos meses, empresas chinesas têm sido praticamente as únicas a fazer alguma frente à predominância das big tech dos EUA. Uma série de anúncios de sistemas chineses voltados à linguagem marca uma resposta na corrida que ganhou destaque com o lançamento do ChatGPT, no final do ano passado.



Por mais que existam nomes de destaque em outras localidades, é do setor privado desses dois países que têm surgido boa parte das principais novidades recentes. Publicamente, as empresas chinesas apertaram o passo desde março, e nomes como Alibaba, Baidu, Huawei e Tencent divulgaram perspectivas de lançamentos ou aprimoramentos em suas versões dos chamados grandes modelos de linguagem - rivais do GPT, o motor do sistema da americana OpenAI.



Trata-se de inteligências artificiais focadas em conteúdo textual: podem processar a comunicação escrita, responder perguntas, montar sequências de frases que parecem ter sido feitas por humanos, fazer traduções e gerar códigos de programação. Apesar de nuances na arquitetura dos algoritmos, as versões apresentadas por essas empresas chinesas têm estrutura semelhante àquelas de nomes como Google, Meta (Facebook) e Microsoft, e as tarefas desempenhadas são, em essência, as mesmas.



Relatório encabeçado pela Universidade Stanford (EUA) lançado no início de abril destaca a participação de ambos os países no setor. E não só competindo. De acordo com o documento, a ponte entre China e Estados Unidos foi a líder nas colaborações entre nações para a produção de artigos científicos sobre IA na última década, por mais que o crescimento anual da parceria venha desacelerando.



"Apesar de EUA e China continuarem a dominar a área de pesquisa e desenvolvimento de IA, os esforços estão se diversificando geograficamente", ressalva o relatório, que teve apoio de empresas como Google, OpenAI, Linkedin e Github, as três últimas ligadas à Microsoft. A participação da Índia em estudos especializados, por exemplo, vem crescendo. O documento, no entanto, destaca a dianteira chinesa nas produções acadêmicas sobre IA, enquanto os EUA lideram no quesito investimento com, US$ 47,4 bilhões (cerca de R$ 234 bilhões) em 2022 ante US$ 13,4 bilhões (R$ 66 bilhões) da segunda colocada China.



Uma comparação entre os resultados práticos desse dinheiro gasto não é tarefa simples, primeiro devido à disponibilidade: apesar de anunciadas, as versões mais atuais desses sistemas não são de fácil acesso ao público. Além das comunicações oficiais das empresas, é possível apenas analisar documentos que acompanham algumas dessas tecnologias, com informações técnicas sobre sua estrutura e desempenho.



O rebuliço causado pelo ChatGPT, que conquistou a marca recorde de 100 milhões de usuários dois meses após seu lançamento, exigiu uma resposta rápida de concorrentes que não necessariamente tinham produtos no mesmo grau de maturidade, como o Ernie Bot, considerado um dos mais avançados na China.



O robô da Baidu, empresa especializada em buscas, tem formato de conversas à la Bing (Microsoft), que tem o GPT por baixo dos panos. A ferramenta propõe funcionalidades semelhantes, além de geração de imagens e fala, como demonstrado em vídeos. Hoje só pode ser acessado por meio de convites seletos.



O Ernie também mostra que o valor gasto não conta toda a história. O relatório de Stanford coloca a produção de sua versão 3.0, lançada em 2021 e uma das bases do Bot, como cerca de cinco vezes mais barata do que a do GPT-2, de 2019, e 180 vezes mais barata que a do GPT-3, de 2020. No geral, o gasto tem subido ao longo do tempo. Para redução de custos, os artigos técnicos da Baidu citam um conjunto de técnicas propostas por pesquisadores da Universidade Tsinghua, baseada em Pequim.



Impor limites para o comportamento das IAs é uma dificuldade enfrentada pelo setor como um todo. A principal diferença é no rigor da linha traçada, mais estrita no caso chinês.



Os termos de uso do GLM-130B, modelo especializado em inglês e chinês lançado pela Universidade Tsinghua em 2022, incluem restrições para aplicações que minem o governo do país.

"Você não usará este software para qualquer ação que possa minar a segurança ou unidade nacionais da China, prejudicar o interesse público da sociedade ou infringir direitos e interesses de seres humanos", diz trecho da licença.



Nos EUA, os termos de uso não fazem referência a segurança nacional ou interesses do país, mas, para os sistemas criados por empresas como Google e Microsoft, o desafio de limitar as respostas surge ao tentar evitar que as ferramentas falem abobrinhas ou forneçam, por exemplo, orientações para criar armas químicas. A China também responsabiliza os criadores dos algoritmos, que deverão fornecer os detalhes de seus sistemas para um registro estatal, por eventuais conteúdos inapropriados gerados.



A dificuldade de manter o conteúdo dentro das linhas impostas pelo regime chinês já levou à suspensão de outras tecnologias semelhantes, mesmo as projetadas no próprio país, onde conteúdos da internet com temas considerados sensíveis pelo governo são barrados. O ChatGPT também não funciona por lá.



Como os grandes modelos de linguagem são gerados ao analisar bilhões de textos, em que a IA detecta padrões e passa a reproduzi-los, uma alternativa pode ser limitar a informação que alimenta os robôs, embora essa filtragem traga desafios. Como o conteúdo é volumoso, é difícil descartar tudo o que pode ser problemático, e adotar um conjunto já previamente censurado, por outro lado, pode reduzir demais a quantidade de entradas para o modelo, derrubando seu desempenho.



Assim como a OpenAI, a Baidu não esclarece que dados usou para montar seu software mais moderno. A revista Wired especula que o conteúdo veio da internet chinesa, ou seja, com limitações devido à censura.



Nesses sistemas, num primeiro momento, tudo o que é absorvido está para jogo, incluindo conteúdos perigosos, imprecisos ou eticamente reprováveis. Na sequência, inicia-se um outro processo de treinamento com humanos para definir o que o robô pode ou não dizer. Nada disso é 100% eficaz.



Na prática, após testar o Ernie, jornais como The Washington Post e Nikkei Asia relataram uma experiência menos fluída do que com o GPT. Em partes, pelas restrições impostas pelo governo chinês. Ao ser questionado sobre o líder do país, Xi Jinping, o sistema afirma ser um robô que ainda está aprendendo e, na sequência, força o recomeço da conversa, relata a publicação americana.



Além do direcionamento fornecido por humanos, os pesquisadores da Baidu dizem que também conseguiram melhorias na qualidade das informações ao incluir uma camada de "conhecimentos" factuais para o robô. Assim, o Ernie obteve resultados expressivos em testes de referência.



Só que ele não está sozinho. Nesses ensaios, as ferramentas são submetidas a tarefas padronizadas para medir seu desempenho. Um robô que classifica imagens, por exemplo, analisa um conjunto de fotos catalogadas por humanos para ver o quanto acerta -na prática, as missões são bem mais complexas.



É o que possibilita algum tipo de comparação entre os sistemas, mas isso só vai até a página dois. De acordo com os pesquisadores de Stanford, essas referências estão ficando saturadas: após avanços a galope registrados ano a ano há até pouco tempo, há hoje pouquíssimo avanço no desempenho a cada lançamento porque as medidas não foram feitas para comportar as tecnologias atuais.



No fim, muitas dessas ferramentas podem alardear resultados expressivos em algumas das principais referências usadas hoje. E fica em aberto onde exatamente estão as falhas de cada um. O Ernie 3.0 chegou a liderar o SuperGLUE, conjunto de testes para robôs focados em linguagem criado em 2019 por pesquisadores das universidades Nova York e Washington, do Facebook, da Deepmind e da Samsung.

Agora, o modelo da Baidu é o quarto colocado na lista liderada pelo Vega, da varejista chinesa JD.



Não trata-se, porém, de uma métrica geral das melhores IAs. É uma medida entre várias disponíveis, e alguns concorrentes de peso, entre os quais o GPT-4, nem sequer foram oficialmente aferidos nessa régua. Sem contar que os sistemas podem ter versões otimizadas para se dar melhor em determinadas provas.



A ferramenta da OpenAI é destaque retumbante em uma série de outros testes. Lidera um bastante popular no setor, o MMLU. Numa comparação direta, um estudo feito por pesquisadores da universidade Hainan (China) -ainda não publicado oficialmente e sem revisão por pares-- analisa GPT-4, Ernie e Tongyi Qianwen (Alibaba). Com uma bateria de tarefas feitas para entender o desempenho dos sistemas ao extrair e interpretar informações, a conclusão é a de que o modelo da OpenAI é o mais maduro.