O futuro da IA e do jornalismo em jogo: OpenAI enfrenta gigantes da mídia em processo de direitos autorais
Uma coalizão de organizações de notícias liderada pelo The New York Times enfrentou a OpenAI em um tribunal federal na terça-feira, dando continuidade a uma batalha legal que pode moldar o futuro da IA e do jornalismo. A audiência, centrada na moção da OpenAI para arquivar o caso, marca um momento crítico em um processo de violação de direitos autorais de grande importância, que levanta uma questão fundamental: empresas de IA podem usar artigos jornalísticos protegidos por direitos autorais para treinar seus modelos de linguagem sem consentimento ou compensação?
O caso reúne ações judiciais de três editoras: The New York Times, The New York Daily News e o Center for Investigative Reporting. As editoras argumentam que as práticas da OpenAI configuram uma violação em larga escala de direitos autorais, ameaçando potencialmente o futuro do jornalismo.
A equipe jurídica das editoras afirma que a OpenAI e seu financiador, a Microsoft, lucraram com o trabalho jornalístico que foi digitalizado, processado e recriado sem a devida autorização ou pagamento. Jennifer Maisel, advogada do The New York Times, comparou o caso a investigações criminais, afirmando no tribunal: “Precisamos seguir os dados.”
Ian Crosby, outro advogado representando o Times, destacou a natureza substitutiva do ChatGPT e do mecanismo de busca Bing da Microsoft, argumentando que essas ferramentas de IA se tornaram alternativas ao trabalho original das editoras para alguns usuários. Esse ponto é crucial para estabelecer a violação de direitos autorais.
A defesa da OpenAI se apoia no princípio do “uso justo”, uma doutrina da lei dos EUA que permite o uso de material protegido por direitos autorais para fins como educação, pesquisa ou comentário. Joseph Gratz, advogado da OpenAI, argumentou que os modelos de IA da empresa não são projetados para reproduzir artigos inteiros, mas sim para reconhecer padrões nos dados.
A audiência mergulhou nos aspectos técnicos dos modelos de linguagem, com a equipe jurídica da OpenAI e da Microsoft explicando ao juiz Sidney Stein como o ChatGPT processa e analisa dados. Eles descreveram um sistema que divide o texto em “tokens” e aprende a reconhecer padrões, em vez de simplesmente recuperar e reproduzir conteúdos protegidos por direitos autorais.
No entanto, as editoras levantaram preocupações sobre um recurso chamado “geração aumentada por recuperação” (retrieval augmented generation), que permite ao ChatGPT incorporar informações atualizadas da web em suas respostas. Steven Lieberman, advogado do The New York Daily News, caracterizou isso como “carona gratuita”, sugerindo que os leitores poderiam recorrer ao conteúdo gerado por IA em vez de visitar os sites das editoras.
As apostas neste caso são extraordinariamente altas. O The New York Times está buscando bilhões de dólares em indenizações e exigindo a destruição do conjunto de dados do ChatGPT. Um resultado como esse poderia ser catastrófico para a OpenAI, potencialmente forçando a empresa a reconstruir seus modelos de IA usando apenas obras autorizadas. “Se você está copiando milhões de obras, dá para ver como isso se torna um número que pode ser fatal para uma empresa”, disse Daniel Gervais, co-diretor do programa de propriedade intelectual da Universidade Vanderbilt, à NPR.
Agora, o mundo da tecnologia e do jornalismo aguarda a decisão do juiz Stein sobre se o caso será arquivado ou seguirá para julgamento.