A forma como os direitos autorais serão tratados na regulação da inteligência artificial no Brasil pode afetar o treinamento do modelo de linguagem do ChatGPT no idioma português, segundo apontamento feito pela gerente de Políticas Públicas da OpenAI, Josiara Diniz. As regras para uso de dados pelos desenvolvedores foi tema de debate no 5º Congresso Brasileiro de Internet, evento promovido pela Abranet em Brasília, nesta quinta-feira, 22.
Pela versão em debate, titulares de dados possuem direito à remuneração. A proposta possibilita que haja uma negociação para isso.
“A gente vê com uma certa preocupação a possibilidade do não acesso de dados para que a gente possa treinar modelos. Para exemplificar isso, o português representa de 0,5% a 2% do conteúdo da internet, e o Brasil é o maior contribuidor para isso. Para uma empresa global que treina modelos majoritariamente em inglês, isso é um conteúdo muito baixo, isso é pouco. Mas, para o Brasil, perder modelos treinados em português é muito”, disse Diniz.
A diretora chama atenção para o impacto não só para a OpenAI, mas também para outras empresas que venham a desenvolver LLMs. “Estamos falando de todas as indústrias que usam inteligência artificial. Impede o desenvolvimento de novas tecnologias e impede que novos negócios sejam criados”, disse.
OpenAI e o letramento
Embora a visão seja de implicações gerais, Diniz ressalta que as APIs do ChatGPT estão sendo usadas em projetos de letramento digital e apoio à agricultura no país. Além disso, há a popularidade da ferramenta entre os brasileiros.
“Dentro dos nossos rankings, no uso gratuito, o Brasil é o terceiro país do mundo que mais usa ChatGPT. No ranking pago, está entre os 10 países que pagam para poder usar o ChatGPT. Culturalmente, o brasileiro tem usado a plataforma”, afirma.
Diniz explica que, na prática, uma eventual limitação no acesso aos dados por conta do PL poderia ser um obstáculo para perguntas que envolvem termos regionais. “A forma como o PL está sendo construído, nesse ponto específico, preocupa a gente”, concluiu.
Imagem principal: Gerente de Políticas Públicas da OpenAI, Josiara Diniz, no 5º Congresso Brasileiro de Internet. Crédito: Paulo Victor Lago