A audiência pública realizada nesta terça-feira, 2, pela Comissão Especial de Inteligência Artificial da Câmara dos Deputados, ouviu especialistas em direitos autorais que fizeram uma série de propostas sobre o tema – como exclusões de trechos do PL 2338/23 ou inserções. A maioria trabalha na área de direito autoral e defendeu o pagamento por uso de obras para treinamento de sistemas de IA generativa.
Para Dalton Morato, diretor jurídico, administrativo, e de relações institucionais na Associação Brasileira de Direitos Reprográficos (ABDR), os dados, ou seja, o conteúdo usado no treinamento dos sistemas de IA, deveriam ser considerados como insumos, matérias primas.
“Sistemas de IA pressupõem grandes data centers, grandes quantidades de energia, de água para resfriar os equipamentos, grandes números de engenheiros para fazer as programações e todo uso depende de dados. Por que os dados não podem ser compreendidos como um custo, como um insumo, como matéria prima dos sistema de inteligência artificial?”, questionou.

Dalton Morato, Diretor Jurídico, administrativo, e de relações institucionais na Associação Brasileira de Direitos Reprográficos (no microfone, em pé). Imagem: reprodução de vídeo
Morato entende que a remuneração deve acontecer tanto no input quanto no output “porque no output os sistemas sintéticos gerados por IA são obras derivadas, obras resumidas dos conteúdos”.
Para Juliano Maranhão, professor da Faculdade de Direito da USP, a remuneração não deve se basear em direito autoral, mas deve partir da receita dos modelos de IA. “É preciso sair da caixa de direitos autorais e pensar numa forma que incentive e desonere o desenvolvimento de IA.
Paulo Rosa, presidente da Pró-Música Brasil, por exemplo, defendeu a manutenção do capítulo de direito autoral, mesmo entendendo haver “uma oposição do setor de tecnologia”. Para Rosa, a Câmara dos Deputados saberá “encontrar um equilíbrio entre as preocupações do setor de tecnologia e dos direitos dos criadores brasileiros”.
O representante da Pró-Música sugere mudanças no texto de regime de reciprocidade. O atual texto propõe em relação a conteúdos estrangeiros, um regime de reciprocidade sempre quando o país protege os direitos de seus cidadãos. “Sugerimos que no lugar de ‘reciprocidade’ a adoção do conceito de ‘trato nacional’, consagrado na Convenção de Berna (tratado internacional) que sempre esteve na base de nossas legislações autorais”, completou.
‘Trato nacional’ é um princípio do direito internacional que exige que um país conceda aos produtos, serviços e direitos de propriedade intelectual estrangeiros o mesmo tratamento que os seus próprios, uma vez que entram no mercado.
Dante Cid, Presidente do SNEL (Sindicato Nacional dos Editores de Livros), representando Abrelivros e a Câmara Brasileira do Livro (CBL), defendeu o pagamento de direitos autorais para o uso de obras literárias e produção cultural em geral em treinamento de modelos de IA
“A qualidade da informação é essencial, mas ela não cai do céu. Requer qualidade humana trabalho humano e é isso que está representado na criação literária, na música, no audiovisual. Isso é patrimônio cultural brasileiro. Entregar isso de bandeja para plataformas do mundo inteiro utilizarem de forma livre, não licenciada, é um risco enorme para o setor cultural brasileiro”.
Polêmica do artigo 63 sobre direito autoral
Cid sugere a remoção do artigo 63, que exime o pagamento de direito autoral de acordo com algumas exceções.
O artigo 63 do PL permite que instituições científicas, de pesquisa e educacionais, museus, arquivos públicos e bibliotecas estejam isentas de direitos de autor, desde que não tenham fins comerciais. Santana pede alterações no texto para permitir que governos também se isentem dos direitos de autor para o desenvolvimento de seus sistemas de IA. Mas também pede alteração para que o governo possa ser remunerado por meio de suas parcerias.
O artigo 63 do texto também foi questionado por André Fernandes, diretor do Instituto de Pesquisa em Direito e Tecnologia do Recife (IP.rec). O especialista defendeu o trecho do PL, mas sugere que se blinde o texto para que entidades com fins lucrativos se beneficiem do fato de ser uma exceção muito abrangente. A proposta seria vedar o uso de instâncias não lucrativas, como ONGs e academia por parte de empresas com fins lucrativos que, a partir de associação, poderiam se beneficiar da brecha.
André Macedo Santana, responsável pela Secretaria de Inteligência Artificial, Economia Digital, Ciência, Tecnologia e Inovação (SIA) do governo do Piauí, sugeriu que a implementação de IA pelo poder público seja mais ágil para projetos piloto ou experimentais, com uma avaliação preliminar em um “formato simplificado”.
Quanto ao artigo 63, pediu para incluir governos (administração pública) nas exceções para pagamentos de direito autoral. “Queríamos deixar clara a participação dos entes de governo. E, no item 2, que não trate de fins comerciais ou que dê outra interpretação para o governo. Não para arrecadar, mas para que pudessem ser remuneradas as parcerias que o governo firmasse por meio de documentos específicos, acordos de cooperação, que seja, mas para que se pudesse manter de forma sustentável a prestação de serviço pelo governo para os municípios”, explicou. Vale reforçar que uma das condições para o artigo 63 é que não não tenha fins comerciais.
O lado das empresas com Meta

Margareth Kang, Gerente de Politicas Públicas da Meta. Imagem: reprodução de vídeo
A representante da Meta, Margareth Kang, explicou o que é uma inteligência artificial generativa e como é realizado seu treinamento. Ressaltou que, no treinamento, se ensina o modelo a responder com conteúdo novo e isso envolve extrair padrões, fatos das obras, mas não reproduzí-las. “De outra forma, é ensinar o modelo a responder a comandos com um conteúdo novo tendo como objetivo extrair fatos e relações não expressivas para gerar conteúdo novo”.
Kang alerta que o Brasil pode ficar tecnologicamente atrasado caso a legislação não leve em conta a escala dos grandes modelos de linguagem e a quantidade de dados envolvidos.
“O regime de direitos autorais permite a flexibilidade do uso justo e a mineração de textos de dados, que é o que melhor equilibra a inovação com a proteção desses direitos”, disse.
A executiva da Meta também explicou que exigências de transparência devem considerar que “é impossível para quem treina modelos de IA generativa saber definitivamente se um dado específico é ou não protegido por direitos autorais já que não existem hoje padrões internacionais para marcar ou registrar a cadeia econômica de seção de direitos.”
“Os modelos de IA extraem fatos e padrões não protegidos por direitos autorais para treinamento com esses dados subjacentes. O propósito não é reproduzir obras protegidas, mas identificar padrões de linguagem em um amplo conjunto de conteúdos. Isso não afeta os interesses legítimos dos titulares. Dada a enorme quantidade de dados usados para treinar grandes modelos de linguagem, partes individuais de conteúdo têm valores intrínsecos limitados para os treinamentos. Um opt-out tem um valor independente. Com o modelo determinando a significância estatística dos parâmetros em todos os conjuntos de dados, excluir um dado específico não afetará materialmente a eficácia do modelo tornando o licenciamento e a remuneração um pouco desnecessários nesse caso”, disse.
IP.rec

André Fernandes, Diretor do Instituto de Pesquisa em Direito e Tecnologia do Recife (IP.rec). Crédito: Reprodução de vídeo.
André Fernandes, diretor do IP.rec, sugere a inserção do artigo 66a para que o poder público crie bases de dados públicas e políticas de fomento à inovação, com participação social multissetorial, para incentivar acervos e reduzir progressivamente o prazo de proteção autoral em determinadas categorias de obra. “É uma avaliação para ser feita ao longo do tempo”, disse.
Mas o especialista negou que seja impossível retirar obras de treinamento de modelos de IA generativa. Há uma série de técnicas eficazes para isso. Entre elas, modelos de memória externa, descent-to-delet, Amnesiac, entre outras. “Tal como LLMs e IA generativa são inovações, a gente tem um campo chamado de machine unlearning que é feito para gerar a possibilidade de remoção de conteúdo”, explicou.
Fernandes foi categórico ao explicar que os modelos generativos não são sustentáveis. “Os modelos consomem dados porque no longo prazo eles têm uma degradação técnica, de modo que se esses modelos não continuarem sendo alimentados com dados produzidos por criadores de conteúdo, todas as métricas despencam. A tecnologia é pensada para se apropriar do conteúdo gerado por humanos. Porque o conteúdo sintético não resiste”, resumiu.