1 Mensageria

Os pesquisadores da Meta IA desenvolveram um modelo de inteligência artificial capaz de traduzir 200 línguas, incluindo várias com baixa presença digital, como ayacucho quíchua, aymara central, guarani, crioulo haitiano e papiamento. Somente essas cinco línguas são faladas por mais de 20 milhões de pessoas em 10 países da América Latina.

O modelo é chamado de NLLB-200 e faz parte do projeto NLLB, que significa “no language left behind”, ou “nenhuma língua deixada para trás”. Foi disponibilizado também um banco de dados chamado FLORES-200, com o qual pesquisadores podem medir a performance do modelo de IA. Segundo a Meta, o NLLB-200 apresentou resultados 44% melhores que a versão anterior da empresa. E para algumas línguas africanas e asiáticas chega a ser 77% mais preciso.

Os pesquisadores da Meta realizaram entrevistas com pessoas nativas de locais que falam essas línguas e aprimoraram o modelo para que funcionasse justamente com idiomas com pouco conteúdo disponível online.

Análise

Os avanços de tecnologias de tradução e de processamento de linguagem natural serão cada vez mais fundamentais em novos produtos e serviços digitais, incluindo chatbots, voice bots, metaverso etc. Línguas com uma base massiva de falantes, como inglês, espanhol, árabe e mandarim, oferecem farto material online para a construção de modelos de tradução. O grande desafio é desenvolver ferramentas capazes de traduzir línguas com baixa presença online, mas ainda assim faladas por milhares, às vezes milhões, de pessoas. Um projeto como o NLLB-200, portanto, é de suma importância para a inclusão de mais pessoas a esses novos serviços.