O Skeelo está preparando seu primeiro audiolivro produzido com voz sintética. O título escolhido é o best-seller “A lei da atração: O segredo, de Rhonda Byrne, colocado em prática”, de Michael J. Losier, publicado pela editora LeYa. Os testes estão em curso neste momento e a expectativa é de que o lançamento aconteça dentro de algumas semanas.

O uso de voz sintética promete revolucionar a produção de audiolivros, porque barateia e acelera o processo. Atualmente, para produzir um audiolivro com 8 horas de duração (ou 8 “horas finalizadas”, como se diz nesse mercado), são necessárias aproximadamente quatro semanas a um custo entre R$ 10 mil a R$ 12 mil. A maior parte desse tempo e desse investimento se devem às horas de estúdio para a gravação dos narradores. O alto custo de produção é um dos motivos pelos quais os catálogos de audiolivros são menores que aqueles de ebooks. Porém, com o uso de voz sintética, o tempo cai para menos da metade e o custo diminui cerca de 75%.

“Com investimento mais baixo, maior velocidade de produção e boa qualidade de voz, essa tecnologia tem chance de mudar o mercado de audiobook no mundo inteiro”, prevê André Palme, CMCO do Skeelo, em conversa com Mobile Time. “Estúdio de narração não é escalável porque recebe uma quantidade limitada de narradores. Com inteligência artificial podemos fazer vários audiobooks ao mesmo tempo”, acrescenta.

Neste primeiro momento, o Skeelo vai experimentar voz sintética apenas em títulos de não-ficção. Isso porque a tecnologia ainda não está madura o suficiente para dar conta de vozes de múltiplos personagens e de suas diferentes entonações ao longo da história. “A questão não é se, mas quando essa tecnologia estará pronta para livros de ficção. Neste momento, se aplica de maneira mais profissional em conteúdos de não-ficção”, comenta o executivo.

Ele descarta, por outro lado, uma automação completa do processo: os seres humanos continuarão sendo necessários. “A simples aplicação da tecnologia não garante um bom produto. Mesmo com IA precisamos de um processo de pré-produção, preparando o conteúdo para que a voz sintética leia de maneira bacana, com ritmo e cadência, de forma que não seja uma voz metálica e robotizada. Há, portanto, um processo de inteligência humana. E tem também o olhar de pós-produção para possíveis correções”, argumenta.

A produção desse primeiro audiobook com voz sintética está sendo bancada pelo Skeelo. A empresa tem hoje 1 mil audiolivros em seu catálogo.