Quem vê Alexa e Siri nos dias de hoje dificilmente imagina que os assistentes virtuais têm uma trajetória de cerca de 70 anos. Na década de 1950, os Laboratórios Bell criaram a Audrey, um sistema de reconhecimento de voz que apenas identificava números de 0 a 9, com 90% de precisão, e que só funcionava com a voz de um de seus inventores. Uma criação muito à frente do seu tempo.

Em 1965, o programador Joseph Weizenbaum criou Eliza, quando era professor do MIT. Por meio do programa, o usuário interagia com a máquina como se estivesse conversando com ela. É bem verdade que o modelo não era tão fluente assim, já que sua capacidade de interação se restringia a palavras e frases-chave. Por isso, não era incomum ler algumas bizarrices vindas de Eliza.

Já na década de 1970, um projeto chamado Xerox PARC desenvolveu o Genial Understand System (GUS), uma espécie de inteligência artificial que teria a capacidade de reservar voos. Para o desenvolvimento dessa tecnologia, uma equipe formada por engenheiros, pesquisadores, linguistas e até usuários chegaram ao consenso de que o computador deveria entender o que era falado e escrito, sem a necessidade de códigos ou algo parecido. Em um artigo de 1977, o grupo mostrou um exemplo de diálogo que ilustrava como o assistente deveria funcionar. A demonstração técnica, no entanto, não foi levada adiante, já que o foco do projeto era em desenvolver um hardware.

A partir desse período até os anos de 1980, os modelos estatísticos, algoritmos de aprendizado de máquina e modelos ocultos de Markov (HMM), aliados a um sistema independente do locutor, eliminaram a necessidade de calibração por voz para que a tecnologia fosse capaz de reconhecer seu interlocutor.

Uma nova era

O surgimento da discagem e navegação controladas por voz marcaram os anos de 1990. O avanço foi graças à evolução tecnológica e a algoritmos mais sofisticados, sendo muito usado nos setores financeiro – para melhorar o atendimento – e de saúde, que conseguiu aprimorar suas operações e as interações com pacientes, sobretudo aqueles com dificuldade de fala.

Se na década seguinte, o Google Voice Search é uma revolução na internet, os anos de 2010 são um verdadeiro estouro, com a chegada dos assistentes virtuais diários, como Alexa, Google Assistant — substituído pelo Gemini no ano passado — e Siri. O período fez da tecnologia, antes vista como algo futurista, em um objeto palpável do dia a dia de diversos usuários.

Assistentes virtuais

Interface do Google Assistant, que foi substituído pelo Gemini no final de 2025.

Pós-ChatGPT

A partir de 2022, com o lançamento do ChatGPT, os assistentes virtuais passaram de executores de comandos pré-definidos para agentes inteligentes e conversacionais. O editor-chefe do The Verge, David Pierce, acredita que a chegada da IA provocou um certo otimismo sobre a possibilidade de contar com um assistente verdadeiramente conversacional, no entanto, as imperfeições dessa tecnologia fizeram esse entusiasmo diluir com o tempo. 

Apesar dos problemas, é indiscutível que aos poucos os assistentes virtuais estão se mostrando cada vez mais capazes de estabelecer conversas humanizadas e tomar decisões. O Processamento de Linguagem Natural (PLN), o aprendizado profundo e a IA autônoma, por exemplo, estão aprimorando o seu entendimento, não só em termos de contexto, mas de fala – como sotaque, rapidez e até emoções –, e propiciando maior comodidade aos usuários.

Claro que esse universo não oferece apenas vantagens e há muito debate sobre o quanto seus sistemas respeitam a privacidade, já que captam áudio, além de terem fácil acesso à rotina e comportamento dos usuários.

Foto: modelo Echo Studio 2ª Geração, da Amazon, com Alexa. Divulgação/Amazon.

 

*********************************

Receba gratuitamente a newsletter do Mobile Time e fique bem informado sobre tecnologia móvel e negócios. Cadastre-se aqui!

E siga o canal do Mobile Time no WhatsApp!