A ferramenta do Google para transcrição de áudio, a Cloud Speech API, foi atualizada com a adição de reconhecimento de mais 30 línguas. Agora são ao todo 119. A lista conta dialetos e variações de uma mesma língua. Há por exemplo dois tipos de português (do Brasil e de Portugal); 13 de inglês; e 20 de espanhol. Entre as novas línguas estão o letão, da Letônia; o swahili, da Tanzânia; e o bengali, de Bangladesh.

Outra novidade da Cloud Speech API é que agora os desenvolvedores podem submeter arquivos de áudio de até 180 minutos de duração para serem transcritos – o limite anterior era de 80 minutos. Além disso, na transcrição, a ferramenta vai passar a informar, a cada palavra, o momento preciso em que foi dita no áudio, para facilitar o trabalho de verificação da transcrição.

O Google oferece a ferramenta no modelo freemium: os primeiros 60 minutos de áudio processado são gratuitos e cada 15 segundos adicionais saem por US$ 0,006. A utilização da ferramenta tende a aumentar com o advento de bots de áudio ao redor do mundo.