O Veo 3, modelo de geração de vídeos com som do Google, está desembarcando no Brasil para os assinantes do Google AI Pro. A informação foi confirmada pela empresa, que iniciou a liberação de forma gradual para a sua base de usuários nesta terça-feira, 10.
Além dos assinantes do Google AI Pro, a ferramenta chega parcialmente aos usuários que assinam o plano Ultra. Por sua vez, desenvolvedores e empresas podem usar a solução por meio da plataforma Vertex AI. Apresentado durante o Google I/O em maio deste ano, o Veo 3 permite ao usuário criar vídeos com áudio integrado, controlar câmeras, movimentos, cenas e personagens.
Durante o Google for Brasil em São Paulo, Mat Veloso, vice-presidente de inteligência artificial para desenvolvedores no Google DeepMind, explicou que o Veo 3 está atualmente em fase de testes para diálogos em português brasileiro. Em outras palavras, apesar de estar sendo liberado para os usuários brasileiros, a solução ainda está em testes.
Em complemento, o Google disponibilizou uma marca d’água digital para conteúdos gerados com IA junto com o Veo 3, batizada como SynthID. Veloso afirmou que, em breve, o SynthID terá um site para verificação se o conteúdo foi ou não gerado por uma inteligência da companhia.
“Qualquer pessoa vai poder acessar o portal de SynthID Detector e fazer upload das imagens para verificar se aquele material foi gerado pela nossa inteligência artificial”, disse o executivo. “É assim que acreditamos que a inovação pode caminhar junto com o uso responsável da tecnologia”, completou.
Tradução simultânea no Google Meets
Outra solução liberada pelo Google aos assinantes do AI Pro é a tradução simultânea em português. Nela, o usuário pode ouvir a tradução de um idioma que não compreende com voz, tom e emoção similar à fala de quem está conversando do outro lado. Isso vale também para reuniões com mais de uma pessoa.
Esta ferramenta chega aos usuários com AI Pro via Google Meets e do Google Workspace nas próximas semanas. Os usuários corporativos e assinantes do Google One também passam a ter acessos nas próximas semanas a outras ferramentas de IA no Workspace, como:
“Anota para mim” no Google Meet, um resumo de reuniões em vídeo e em português;
O “Quero Ajuda Para Criar”, que permite criar textos com Google Drive e Docs a partir de um pedido no prompt;
“Quero Ajuda para Analisar”, uma espécie de analista de negócios que pode interpretar e dar insights sobre documentos e dados no Google Planilhas;
Gemini e Waze
Para todos os usuários, o Google está trazendo duas funções de IA em seus produtos, o Gemini Live de câmera e compartilhamento de tela e o ‘Conta pro Waze’.
Também apresentado no Google I/O, o Gemini Live chega oficialmente aos usuários de iOS no Brasil. Com ele, basta abrir a câmera, apontar para um objeto e perguntar para o Gemini para ter uma contextualização. Esse recurso funciona em português e em outros 44 idiomas.
Por sua vez, o Conta pro Waze é uma ferramenta que permite ao usuário reportar um evento no trânsito (acidente, via obstruída, semáforo quebrado, por exemplo) com a voz e sem a necessidade de tocar diversas vezes na tela. Ao apertar o botão e reportar para o app, o sistema envia um alerta e adiciona uma sinalização ao mapa.
Lançada em inglês no ano passado, o Conta Pro Waze está sendo disponibilizado agora em português, espanhol e francês. Em breve chegará a mais idiomas.
Imagem principal: Mat Veloso, VP de IA para desenvolvedores no Google DeepMind (divulgação)