A OpenAI lançou nesta terça-feira, 30, o Sora 2, nova versão de inteligência artificial generativa voltada para a criação de imagens e vídeos. Com ele, a companhia apresenta o aplicativo Sora, espécie de rede social alimentado pelo Sora 2. No app, é possível criar, remixar conteúdos seus e de outros usuários. Deste forma, a OpenAI entra para o universo das redes sociais.
Um dos diferenciais do “app social”, como a companhia o chama, é que, por meio de um feed personalizável, é possível ver novos vídeos e inserir pessoas em qualquer cena por meio de cameos. Cameos são inserções de pessoas em qualquer cena do Sora com alta fidelidade e após uma pequena gravação de vídeo e áudio no app, que serve para verificar a identidade do usuário e capturar sua aparência e voz.
No momento, o Sora 2 está disponível para dispositivos iOS.
Sora 2
O Sora 2, de acordo com a OpenAI, é um novo modelo de geração de vídeo fisicamente mais preciso, realista e controlável do que os anteriores. Ele também traz diálogo sincronizado e efeitos sonoros. A empresa acredita que o Sora 2 seja o GPT 3.5 em equivalência. E o que era impossível para o modelo anterior agora é viável, como rotinas olímpicas de ginástica, mortais para trás em uma prancha de stand-up paddle simulando de forma realista a dinâmica da flutuação e da rigidez, ou um triplo axel enquanto um gato se agarra desesperadamente.

Rapaz dá mortal para trás. Crédito: reprodução de vídeo

Rapaz dá mortal para trás e cai. Crédito: reprodução de vídeo
A OpenAI acredita que o avanço do novo modelo de criação de vídeo faz com que os erros sejam mais realistas. Assim, se na versão anterior o sistema distorcia objetos e deformava a realidade para conseguir executar um prompt de texto – como uma bola de basquete se “teletransportava” para dentro da cesta – no Sora 2, o modelo obedece melhor as leis da física – ou seja, o jogador pode errar e a bola bate no aro, por exemplo.
Outro avanço no novo modelo é que ele é capaz de seguir melhor instruções complexas que envolvem múltiplos planos. E, de acordo com a empresa, ele se destaca na criação de estilos realistas, cinematográficos e de anime.
Imagem principal: reprodução de vídeo feito no Sora 2, da OpenAI