Gemini Omni: nova tecnologia do Google permite editar vídeos ‘conversando’ com a IA


Gemini Omni: nova tecnologia do Google permite editar vídeos ‘conversando’ com a IA.
Reprodução/Google/YouTube
O Google apresentou nesta terça-feira (19) o Gemini Omni, um novo modelo de IA voltado à criação e edição de vídeos com aspecto ultrarrealista. O anúncio foi feito durante o Google I/O 2026, evento para desenvolvedores realizado em Mountain View, na Califórnia (EUA).
🗒️ Tem alguma sugestão de reportagem? Envie para o g1
Segundo a empresa, a ferramenta permite combinar imagens, áudio, vídeo e texto para gerar vídeos de alta qualidade. Também é possível enviar um vídeo já gravado e pedir alterações por meio de comandos em texto, sem precisar usar programas profissionais de edição, como o Adobe Premiere.
O Google afirma que o usuário pode modificar detalhes específicos ou transformar completamente uma cena apenas conversando com a IA.
Entre os exemplos citados pela empresa estão mudar ações em um vídeo, adicionar personagens e objetos ou alterar ambientes, ângulos e estilos visuais mantendo a consistência da gravação original.
Vídeos em alta no g1
Segundo o Google, o Omni utiliza o conhecimento do Gemini para conectar linguagem, imagens e contexto. A empresa afirma que a ferramenta não apenas cria cenas realistas, mas também consegue entender o que deveria acontecer em seguida para dar continuidade aos vídeos.
A tecnologia estará disponível a partir desta terça em todo o mundo para assinantes dos planos Google AI Plus, Pro e Ultra.
A IA poderá ser usada no app do Gemini, no Google Flow e no YouTube Shorts. Segundo o Google, o Omni também será liberado gratuitamente no YouTube Shorts e no aplicativo YouTube Create ainda nesta semana.
Vídeo criado com o Gemini Omni
Divulgação/Google
Usuário pode criar um ‘deepfake’ com voz e aparência
A big tech também disse que a pessoa poderá criar um avatar digital com sua própria voz e aparência, em uma função que basicamente é um deepfake.
“Estamos comprometidos em desenvolver IA de forma responsável e temos políticas claras para proteger os usuários de danos e governar o uso de nossas ferramentas de IA”, ressaltou a empresa ao anunciar o avatar digital.
Todo conteúdo criado ou editado pelo Omni terá automaticamente o SynthID, marca-d’água digital imperceptível do Google usada para identificar mídias geradas por inteligência artificial.
O Google também afirmou que trabalha em uma versão mais potente da ferramenta, chamada Omni Pro, mas não revelou detalhes nem previsão de lançamento. Disse apenas que ela está “prevista para breve”.
Google já possui outra IA de vídeo
O Google já possui o Veo 3, modelo de IA capaz de gerar vídeos realistas. Mas, segundo Koray Kavukcuoglu, diretor de tecnologia do Google DeepMind e arquiteto-chefe de IA do Google, os dois sistemas têm propostas diferentes.
“O Veo funciona no modelo tradicional de ‘texto para vídeo’, gerando imagens em movimento a partir de um comando escrito. Já o Gemini Omni é um modelo multimodal nativo, construído desde o início sobre a estrutura do Gemini”, afirmou ao g1.
“Isso significa que ele [o Omni] consegue receber e combinar diferentes tipos de arquivos, como fotos, áudios e textos, em um único comando para gerar o resultado final”, completou.
Instants:como funciona o novo recurso do Instagram
Ex-chefe do WhatsApp no Brasil cria ONG para denúncias contra big techs
Adicionar aos favoritos o Link permanente.