Aprendizagem pessoal com IA
e orientação prática
TRAE

A geração de vídeo Veo 2 do Google chega ao Gemini e ao Whisk, expandindo o território da ferramenta de criação de IA

O Google anunciou recentemente que seu modelo de geração de vídeo, o Veo 2, foi oficialmente integrado ao Gêmeos Advanced e em sua plataforma experimental Whisk. A mudança significa que os assinantes do Google One AI Premium agora podem gerar conteúdo de vídeo curto diretamente a partir de instruções de texto ou imagens existentes.

O Veo 2 está sendo posicionado pelo Google como sua tecnologia avançada de geração de vídeo projetada para converter descrições de texto em vídeos de até 8 segundos, com resolução de 720p e proporção de 16:9 no formato MP4. Diz-se que o modelo foi aprimorado em termos de compreensão das leis da física realista e do movimento humano, e é capaz de gerar videoclipes com movimentos suaves, cenas realistas e detalhes ricos, abrangendo uma gama diversificada de tópicos e estilos.


A geração de vídeos do Google Veo 2 chega ao Gemini e ao Whisk, expandindo o território da ferramenta de criação de IA-1

 

Geração de texto para vídeo no Gemini

No Gemini Advanced, o usuário pode criar um vídeo selecionando o modelo Veo 2 em um menu suspenso. O processo é relativamente simples: o usuário insere uma descrição detalhada da cena e o Gemini tenta gerar um vídeo. A demonstração oficial mostra diferentes estilos de geração, por exemplo:

  • Primeira cena: Uma câmera ampla e lenta percorre uma enorme caverna glacial enquanto duas figuras em trajes de exoesqueleto branco caminham por ela, com luzes de capacete iluminando objetos congelados e semelhantes a doces nas paredes de gelo.
    • Link para o vídeo de amostra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__37_aDEwjss.mp4
  • Segunda cena: Animado com estilo, um camundongo com óculos grandes lê livros à luz de cogumelos brilhantes em uma aconchegante toca na floresta.
    • Link para o vídeo de amostra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Mouse_Reads_Video_Generated.mp4
  • Terceira cena: Vista aérea de falésias cobertas de grama que se conectam a uma praia de areia, com ondas batendo na costa e um pilar marinho saliente no mar, banhado pelo brilho dourado do nascer ou do pôr do sol.
    • Link para o vídeo de amostra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/Gemini_Generated_Video__13.mp4
  • Quarta cena: Lapso de tempo no estilo somatotrópico de um sorvete rosa, cinza e branco derretendo sob um céu azul claro.
    • Link para o vídeo de amostra: https://storage.googleapis.com/gweb-uniblog-publish-prod/original_videos/KR_Veo2_4.mp4

O Google enfatiza que, quanto mais detalhada for a descrição, mais controle o usuário terá sobre o vídeo final. Esse recurso abre novas possibilidades para visualizar rapidamente conceitos, narrar histórias visuais curtas ou fazer combinações criativas. Os vídeos gerados podem ser facilmente carregados em plataformas como o TikTok ou o YouTube Shorts por meio do botão de compartilhamento.

É importante observar que o Veo 2 atualmente gera vídeos com duração limitada a 8 segundos e resolução de 720p e, embora isso seja suficiente para atender a algumas das necessidades de plataformas de vídeo de formato curto ou para provas de conceito rápidas, não é o mesmo que o setor está fazendo (por exemplo, OpenAI), mas não é o mesmo que o setor está fazendo. Sora O uso atual do Veo 2 no Gemini parece estar mais voltado para uma experiência de criação leve e instantânea do que para a tendência de durações mais longas, resoluções mais altas e maior poder narrativo (conforme demonstrado pelo modelo). Além disso, o recurso tem um limite de geração mensal, o que pode afetar o processo criativo de usuários pesados.

O recurso de geração de vídeo está sendo implementado globalmente para os usuários da Web e de dispositivos móveis do Gemini Advanced em todos os idiomas suportados pelo Gemini.

 

Whisk Animate: Fazendo imagens estáticas se moverem

Além do vídeo gerado por texto, o Google também está trazendo o poder do Veo 2 para a plataforma Whisk com o Whisk Animate, um projeto experimental lançado pelo Google Labs em dezembro passado que permite que os usuários explorem e visualizem ideias combinando texto e imagens.

Agora, com o Whisk Animate, os assinantes do Google One AI Premium podem transformar imagens estáticas que criaram ou carregaram em vídeos com movimentos de 8 segundos. Essa é uma ferramenta conveniente para aqueles que desejam adicionar movimento às suas imagens existentes. O recurso está disponível atualmente em mais de 60 países.

  • Link para o vídeo introdutório relacionado ao Whisk Animate: https://www.youtube.com/watch?v=2yYDI-p5aGs (o link original é uma miniatura, o link presumido para visualização no YouTube é fornecido aqui)

A integração dos recursos de geração de vídeo ao Gemini e ao Whisk mostra a estratégia do Google de procurar integrar as ferramentas de criação de IA ao seu ecossistema existente e aos serviços de assinatura. Isso reduz a barreira para os usuários acessarem e usarem recursos avançados de IA, mas também os vincula a assinaturas pagas específicas.

 

Considerações sobre segurança e responsabilidade do setor

Juntamente com o lançamento do recurso de geração de vídeo, o Google também mencionou as medidas de segurança adotadas. Isso inclui "Red Teaming" extensivo e avaliação para evitar a geração de conteúdo que viole suas políticas.

Uma iniciativa importante é que todos os vídeos gerados pelo Veo 2 serão incorporados com uma marca d'água digital SynthID. Essa marca d'água foi projetada para ser incorporada em cada quadro do vídeo e é usada para identificar que o vídeo foi gerado por IA. Em um cenário em que o conteúdo gerado por IA está se tornando cada vez mais comum e indistinguível do real, a adoção de uma tecnologia de marca d'água confiável é fundamental para aumentar a transparência e combater a desinformação, além de ser parte integrante do desenvolvimento responsável da IA.

O Google também reconhece que, como todas as ferramentas de IA generativas, o resultado do Gemini é amplamente ditado pelas solicitações do usuário, pode gerar conteúdo questionável em alguns casos e incentiva os usuários a fornecerem informações por meio do botão de feedback para melhoria contínua.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " A geração de vídeo Veo 2 do Google chega ao Gemini e ao Whisk, expandindo o território da ferramenta de criação de IA
pt_BRPortuguês do Brasil