Resumo: Os pesquisadores do Google acabaram de desenvolver o VLOGGER, um novo modelo de IA que gera vídeos realistas de cabeças falantes com movimentos completos da parte superior do corpo a partir apenas de imagens estáticas e clipes de áudio.
Os detalhes:
O VLOGGER cria um avatar controlável que captura semelhanças e ações.
O modelo foi treinado em um grande conjunto de dados multimídia contendo 800.000 vídeos de pessoas conversando e rotulados para cada parte do rosto e do corpo.
Os aplicativos em potencial incluem a dublagem de vídeos em outros idiomas, a criação de avatares realistas para jogos ou assistentes e o suporte a bate-papo por vídeo com baixa largura de banda.
IMPORTANTE: seja fornecendo realismo aos assistentes de IA, permitindo a dublagem de vídeo em tempo real em vários idiomas ou permitindo que conversemos por vídeo como nossos avatares favoritos, modelos como o VLOGGER são um prenúncio fascinante de um futuro em que as linhas entre nosso eu físico e digital ficarão borradas. Nova abordagem.