VideoReTalking: sincronização labial acionada por áudio e sistema de edição de vídeo

Recursos mais recentes de IAAtualizado há 9 meses Círculo de compartilhamento de IA

Introdução geral

O VideoReTalking é um sistema inovador que permite aos usuários gerar vídeos faciais sincronizados com os lábios com base no áudio de entrada, produzindo vídeos de saída de alta qualidade e sincronizados com os lábios, mesmo com emoções diferentes. O sistema divide esse objetivo em três tarefas sucessivas: geração de vídeo facial com expressões típicas, sincronização labial acionada por áudio e aprimoramento facial para melhorar o foto-realismo. Ele lida com todas as três etapas usando uma abordagem baseada em aprendizado que pode ser executada sequencialmente sem a intervenção do usuário. Explore o VideoReTalking e sua aplicação à edição de vídeo de cabeça falante com sincronização labial acionada por áudio por meio do link fornecido.

(não está claro, é necessário melhorar a qualidade do vídeo duas vezes, sincronização labial um pouco ruim com o chinês)

Lista de funções

Geração de vídeo facial: gera vídeos faciais com expressões típicas com base no áudio de entrada.
Sincronização labial orientada por áudio: gera vídeo com sincronização labial com base no áudio fornecido.
Aprimoramento facial: aprimoramento do fotorrealismo de faces sintéticas por meio de uma rede de aprimoramento facial com reconhecimento de identidade e pós-processamento.

Usando a Ajuda

Faça o download do modelo pré-treinado e coloque-o em `. /checkpoints`.
Execute `python3 inference.py` para fazer uma inferência rápida do vídeo.
As expressões podem ser controladas com a adição dos argumentos `--exp_img` ou `--up_face`.

Endereço de experiência on-line

Replicar a experiência

VideoReTalking Colab Run Location

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Audibit: transformando artigos populares de tecnologia em podcasts de áudio prontos para serem ouvidos

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

5 meses atrás

018.2K

Agentarium: gerenciamento e coordenação de interações entre várias inteligências de IA

Recursos mais recentes de IA # Projeto de código aberto AI Java Estrutura de desenvolvimento do corpo inteligente #

9 meses atrás

019.5K

Sync: suporte multilíngue on-line para a ferramenta de sincronização labial de vídeo com IA (Wav2Lip on-line)

Recursos mais recentes de IA Sincronização de portas #

9 meses atrás

024.4K

Gan.AI: criação de vídeos de avatar personalizados com foco em defensores digitais da marca doppelganger

Recursos mais recentes de IA # AI Digital Man

8 meses atrás

017.6K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

VideoReTalking: sincronização labial acionada por áudio e sistema de edição de vídeo

Introdução geral

Lista de funções

Usando a Ajuda

Musicfy: gerador de canções com voz, converte canções em estilos de canto

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Artigos relacionados

Audibit: transformando artigos populares de tecnologia em podcasts de áudio prontos para serem ouvidos

Agentarium: gerenciamento e coordenação de interações entre várias inteligências de IA

Sync: suporte multilíngue on-line para a ferramenta de sincronização labial de vídeo com IA (Wav2Lip on-line)

Gan.AI: criação de vídeos de avatar personalizados com foco em defensores digitais da marca doppelganger

Sem comentários

Últimas coleções

Artigos mais recentes

VideoReTalking: sincronização labial acionada por áudio e sistema de edição de vídeo

Introdução geral

Lista de funções

Usando a Ajuda

Musicfy: gerador de canções com voz, converte canções em estilos de canto

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Artigos relacionados

Audibit: transformando artigos populares de tecnologia em podcasts de áudio prontos para serem ouvidos

Agentarium: gerenciamento e coordenação de interações entre várias inteligências de IA

Sync: suporte multilíngue on-line para a ferramenta de sincronização labial de vídeo com IA (Wav2Lip on-line)

Gan.AI: criação de vídeos de avatar personalizados com foco em defensores digitais da marca doppelganger

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes