Aprendizagem pessoal com IA
e orientação prática
Recomendação de recursos 1

SVLS: SadTalker aprimorado para gerar pessoas digitais usando vídeo de retrato

Introdução geral

O SadTalker-Video-Lip-Sync é uma ferramenta de síntese labial de vídeo baseada na implementação do SadTalkers. O projeto gera formas labiais por meio da geração orientada por voz e usa o aprimoramento configurável da região facial para melhorar a clareza das formas labiais geradas. O projeto também usa o algoritmo de interpolação de quadros DAIN para preencher quadros no vídeo gerado para tornar a transição labial mais suave, realista e natural. Os usuários podem gerar rapidamente vídeos de formato de lábios de alta qualidade por meio de operações simples de linha de comando, que são adequadas para várias necessidades de produção e edição de vídeo.

SVLS: Aprimoramento do SadTalker para gerar pessoas digitais usando vídeo de retrato-1

SadTalker original


SVLS: Aprimoramento do SadTalker para gerar pessoas digitais usando vídeo de retrato-1

SadTalker aprimorado

 

Lista de funções

  • Geração de lábios orientada por falaMovimentos labiais: conduz os movimentos labiais em um vídeo por meio de um arquivo de áudio.
  • Aprimoramento da área facialAprimoramento configurável da imagem da área dos lábios ou do rosto inteiro para melhorar a nitidez do vídeo.
  • Inserção de quadro DAINUse algoritmos de aprendizagem profunda para corrigir quadros em vídeos para melhorar a suavidade do vídeo.
  • Várias opções de aprimoramentoSuporte a três modos: sem aprimoramento, aprimoramento dos lábios e aprimoramento do rosto inteiro.
  • Modelo de pré-treinamentoForneça uma variedade de modelos pré-treinados para que os usuários possam começar rapidamente.
  • Operação simples de linha de comandoFácil de configurar e executar por meio de parâmetros de linha de comando.

 

Usando a Ajuda

Preparação ambiental

  1. Instale as dependências necessárias:
   pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
conda install ffmpeg
pip install -r requirements.txt
  1. Se você precisar usar o modelo DAIN para preenchimento de quadros, também precisará instalar o Paddle:
   python -m pip install paddlepaddle-gpu==2.3.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

Estrutura do projeto

  • pontos de controle: armazenar modelos pré-treinados
  • dian_outputArmazena as saídas de inserção de quadro DAIN
  • exemplosArquivos de áudio e vídeo de amostra
  • resultadosGeração de resultados
  • src: Código-fonte
  • sync_showDemonstração do efeito de síntese
  • terceira_parteBibliotecas de terceiros
  • inference.pyScript de raciocínio
  • README.mdDocumento de descrição do projeto

raciocínio modelado

Use o seguinte comando para inferência de modelo:

python inference.py --driven_audio 
  • -driven_audioArquivos de áudio de entrada
  • --source_videoArquivos de vídeo de entrada
  • --aprimoradorModos aprimorados (nenhum, lábio, rosto)
  • --use_DAINSe deve usar quadros DAIN
  • ---time_stepTaxa de quadros interpolada: Taxa de quadros interpolada (padrão 0,5, ou seja, 25 fps -> 50 fps)

efeito de síntese

Os efeitos de vídeo gerados são mostrados na seção . /sync_show Catálogo:

  • original.mp4: Vídeo original
  • sync_none.mp4Efeitos de síntese sem qualquer aprimoramento
  • none_dain_50fps.mp4Adição de 25 fps a 50 fps usando apenas o modelo DAIN
  • lip_dain_50fps.mp4Aprimoramentos na área dos lábios + modelo DAIN para adicionar 25 fps a 50 fps
  • face_dain_50fps.mp4Aprimoramento da área total do rosto + modelo DAIN para adicionar 25 fps a 50 fps

Modelo de pré-treinamento

Caminho de download do modelo pré-treinado:

Conteúdo 2
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " SVLS: SadTalker aprimorado para gerar pessoas digitais usando vídeo de retrato

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil