SVLS : SadTalker amélioré pour générer des personnes numériques à partir de portraits vidéo
Introduction générale
SadTalker-Video-Lip-Sync est un outil de synthèse labiale vidéo basé sur l'implémentation de SadTalkers. Le projet génère des formes de lèvres par le biais de la génération vocale et utilise l'amélioration configurable de la région faciale pour améliorer la clarté des formes de lèvres générées. Le projet utilise également l'algorithme d'interpolation de trame DAIN pour remplir les trames dans la vidéo générée afin de rendre la transition des lèvres plus fluide, réaliste et naturelle. Les utilisateurs peuvent rapidement générer des vidéos de formes de lèvres de haute qualité grâce à de simples opérations en ligne de commande, qui conviennent à divers besoins en matière de production et d'édition vidéo.

SadTalker original

SadTalker amélioré
Liste des fonctions
- Génération de lèvres pilotée par la parole: Pilotage des mouvements des lèvres dans une vidéo à partir d'un fichier audio.
- Amélioration de la zone facialeAmélioration de l'image : Amélioration configurable de l'image des lèvres ou de la zone du visage pour une meilleure clarté vidéo.
- Insertion du cadre DAINLes algorithmes d'apprentissage profond permettent d'appliquer des correctifs aux images des vidéos afin d'améliorer la fluidité de la vidéo.
- Multiples options d'améliorationLa fonction de mise en valeur du visage est disponible en trois modes : sans mise en valeur, avec mise en valeur des lèvres et avec mise en valeur du visage entier.
- Modèle de pré-entraînementLes modèles préformés : fournir une variété de modèles préformés pour que les utilisateurs puissent commencer rapidement.
- Fonctionnement simple en ligne de commandeLe système est facile à configurer et à utiliser grâce aux paramètres de la ligne de commande.
Utiliser l'aide
Préparation de l'environnement
- Installer les dépendances nécessaires :
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
conda install ffmpeg
pip install -r requirements.txt
- Si vous devez utiliser le modèle DAIN pour le remplissage des cadres, vous devez également installer Paddle :
python -m pip install paddlepaddle-gpu==2.3.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
Structure du projet
checkpoints
: stocker les modèles pré-entraînésdian_output
Les sorties d'insertion de trames DAIN sont stockéesexamples
Fichiers audio et vidéo : Exemples de fichiers audio et vidéoresults
Les résultats : Générer des résultatssrc
Code sourcesync_show
: Démonstration de l'effet de synthèsethird_part
Bibliothèque de tiers : bibliothèques de tiersinference.py
Le rôle de l'homme et de la femme dans la société : Script de raisonnementREADME.md
Document de description du projet
raisonnement modélisé
Utilisez la commande suivante pour l'inférence du modèle :
python inference.py --driven_audio <audio.wav> --source_video <video.mp4> --enhancer <none, lip, face> --use_DAIN --time_step 0.5
--driven_audio
Fichiers audio d'entrée : Fichiers audio d'entrée--source_video
Fichiers vidéo d'entrée--enhancer
Modes améliorés (aucun, lèvres, visage)--use_DAIN
Utilisation ou non des cadres DAIN--time_step
: Fréquence d'images interpolée (par défaut 0.5, c'est-à-dire 25fps -> 50fps)
effet de synthèse
Les effets vidéo générés sont affichés dans la section ./sync_show
Catalogue :
original.mp4
Vidéo d'origine : Vidéo d'originesync_none.mp4
Effets de synthèse sans amélioration de la qualité de l'imagenone_dain_50fps.mp4
Le modèle DAIN : Passer de 25fps à 50fps en utilisant uniquement le modèle DAINlip_dain_50fps.mp4
Améliorations de la zone des lèvres + modèle DAIN pour ajouter 25 images par seconde à 50 images par secondeface_dain_50fps.mp4
Amélioration de la surface totale du visage + modèle DAIN pour ajouter 25 images par seconde à 50 images par seconde
Modèle de pré-entraînement
Chemin de téléchargement du modèle pré-entraîné :
- Baidu.com :lien (sur un site web) Code de l'extrait : klfv
- Google Drive :lien (sur un site web)
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...