AI Personal Learning
und praktische Anleitung
Ressource Empfehlung 1

SVLS: SadTalker erweitert, um digitale Personen anhand von Porträtvideos zu erzeugen

Allgemeine Einführung

SadTalker-Video-Lip-Sync ist ein Video-Lippen-Synthese-Tool, das auf der SadTalker-Implementierung basiert. Das Projekt erzeugt Lippenformen durch stimmgesteuerte Generierung und verwendet konfigurierbare Gesichtsregionsverbesserung, um die Klarheit der generierten Lippenformen zu verbessern. Das Projekt verwendet außerdem den DAIN-Frame-Interpolationsalgorithmus, um Frames im generierten Video aufzufüllen, um den Lippenübergang glatter, realistischer und natürlicher zu gestalten. Benutzer können durch einfache Befehlszeilenoperationen schnell qualitativ hochwertige Lippenformvideos erzeugen, die für verschiedene Videoproduktions- und Bearbeitungsanforderungen geeignet sind.

SVLS: SadTalker-Erweiterung zur Generierung digitaler Personen anhand von Porträtvideo-1

SadTalker Original


SVLS: SadTalker-Erweiterung zur Generierung digitaler Personen anhand von Porträtvideo-1

SadTalker Verbessert

 

Funktionsliste

  • Sprachgesteuerte LippengenerierungSteuerung der Lippenbewegungen in einem Video durch eine Audiodatei.
  • Verschönerung des GesichtsbereichsKonfigurierbare Bildverbesserung für die Lippe oder den gesamten Gesichtsbereich zur Verbesserung der Videoklarheit.
  • DAIN-Rahmen einfügenDeep-Learning-Algorithmen verwenden, um Frames in Videos zu patchen, um die Glätte des Videos zu verbessern.
  • Mehrere ErweiterungsoptionenUnterstützt drei Modi: keine Verstärkung, Lippenverstärkung und vollständige Gesichtsverstärkung.
  • Pre-Training ModellBieten Sie eine Vielzahl von vortrainierten Modellen an, damit die Benutzer schnell loslegen können.
  • Einfache Bedienung über die BefehlszeileEinfach zu konfigurieren und über Kommandozeilenparameter auszuführen.

 

Hilfe verwenden

Vorbereitung der Umwelt

  1. Installieren Sie die erforderlichen Abhängigkeiten:
   pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu113
conda install ffmpeg
pip install -r anforderungen.txt
  1. Wenn Sie das DAIN-Modell für die Rahmenfüllung verwenden möchten, müssen Sie auch Paddle installieren:
   python -m pip install paddlepaddle-gpu==2.3.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

Struktur des Projekts

  • KontrollpunkteVorgefertigte Modelle speichern
  • dian_outputDAIN: Speichert DAIN-Rahmeneinfügungsausgänge
  • BeispieleBeispiele für Audio- und Videodateien
  • Ergebnisse: Ergebnisse generieren
  • src: Quellcode
  • sync_showSynthese-Effekt: Demonstration
  • dritter_teil: Bibliotheken von Drittanbietern
  • inferenz.py: Reasoning Script
  • README.md: Dokument zur Projektbeschreibung

modellhafte Argumentation

Verwenden Sie den folgenden Befehl für die Modellinferenz:

python inference.py --driven_audio 
  • -angetriebenes_Audio: Eingabe von Audiodateien
  • --Quelle_Video: Eingabe von Videodateien
  • --VerstärkerVerbesserte Modi (keine, Lippe, Gesicht)
  • --use_DAINDAIN-Rahmen: Ob DAIN-Rahmen verwendet werden sollen
  • ---zeit_schrittInterpolierte Bildrate (Standardwert 0,5, d.h. 25fps -> 50fps)

Synthese-Effekt

Die erzeugten Videoeffekte werden im Fenster . /sync_show Katalog:

  • original.mp4: Original Video
  • sync_none.mp4Synthese-Effekte ohne jegliche Verstärkung
  • none_dain_50fps.mp4Hinzufügen von 25fps zu 50fps unter ausschließlicher Verwendung des DAIN-Modells
  • lip_dain_50fps.mp4Verbesserungen im Lippenbereich + DAIN-Modell, um 25fps zu 50fps hinzuzufügen
  • gesicht_dain_50fps.mp4Verbesserung des gesamten Gesichtsbereichs + DAIN-Modell zur Erhöhung von 25fps auf 50fps

Pre-Training Modell

Download-Pfad für das vortrainierte Modell:

Inhalt 1
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " SVLS: SadTalker erweitert, um digitale Personen anhand von Porträtvideos zu erzeugen

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)