AI Personal Learning
und praktische Anleitung
豆包Marscode1

Clone Voice: Mehrsprachiges, samplefreies Tool zum Klonen von Stimmen basierend auf xtts_v2 für Windows.

Allgemeine Einführung

Clone Voice ist ein Open-Source-Tool zum Klonen von Klängen, das eine webbasierte Schnittstelle bietet, mit der Benutzer Stimmen klonen können, indem sie beliebige Klänge oder persönliche Sprachaufnahmen verwenden. Das Tool ist einfach zu bedienen und kann lokal mit einer vorkompilierten Anwendung auch ohne NVIDIA-GPU ausgeführt werden. Es unterstützt mehrere Sprachen, darunter 16 Sprachen wie Chinesisch, Englisch, Japanisch, Koreanisch, Französisch, Deutsch und Italienisch. Die Benutzer können den Ton über ein Mikrofon aufnehmen oder Audiodateien zur Konvertierung hochladen.

Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2开发提供一键安装包-1


 

Funktionsliste

  • Text to Sound: Geben Sie Text ein oder importieren Sie Untertiteldateien, um Sprache mit einer bestimmten Klangfarbe zu erzeugen.
  • Sound to Sound: Audiodateien hochladen oder Ton online aufnehmen, in bestimmte Töne umwandeln.
  • Mehrsprachige Unterstützung: Unterstützt Sprachsynthese und -konvertierung in 16 Sprachen.
  • Einfach zu verwenden: Keine NVIDIA GPU erforderlich, laden Sie die vorkompilierte Version herunter und verwenden Sie sie.
  • Online-Aufnahme: Nehmen Sie den Ton über das Mikrofon auf und konvertieren Sie ihn in Echtzeit.
  • Modell-Download: Bietet eine Vielzahl von Modell-Download-Optionen für unterschiedliche Anforderungen.

 

Hilfe verwenden

Einbauverfahren

  1. Download Fenster vorkompilierte Version der Verwendung von (andere Systeme können Quellcode bereitgestellt werden)
    • Interviews Seite für Veröffentlichungen Laden Sie die neueste vorkompilierte Version und die Modelldateien herunter.
    • Laden Sie die Datei herunter und entpacken Sie sie in das angegebene Verzeichnis, z. B. E:/clone-voice.
  2. Ausführen der Anwendung::
    • Doppelklick app.exeDie Webschnittstelle wird automatisch geöffnet.
    • Bitte lesen Sie die Eingabeaufforderungen im CMD-Fenster aufmerksam durch, eventuelle Fehler werden hier angezeigt.
  3. Modell Konfiguration::
    • Entpacken Sie die heruntergeladenen Modelldateien in das Softwareverzeichnis unter dem tts Im Inneren der Mappe.

Verwendungsprozess

  1. Text-zu-Ton::
    • Wählen Sie die Schaltfläche [Text->Ton] und geben Sie Text in das Textfeld ein oder klicken Sie auf , um eine Untertiteldatei zu importieren.
    • Wählen Sie die gewünschten Töne aus und klicken Sie auf die Schaltfläche "Jetzt starten", um die Sprachdatei zu erstellen.
  2. Ton zu Ton::
    • Wählen Sie die Schaltfläche [Ton->Ton], um die zu konvertierende Audiodatei hochzuladen (das Format mp3/wav/flac wird unterstützt).
    • Wählen Sie den Ton, den Sie klonen möchten, aus dem Dropdown-Feld "Zu verwendende Tondatei" oder klicken Sie auf die Schaltfläche "Lokaler Upload", um eine aufgenommene Tondatei auszuwählen.
    • Klicken Sie auf die Schaltfläche "Jetzt starten", um die konvertierte Audiodatei zu erzeugen.
  3. Online-Aufzeichnung::
    • Klicken Sie auf die Schaltfläche "Aufnahme starten", um 5-20 Sekunden Ton über das Mikrofon aufzunehmen.
    • Klicken Sie nach der Aufnahme auf die Schaltfläche "Verwenden", um den Ton zu konvertieren.

Bereitstellung des Quellcodes (für Linux, Mac, Windows)

  1. Umgebung Konfiguration::
    • Installieren Sie Python 3.9 oder höher und das Tool git-cmd.
    • Erstellen Sie eine virtuelle Umgebung und aktivieren Sie sie:python -m venv venv(math.) Gattungsource venv/bin/activate(Linux/Mac) oder venv\Scripts\activate(Windows).
  2. Quellcode herunterladen::
    • Öffnen Sie ein CMD-Fenster im Zielverzeichnis und führen Sie git clone https://github.com/jianchang512/clone-voice.git.
  3. Installation von Abhängigkeiten::
    • vollziehen pip install -r requirements.txt Installieren Sie die erforderlichen Abhängigkeiten.
    • Wenn CUDA-Beschleunigung erforderlich ist, deinstallieren Sie die vorhandene Torch und installieren Sie die Version, die CUDA unterstützt, neu:pip uninstall -y torch(math.) Gattungpip install torch torchaudio --index-url https://download.pytorch.org/whl/cu121.
  4. Ausführen der Anwendung::
    • vollziehen python app.py Starten Sie das Webinterface.
Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Clone Voice: Mehrsprachiges, samplefreies Tool zum Klonen von Stimmen basierend auf xtts_v2 für Windows.
de_DEDeutsch