AI Personal Learning
und praktische Anleitung

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

Allgemeine Einführung

Easy-Voice-Toolkit ist ein vielseitiges, auf dem Open Source Speech Project basierendes Toolkit, das eine breite Palette von automatisierten Audiowerkzeugen für die Spracherkennung, Sprachtranskription, Sprachkonvertierung, Datensatzerstellung und Modelltraining bietet. Benutzer können diese Werkzeuge je nach Bedarf selektiv einsetzen oder sie nacheinander verwenden, um rohe Audiodateien schrittweise in ideale Sprachmodelle zu konvertieren. Das Toolkit unterstützt die lokale Bereitstellung, und die Benutzer können ein leichtes Installationspaket oder ein portables Paket zur Verwendung herunterladen.

 


Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

 

 

Funktionsliste

  • Audioverarbeitung

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

 

  • Spracherkennung

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

 

  • Sprachtranskription

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

 

  • Erstellung von Datensätzen (SRT-Konvertierung und WAV-Splitting)

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

 

  • Modellschulung

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

 

  • Sprachsynthese

Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

 

Hilfe verwenden

Installationsprozess:

  1. Lightweight Installer herunterladenKleine Pakete, die zwar Installationsanweisungen, aber nicht die notwendigen Umgebungsabhängigkeiten und Modelle enthalten.
  2. Download gebrauchsfertige TragetascheGroßes Paket mit allen Umgebungsabhängigkeiten und mehreren Modellvorgaben, herunterladen und zur Verwendung entpacken.

Lokale Bereitstellung - Benutzerinstallation:

  1. Laden Sie das leichtgewichtige Installationsprogramm oder das gebrauchsfertige portable Paket herunter.
  2. Entpacken Sie die heruntergeladene Datei.
  3. in Bewegung sein .exe Datei oder deren Verknüpfung.

Lokale Bereitstellung - Setup-Umgebung für Entwickler:

  1. Stellen Sie sicher, dass Python 3.8 oder höher installiert ist.
  2. Klonen des Projektlagers:
    git klonen. https://github.com/Spr-Aachen/Easy-Voice-Toolkit.git
    
  3. Wechseln Sie in das Projektverzeichnis:
    cd Easy-Voice-Toolkit
    
  4. Abhängigkeiten installieren:
    pip install -r anforderungen.txt
    
  5. Installieren Sie die GUI-Abhängigkeiten:
    pip install pyside6 QEasyWidgets pywin32==300 psutil pynvml darkdetect PyGithub
    
  6. Führen Sie das Programm aus:
    python Ausführen.py
    

Funktionaler Betriebsablauf:

  1. AudioverarbeitungImportieren Sie die Audiodatei, wählen Sie die gewünschten Bearbeitungswerkzeuge (z. B. Rauschunterdrückung, Bearbeitung usw.), wenden Sie die Bearbeitung an und speichern Sie das Ergebnis.
  2. SpracherkennungImportieren Sie die Audiodatei, wählen Sie das Spracherkennungsmodell, führen Sie die Erkennung durch und exportieren Sie die Textergebnisse.
  3. SprachtranskriptionImportieren Sie die Audiodatei, wählen Sie das Transkriptionswerkzeug, führen Sie die Transkription durch und exportieren Sie die Untertiteldatei (z. B. SRT).
  4. Produktion des DatensatzesImportieren Sie Audiodateien, wählen Sie das Tool zur Erstellung von Datensätzen und führen Sie die SRT-Konvertierung oder das WAV-Splitting durch, um einen Trainingsdatensatz zu erstellen.
  5. ModellschulungImportieren Sie den Trainingsdatensatz, wählen Sie das Modelltrainingstool, konfigurieren Sie die Trainingsparameter, führen Sie das Training durch und speichern Sie das Modell.
  6. phonetische TranskriptionImportieren Sie Audiodateien, wählen Sie das Werkzeug zur Sprachkonvertierung, konfigurieren Sie die Konvertierungsparameter, führen Sie die Konvertierung durch und speichern Sie das Ergebnis.

caveat

  • Derzeit unterstützt die Benutzeroberfläche nur Windows-Systeme.
  • Bitte stellen Sie während des Downloads und der Nutzung eine stabile Internetverbindung sicher.
  • Wenn Sie auf Probleme stoßen, lesen Sie bitte die Anleitungen und FAQs im Projekt-Repository.
AI Leichtes Lernen

Der Leitfaden für Laien zum Einstieg in die KI

Hilft Ihnen, die Nutzung von KI-Tools kostengünstig und von Null an zu erlernen.KI ist, wie Bürosoftware, eine wesentliche Fähigkeit für jeden. Die Beherrschung von KI verschafft Ihnen einen Vorteil bei der Stellensuche und die Hälfte des Aufwands bei Ihrer zukünftigen Arbeit und Ihrem Studium.

Details ansehen>
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Easy Voice Toolkit: AI Voice Toolkit für den lokalen Einsatz

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)