Allgemeine Einführung
LiberSonora, was so viel wie "freier Klang" bedeutet, ist ein leistungsstarkes KI-fähiges Open-Source-Hörbuch-Toolset, das intelligente Untertitelextraktion, KI-Titelgenerierung und mehrsprachige Übersetzung mit GPU-Beschleunigung unterstützt. Das Toolset unterstützt intelligente Untertitelextraktion, KI-Titelgenerierung, mehrsprachige Übersetzung usw. und ist in der Lage, Batch-Offline-Verarbeitung unter GPU-Beschleunigung durchzuführen.LiberSonora wurde entwickelt, um Benutzern eine effiziente und bequeme Hörbuchproduktion durch modularen Aufbau und flexible Anpassung zu ermöglichen. Sowohl Einzelpersonen als auch Unternehmen können mit LiberSonora problemlos Hörbuchinhalte erstellen und verwalten.
Funktionsliste
- Intelligente Extraktion von UntertitelnUntertitel: Extrahiert automatisch Untertitel aus dem Audio und unterstützt mehrere Sprachen.
- AI-TitelgenerierungGenerierung geeigneter Überschriften auf der Grundlage des Inhalts, um dessen Attraktivität zu erhöhen.
- mehrsprachige ÜbersetzungUnterstützt Übersetzungen in mehrere Sprachen für globale Benutzer.
- GPU-BeschleunigungBeschleunigte Verarbeitung mit GPUs zur Verbesserung der Verarbeitungseffizienz.
- Offline-StapelverarbeitungUnterstützt die Stapelverarbeitung von Audiodateien, läuft offline und schützt die Privatsphäre des Benutzers.
- Modularer AufbauBenutzer können Funktionsmodule nach ihren Bedürfnissen auswählen und anpassen.
- Flexible AnpassungUnterstützung der Benutzer bei der Anpassung und Erweiterung der Funktionalität entsprechend ihren spezifischen Bedürfnissen.
Hilfe verwenden
Ablauf der Installation
- Vorbereitung der Umwelt::
- Stellen Sie sicher, dass Sie Git und Python 3.8 oder höher installiert haben.
- Installieren Sie die erforderlichen Abhängigkeits-Bibliotheken:
pip install -r anforderungen.txt
.
- Klon-Lager::
git clone https://github.com/LiberSonora/LiberSonora.git
cd LiberSonora
- Konfiguration der Umgebung::
- Ändern Sie die Konfigurationsdatei nach Bedarf
config.yaml
Sie können die GPU-Beschleunigung, Sprachoptionen und andere Parameter einstellen.
- Ändern Sie die Konfigurationsdatei nach Bedarf
- laufendes Programm::
python main.py
Funktion Betriebsablauf
- Intelligente Extraktion von Untertiteln::
- Legt die Audiodatei in dem angegebenen Verzeichnis ab.
- Führen Sie das Modul zur Extraktion von Untertiteln aus:
python extract_subtitles.py --input_dir . /audio_files --output_dir . /Untertitel
. - Die extrahierten Untertiteldateien werden im Verzeichnis
. /Untertitel
Katalog.
- AI-Titelgenerierung::
- Führen Sie das Modul zur Titelerstellung aus:
python generate_titles.py --input_dir . /subtitles --output_dir . /Titel
. - Die erzeugte Header-Datei wird im Verzeichnis
. /Titel
Katalog.
- Führen Sie das Modul zur Titelerstellung aus:
- mehrsprachige Übersetzung::
- Führen Sie das Übersetzungsmodul aus:
python translate.py --input_dir . /subtitles --output_dir . /translated_subtitles ---target_lang zh
. - Die übersetzten Untertiteldateien werden im Verzeichnis
. /translated_subtitles
Katalog.
- Führen Sie das Übersetzungsmodul aus:
- Offline-Stapelverarbeitung::
- Platziert mehrere Audiodateien in das angegebene Verzeichnis.
- Führen Sie das Stapelverarbeitungsskript aus:
python batch_process.py --input_dir . /audio_files --output_dir . /verarbeitete_dateien
. - Die verarbeitete Datei wird im Verzeichnis
. /verarbeitete_dateien
Katalog.
- Modularer Aufbau und flexible Anpassung::
- Die Benutzer können den Code jedes Moduls entsprechend ihren Bedürfnissen ändern und erweitern.
- Siehe Projektdokumentation und Beispielcode für Funktionsanpassungen und Erweiterungen.