Allgemeine Einführung
ebook2audiobook ist ein leistungsstarkes Open-Source-Tool zur Umwandlung von eBooks in Hörbücher. Es ist in der Lage, mehrere Formate von eBooks in Hörbücher mit vollständigen Kapitelmarkierungen und Metadaten zu konvertieren. Das Tool verwendet Calibre für die Konvertierung von E-Book-Formaten, XTTSv2 von Coqui und Fairseq für hochwertige Text-to-Speech, Unterstützung für 1124 Sprachen, einschließlich Chinesisch, und bietet Klonen von Stimmen. Das Tool verfügt über eine intuitive Web-GUI, unterstützt CPU- und GPU-Betrieb und hat geringe Ressourcenanforderungen, da es nur 4 GB RAM zum Ausführen benötigt. Ob für den persönlichen Gebrauch oder die Batch-Konvertierung, es ermöglicht eine professionelle Hörbuchproduktion.
Funktionsliste
- Unterstützt die Konvertierung einer Vielzahl von E-Book-Formaten, darunter epub, pdf, mobi und mehr als 20 Formate
- Automatische Erkennung und Beibehaltung der Kapitelstruktur von E-Books
- Hochwertige Text-to-Speech-Funktion mit der fortschrittlichen XTTSv2-Engine
- Unterstützt Text-to-Speech-Verarbeitung in 1124 Sprachen
- Bietet eine Funktion zum Klonen von Stimmen, um die Lesestimme anzupassen
- Ausgabe im m4b-Format mit vollständigen Kapitelinformationen und Metadaten
- Bereitstellung einer grafischen Webschnittstelle, einfache und intuitive Bedienung
- Unterstützt die Bereitstellung von Docker-Containern, um plattformübergreifende Kompatibilität zu gewährleisten
- Optionale GPU-Beschleunigung für höhere Verarbeitungsgeschwindigkeiten
- Unterstützung der Batch-Konvertierungsfunktion
Hilfe verwenden
1. die Modalitäten der Installation
1.1 Docker verwenden (empfohlen)
Docker ist die einfachste Art der Installation und gewährleistet eine einheitliche und stabile Laufzeitumgebung.
CPU-Version Laufbefehl:
docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
GPU-Version des Befehls run (erfordert eine NVIDIA-Grafikkarte):
docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
1.2 Lokale Installation
- Klonen Sie das Code-Repository:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
- Installieren Sie die Abhängigkeit:
- Python 3.x
- Calibre (Werkzeug zur Konvertierung von E-Büchern)
- FFmpeg (Werkzeug zur Audiobearbeitung)
- Python-Pakete: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm
2. die Verwendungsmodalitäten
2.1 Verwendung der grafischen Schnittstelle
- Nachdem Sie das Programm gestartet haben, besuchen Sie über Ihren Browser http://localhost:7860
- Hochladen von eBook-Dateien in der Weboberfläche
- Auswahl der Zielsprache und der Tondatei (optional)
- Zum Starten der Konvertierung anklicken
2.2 Verwendung der Kommandozeile
Grundlegendes Befehlsformat:
python app.py --headless --ebook --language -voice
3. eine Beschreibung der wichtigsten Parameter
- --ebook: Pfad zur ebook-Datei (erforderlich)
- --language: Code der Zielsprache (optional, standardmäßig Englisch)
- --voice: Pfad zur Sprachdatei (optional, für das Klonen von Stimmen)
- --device: Auswahl, ob CPU oder GPU verwendet werden soll
- --speed: Einstellung der Sprachgeschwindigkeit (Standardwert 1.0)
4. unterstützte Dateiformate
Eingabeformat:
- epub (empfohlen, am besten unterstützt)
- mobi
- txt
- Andere Formate: html, rtf, chm, lit, pdb, fb2, odt, etc.
Ausgabeformat:
- m4b (Audioformat mit Kapitelmarkierungen und Metadaten)
5. erweiterte Funktionen
5.1 Klonen von Sprache
- Vorbereiten von 16khz- oder 24khz-Ziel-Sample-Dateien
- Geben Sie den Pfad der Tondatei während der Konvertierung an
- Das System liest mit der Zielstimme laut vor
5.2 Batch-Konvertierung
- Erstellen Sie das Verzeichnis input-folder und legen Sie die eBook-Datei darin ab.
- Verzeichnis für die Ausgabe von Hörbüchern erstellen
- Verarbeitung mehrerer Dateien mit dem Befehl Batch-Konvertierung
6. die Lösung gemeinsamer Probleme
- Langsame CPU-Umwandlungsgeschwindigkeit
- Lösung: Verwenden Sie GPU-Beschleunigung oder nutzen Sie Cloud-Dienste
- Empfohlen: Hugging Face Space oder Google Colab verwenden
- Abhängige Installationsprobleme
- Empfohlene Docker-Version zur Vermeidung von Abhängigkeitsproblemen
- Systemkompatibilität und abhängige Versionen prüfen
- Probleme mit der Audiobeschneidung
- Formatierung des eingegebenen Textes prüfen
- Einstellen der Parameter für die Textsegmentierung
- Melden Sie spezifische Sprachprobleme, um die Unterstützung zu verbessern