AI Personal Learning
und praktische Anleitung

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Allgemeine Einführung

ebook2audiobook ist ein leistungsstarkes Open-Source-Tool zur Umwandlung von eBooks in Hörbücher. Es ist in der Lage, mehrere Formate von eBooks in Hörbücher mit vollständigen Kapitelmarkierungen und Metadaten zu konvertieren. Das Tool verwendet Calibre für die Konvertierung von E-Book-Formaten, XTTSv2 von Coqui und Fairseq für hochwertige Text-to-Speech, Unterstützung für 1124 Sprachen, einschließlich Chinesisch, und bietet Klonen von Stimmen. Das Tool verfügt über eine intuitive Web-GUI, unterstützt CPU- und GPU-Betrieb und hat geringe Ressourcenanforderungen, da es nur 4 GB RAM zum Ausführen benötigt. Ob für den persönlichen Gebrauch oder die Batch-Konvertierung, es ermöglicht eine professionelle Hörbuchproduktion.

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen-1

Online-Erfahrung: https://huggingface.co/spaces/drewThomasson/ebook2audiobook


 

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen-1

 

Funktionsliste

  • Unterstützt die Konvertierung einer Vielzahl von E-Book-Formaten, darunter epub, pdf, mobi und mehr als 20 Formate
  • Automatische Erkennung und Beibehaltung der Kapitelstruktur von E-Books
  • Hochwertige Text-to-Speech-Funktion mit der fortschrittlichen XTTSv2-Engine
  • Unterstützt Text-to-Speech-Verarbeitung in 1124 Sprachen
  • Bietet eine Funktion zum Klonen von Stimmen, um die Lesestimme anzupassen
  • Ausgabe im m4b-Format mit vollständigen Kapitelinformationen und Metadaten
  • Bereitstellung einer grafischen Webschnittstelle, einfache und intuitive Bedienung
  • Unterstützt die Bereitstellung von Docker-Containern, um plattformübergreifende Kompatibilität zu gewährleisten
  • Optionale GPU-Beschleunigung für höhere Verarbeitungsgeschwindigkeiten
  • Unterstützung der Batch-Konvertierungsfunktion

 

Hilfe verwenden

Google Colab läuft kostenlos

1. die Modalitäten der Installation

1.1 Docker verwenden (empfohlen)

Docker ist die einfachste Art der Installation und gewährleistet eine einheitliche und stabile Laufzeitumgebung.

CPU-Version Laufbefehl:

docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

GPU-Version des Befehls run (erfordert eine NVIDIA-Grafikkarte):

docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

1.2 Lokale Installation

  1. Klonen Sie das Code-Repository:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
  1. Installieren Sie die Abhängigkeit:
  • Python 3.x
  • Calibre (Werkzeug zur Konvertierung von E-Büchern)
  • FFmpeg (Werkzeug zur Audiobearbeitung)
  • Python-Pakete: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm

2. die Verwendungsmodalitäten

2.1 Verwendung der grafischen Schnittstelle

  1. Nachdem Sie das Programm gestartet haben, besuchen Sie über Ihren Browser http://localhost:7860
  2. Hochladen von eBook-Dateien in der Weboberfläche
  3. Auswahl der Zielsprache und der Tondatei (optional)
  4. Zum Starten der Konvertierung anklicken

2.2 Verwendung der Kommandozeile

Grundlegendes Befehlsformat:

python app.py --headless --ebook  --language  -voice

3. eine Beschreibung der wichtigsten Parameter

  • --ebook: Pfad zur ebook-Datei (erforderlich)
  • --language: Code der Zielsprache (optional, standardmäßig Englisch)
  • --voice: Pfad zur Sprachdatei (optional, für das Klonen von Stimmen)
  • --device: Auswahl, ob CPU oder GPU verwendet werden soll
  • --speed: Einstellung der Sprachgeschwindigkeit (Standardwert 1.0)

4. unterstützte Dateiformate

Eingabeformat:

  • epub (empfohlen, am besten unterstützt)
  • pdf
  • mobi
  • txt
  • Andere Formate: html, rtf, chm, lit, pdb, fb2, odt, etc.

Ausgabeformat:

  • m4b (Audioformat mit Kapitelmarkierungen und Metadaten)

5. erweiterte Funktionen

5.1 Klonen von Sprache

  1. Vorbereiten von 16khz- oder 24khz-Ziel-Sample-Dateien
  2. Geben Sie den Pfad der Tondatei während der Konvertierung an
  3. Das System liest mit der Zielstimme laut vor

5.2 Batch-Konvertierung

  1. Erstellen Sie das Verzeichnis input-folder und legen Sie die eBook-Datei darin ab.
  2. Verzeichnis für die Ausgabe von Hörbüchern erstellen
  3. Verarbeitung mehrerer Dateien mit dem Befehl Batch-Konvertierung

6. die Lösung gemeinsamer Probleme

  1. Langsame CPU-Umwandlungsgeschwindigkeit
  • Lösung: Verwenden Sie GPU-Beschleunigung oder nutzen Sie Cloud-Dienste
  • Empfohlen: Hugging Face Space oder Google Colab verwenden
  1. Abhängige Installationsprobleme
  • Empfohlene Docker-Version zur Vermeidung von Abhängigkeitsproblemen
  • Systemkompatibilität und abhängige Versionen prüfen
  1. Probleme mit der Audiobeschneidung
  • Formatierung des eingegebenen Textes prüfen
  • Einstellen der Parameter für die Textsegmentierung
  • Melden Sie spezifische Sprachprobleme, um die Unterstützung zu verbessern
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)