ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Neueste AI-RessourcenGeschrieben vor 8 Monaten AI-Austauschkreis

15.6K 00

Allgemeine Einführung

ebook2audiobook ist ein leistungsstarkes Open-Source-Tool zur Umwandlung von eBooks in Hörbücher. Es ist in der Lage, mehrere Formate von eBooks in Hörbücher mit vollständigen Kapitelmarkierungen und Metadaten zu konvertieren. Das Tool verwendet Calibre für die Konvertierung von E-Book-Formaten, XTTSv2 von Coqui und Fairseq für hochwertige Text-to-Speech, Unterstützung für 1124 Sprachen, einschließlich Chinesisch, und bietet Klonen von Stimmen. Das Tool verfügt über eine intuitive Web-GUI, unterstützt CPU- und GPU-Betrieb und hat geringe Ressourcenanforderungen, da es nur 4 GB RAM zum Ausführen benötigt. Ob für den persönlichen Gebrauch oder die Batch-Konvertierung, es ermöglicht eine professionelle Hörbuchproduktion.

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

Online-Erfahrung: https://huggingface.co/spaces/drewThomasson/ebook2audiobook

Funktionsliste

Unterstützt die Konvertierung einer Vielzahl von E-Book-Formaten, darunter epub, pdf, mobi und mehr als 20 Formate
Automatische Erkennung und Beibehaltung der Kapitelstruktur von E-Books
Hochwertige Text-to-Speech-Funktion mit der fortschrittlichen XTTSv2-Engine
Unterstützt Text-to-Speech-Verarbeitung in 1124 Sprachen
Bietet eine Funktion zum Klonen von Stimmen, um die Lesestimme anzupassen
Ausgabe im m4b-Format mit vollständigen Kapitelinformationen und Metadaten
Bereitstellung einer grafischen Webschnittstelle, einfache und intuitive Bedienung
Unterstützt die Bereitstellung von Docker-Containern, um plattformübergreifende Kompatibilität zu gewährleisten
Optionale GPU-Beschleunigung für höhere Verarbeitungsgeschwindigkeiten
Unterstützung der Batch-Konvertierungsfunktion

Hilfe verwenden

Google Colab läuft kostenlos

1. die Modalitäten der Installation

1.1 Docker verwenden (empfohlen)

Docker ist die einfachste Art der Installation und gewährleistet eine einheitliche und stabile Laufzeitumgebung.

CPU-Version Laufbefehl:

docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

GPU-Version des Befehls run (erfordert eine NVIDIA-Grafikkarte):

docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

1.2 Lokale Installation

Klonen Sie das Code-Repository:

git clone https://github.com/DrewThomasson/ebook2audiobook.git

Installieren Sie die Abhängigkeit:

Python 3.x
Calibre (Werkzeug zur Konvertierung von E-Büchern)
FFmpeg (Werkzeug zur Audiobearbeitung)
Python-Pakete: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm

2. die Verwendungsmodalitäten

2.1 Verwendung der grafischen Schnittstelle

Nachdem Sie das Programm gestartet haben, besuchen Sie über Ihren Browser http://localhost:7860
Hochladen von eBook-Dateien in der Weboberfläche
Auswahl der Zielsprache und der Tondatei (optional)
Zum Starten der Konvertierung anklicken

2.2 Verwendung der Kommandozeile

Grundlegendes Befehlsformat:

python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>

3. eine Beschreibung der wichtigsten Parameter

--ebook: Pfad zur ebook-Datei (erforderlich)
--language: Code der Zielsprache (optional, standardmäßig Englisch)
--voice: Pfad zur Sprachdatei (optional, für das Klonen von Stimmen)
--device: Auswahl, ob CPU oder GPU verwendet werden soll
--speed: Einstellung der Sprachgeschwindigkeit (Standardwert 1.0)

4. unterstützte Dateiformate

Eingabeformat:

epub (empfohlen, am besten unterstützt)
pdf
mobi
txt
Andere Formate: html, rtf, chm, lit, pdb, fb2, odt, etc.

Ausgabeformat:

m4b (Audioformat mit Kapitelmarkierungen und Metadaten)

5. erweiterte Funktionen

5.1 Klonen von Sprache

Vorbereiten von 16khz- oder 24khz-Ziel-Sample-Dateien
Geben Sie den Pfad der Tondatei während der Konvertierung an
Das System liest mit der Zielstimme laut vor

5.2 Batch-Konvertierung

Erstellen Sie das Verzeichnis input-folder und legen Sie die eBook-Datei darin ab.
Verzeichnis für die Ausgabe von Hörbüchern erstellen
Verarbeitung mehrerer Dateien mit dem Befehl Batch-Konvertierung

6. die Lösung gemeinsamer Probleme

Langsame CPU-Umwandlungsgeschwindigkeit

Lösung: Verwenden Sie GPU-Beschleunigung oder nutzen Sie Cloud-Dienste
Empfohlen: Hugging Face Space oder Google Colab verwenden

Abhängige Installationsprobleme

Empfohlene Docker-Version zur Vermeidung von Abhängigkeitsproblemen
Systemkompatibilität und abhängige Versionen prüfen

Probleme mit der Audiobeschneidung

Formatierung des eingegebenen Textes prüfen
Einstellen der Parameter für die Textsegmentierung
Melden Sie spezifische Sprachprobleme, um die Unterstützung zu verbessern

Artikel Copyright AI-Austauschkreis Alle, bitte nicht ohne Erlaubnis vervielfältigen.

Cursor: ein Code-Editor für die Co-Programmierung mit KI

Neueste AI-Ressourcen # AI IDE # AI-Programmierung

vor 7 Monaten

020.7K

Kolors Virtual Try On：高效的虚拟试穿/模特换装，文本到图像生成模型

Kolors Virtual Try On: Effiziente virtuelle Anprobe/Model Dressing, Text-to-Image Generation Modelle

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Gesichtstausch und Verkleidung

vor 9 Monaten

015K

VITA: Open Source Multimodale Großsprachmodelle für visuelle und sprachliche Interaktion in Echtzeit

Neueste AI-Ressourcen # AI Java Open Source Projekt # Multimodale interaktive Echtzeit-Produkte

vor 8 Monaten

019.8K

Swarms: Multi-Intelligenz-Orchestrierungsrahmen, Produktionswerkzeug für Unternehmen

Neueste AI-Ressourcen # AI Java Open Source Projekt # Entwicklungsrahmen für intelligente Körper

vor 9 Monaten

013.5K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

1. die Modalitäten der Installation

1.1 Docker verwenden (empfohlen)

1.2 Lokale Installation

2. die Verwendungsmodalitäten

2.1 Verwendung der grafischen Schnittstelle

2.2 Verwendung der Kommandozeile

3. eine Beschreibung der wichtigsten Parameter

4. unterstützte Dateiformate

5. erweiterte Funktionen

5.1 Klonen von Sprache

5.2 Batch-Konvertierung

6. die Lösung gemeinsamer Probleme

Memary: ein Open-Source-Projekt zur Verbesserung des Langzeitgedächtnisses von Agenten mithilfe von Wissensgraphen

MagicMirror: der leichtgewichtige native Client für KI-Gesichts-, Haar- und Outfitänderungen mit einem Klick

Ähnliche Artikel

Cursor: ein Code-Editor für die Co-Programmierung mit KI

Kolors Virtual Try On: Effiziente virtuelle Anprobe/Model Dressing, Text-to-Image Generation Modelle

VITA: Open Source Multimodale Großsprachmodelle für visuelle und sprachliche Interaktion in Echtzeit

Swarms: Multi-Intelligenz-Orchestrierungsrahmen, Produktionswerkzeug für Unternehmen

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

ebook2audiobook: ebooks in Hörbücher umwandeln, Open-Source-Tool mit mehrsprachiger Unterstützung und Stimmenklonen

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

1. die Modalitäten der Installation

1.1 Docker verwenden (empfohlen)

1.2 Lokale Installation

2. die Verwendungsmodalitäten

2.1 Verwendung der grafischen Schnittstelle

2.2 Verwendung der Kommandozeile

3. eine Beschreibung der wichtigsten Parameter

4. unterstützte Dateiformate

5. erweiterte Funktionen

5.1 Klonen von Sprache

5.2 Batch-Konvertierung

6. die Lösung gemeinsamer Probleme

Memary: ein Open-Source-Projekt zur Verbesserung des Langzeitgedächtnisses von Agenten mithilfe von Wissensgraphen

MagicMirror: der leichtgewichtige native Client für KI-Gesichts-, Haar- und Outfitänderungen mit einem Klick

Ähnliche Artikel

Cursor: ein Code-Editor für die Co-Programmierung mit KI

Kolors Virtual Try On: Effiziente virtuelle Anprobe/Model Dressing, Text-to-Image Generation Modelle

VITA: Open Source Multimodale Großsprachmodelle für visuelle und sprachliche Interaktion in Echtzeit

Swarms: Multi-Intelligenz-Orchestrierungsrahmen, Produktionswerkzeug für Unternehmen

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel