ebook2audiobook : convertir des livres électroniques en livres audio, outil open source avec support multilingue et clonage de voix
Introduction générale
ebook2audiobook est un puissant outil open source de conversion de livres électroniques en livres audio. Il est capable de convertir plusieurs formats de livres électroniques en livres audio avec des marqueurs de chapitre et des métadonnées complètes. L'outil utilise Calibre pour la conversion du format e-book, utilise Coqui's XTTSv2 et Fairseq pour la synthèse vocale de haute qualité, supporte 1124 langues, y compris le chinois, et permet le clonage de la voix. L'outil est livré avec une interface graphique web intuitive, prend en charge le fonctionnement du CPU et du GPU, et a de faibles exigences en matière de ressources, ne nécessitant que 4 Go de RAM pour fonctionner. Qu'il s'agisse d'une utilisation personnelle ou d'une conversion par lots, il permet de produire des livres audio de qualité professionnelle.

Expérience en ligne : https://huggingface.co/spaces/drewThomasson/ebook2audiobook

Liste des fonctions
- Prise en charge de la conversion de divers formats de livres électroniques, y compris epub, pdf, mobi et plus de 20 formats.
- Reconnaissance automatique et conservation de la structure des chapitres de livres électroniques
- Synthèse vocale de haute qualité grâce au moteur avancé XTTSv2
- Prise en charge du traitement de la synthèse vocale dans 1124 langues
- La fonction de clonage de la voix permet de personnaliser la voix de lecture.
- Sortie au format m4b avec informations complètes sur les chapitres et métadonnées
- Interface graphique web, fonctionnement simple et intuitif
- Prise en charge du déploiement de conteneurs Docker pour assurer une compatibilité multiplateforme.
- Accélération GPU en option pour des vitesses de traitement accrues
- Prise en charge de la fonction de conversion par lots
Utiliser l'aide
Google Colab fonctionne gratuitement
1. les modalités d'installation
1.1 Utiliser Docker (recommandé)
Docker est la méthode d'installation la plus simple, garantissant un environnement d'exécution uniforme et stable.
Commande d'exécution de la version de l'unité centrale :
docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
Version GPU de la commande run (nécessite une carte graphique NVIDIA) :
docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
1.2 Installation locale
- Cloner le dépôt de code :
git clone https://github.com/DrewThomasson/ebook2audiobook.git
- Installer la dépendance :
- Python 3.x
- Calibre (outil de conversion de livres électroniques)
- FFmpeg (outil de traitement audio)
- Paquets Python : tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm
2. les méthodes d'utilisation
2.1 Utilisation de l'interface graphique
- Après avoir lancé le programme, visitez http://localhost:7860 via votre navigateur
- Téléchargement de fichiers de livres électroniques dans l'interface web
- Sélection de la langue cible et du fichier son (facultatif)
- Cliquez pour lancer la conversion
2.2 Utilisation de la ligne de commande
Format de base de la commande :
python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>
3. description des paramètres importants
- --ebook : chemin d'accès au fichier du livre électronique (obligatoire)
- --language : code de la langue cible (facultatif, anglais par défaut)
- --voice : chemin d'accès au fichier vocal (facultatif, pour le clonage de la voix)
- --device : choisir d'utiliser le CPU ou le GPU
- --vitesse : ajustement de la vitesse de la voix (par défaut 1.0)
4) Formats de fichiers pris en charge
Format d'entrée :
- epub (recommandé, meilleur support)
- mobi
- txt
- Autres formats : html, rtf, chm, lit, pdb, fb2, odt, etc.
Format de sortie :
- m4b (format audio avec marqueurs de chapitre et métadonnées)
5. fonctions avancées
5.1 Clonage du discours
- Préparer des fichiers d'échantillons sonores cibles de 16 ou 24 kHz
- Spécifier le chemin d'accès au fichier son lors de la conversion
- Le système lira à haute voix en utilisant la voix cible
5.2 Conversion par lots
- Créez le répertoire input-folder et placez-y le fichier eBook.
- Créer un répertoire de sortie pour les livres audio
- Traitement de plusieurs fichiers avec la commande de conversion par lots
6. la résolution des problèmes courants
- Vitesse de conversion lente de l'unité centrale
- Solution : utiliser l'accélération GPU ou les services en nuage
- Recommandé : Utiliser Hugging Face Space ou Google Colab
- Problèmes d'installation dépendants
- Version de Docker recommandée pour éviter les problèmes de dépendance
- Vérifier la compatibilité du système et les versions dépendantes
- Problèmes de troncature audio
- Vérifier le formatage du texte d'entrée
- Réglage des paramètres de segmentation du texte
- Signaler les problèmes linguistiques spécifiques afin d'améliorer le soutien
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...