ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.
Últimos recursos sobre IAPublicado hace 7 meses Círculo de intercambio de inteligencia artificial 4K 00
Introducción general
ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir múltiples formatos de libros electrónicos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de libros electrónicos, utilizando XTTSv2 de Coqui y Fairseq para la conversión de texto a voz de alta calidad, soporta 1124 idiomas, incluido el chino, y proporciona clonación de voz. La herramienta viene con una GUI web intuitiva, soporta el funcionamiento con CPU y GPU, y tiene bajos requerimientos de recursos, necesitando sólo 4GB de RAM para funcionar. Ya sea para uso personal o para conversión por lotes, permite la producción de audiolibros de calidad profesional.

Experiencia en línea: https://huggingface.co/spaces/drewThomasson/ebook2audiobook

Lista de funciones
- Soporta una variedad de formatos de conversión de libros electrónicos, incluyendo epub, pdf, mobi y más de 20 formatos
- Reconocimiento automático y conservación de la estructura de los capítulos de los libros electrónicos
- Texto a voz de alta calidad con el avanzado motor XTTSv2
- Admite el procesamiento de texto a voz en 1124 idiomas
- Proporcionar la función de clonación de voz, puede personalizar la voz de lectura
- Salida en formato m4b con información completa de los capítulos y metadatos
- Proporcionan una interfaz gráfica web, de funcionamiento sencillo e intuitivo
- Admite la implantación de contenedores Docker para garantizar la compatibilidad entre plataformas.
- Aceleración GPU opcional para aumentar la velocidad de procesamiento
- Función de conversión por lotes
Utilizar la ayuda
1. Modalidades de instalación
1.1 Uso de Docker (recomendado)
Docker es la forma más fácil de instalar y garantiza un entorno de ejecución uniforme y estable.
Comando de ejecución de la versión de CPU:
docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
Versión para GPU del comando de ejecución (requiere una tarjeta gráfica NVIDIA):
docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
1.2 Instalación local
- Clonar el repositorio de código:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
- Instale la dependencia:
- Python 3.x
- Calibre (herramienta de conversión de libros electrónicos)
- FFmpeg (herramienta de procesamiento de audio)
- Paquetes Python: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm
2. Modalidades de utilización
2.1 Uso de la interfaz gráfica
- Tras iniciar el programa, visite http://localhost:7860 a través de su navegador
- Cargar archivos de libros electrónicos en la interfaz web
- Selección de la lengua de destino y del archivo de sonido (opcional)
- Haga clic para iniciar la conversión
2.2 Uso de la línea de comandos
Formato básico del comando:
python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>
3. Descripción de parámetros importantes
- --ebook: ruta del archivo del libro electrónico (obligatorio)
- --language: código del idioma de destino (opcional, por defecto inglés)
- --voice: ruta del archivo de voz (opcional, para clonar voces)
- --device: elige si utilizar la CPU o la GPU
- --speed: ajuste de la velocidad de la voz (por defecto 1.0)
4. Formatos de archivo compatibles
Formato de entrada:
- epub (recomendado, mejor soportado)
- mobi
- txt
- Otros formatos: html, rtf, chm, lit, pdb, fb2, odt, etc.
Formato de salida:
- m4b (formato de audio con marcadores de capítulos y metadatos)
5. Funciones avanzadas
5.1 Clonación del habla
- Prepara archivos de muestra de sonido de destino de 16khz o 24khz
- Especifica la ruta del archivo de sonido durante la conversión
- El sistema leerá en voz alta utilizando la voz objetivo
5.2 Conversión por lotes
- Cree el directorio input-folder y coloque en él el archivo eBook.
- Crear directorio de salida de audiolibros
- Procesamiento de varios archivos con el comando de conversión por lotes
6. Resolución de problemas comunes
- Lenta velocidad de conversión de la CPU
- Solución: utilizar aceleración por GPU o servicios en la nube
- Recomendado: Utilizar Hugging Face Space o Google Colab
- Problemas de instalación dependientes
- Versión de Docker recomendada para evitar problemas de dependencia
- Compruebe la compatibilidad del sistema y las versiones dependientes
- Problemas de truncamiento de audio
- Comprobar el formato del texto introducido
- Ajuste de los parámetros de segmentación del texto
- Informar de problemas lingüísticos específicos para mejorar la asistencia
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...