ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general

ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir múltiples formatos de libros electrónicos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de libros electrónicos, utilizando XTTSv2 de Coqui y Fairseq para la conversión de texto a voz de alta calidad, soporta 1124 idiomas, incluido el chino, y proporciona clonación de voz. La herramienta viene con una GUI web intuitiva, soporta el funcionamiento con CPU y GPU, y tiene bajos requerimientos de recursos, necesitando sólo 4GB de RAM para funcionar. Ya sea para uso personal o para conversión por lotes, permite la producción de audiolibros de calidad profesional.

ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

Experiencia en línea: https://huggingface.co/spaces/drewThomasson/ebook2audiobook

 

ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

 

Lista de funciones

  • Soporta una variedad de formatos de conversión de libros electrónicos, incluyendo epub, pdf, mobi y más de 20 formatos
  • Reconocimiento automático y conservación de la estructura de los capítulos de los libros electrónicos
  • Texto a voz de alta calidad con el avanzado motor XTTSv2
  • Admite el procesamiento de texto a voz en 1124 idiomas
  • Proporcionar la función de clonación de voz, puede personalizar la voz de lectura
  • Salida en formato m4b con información completa de los capítulos y metadatos
  • Proporcionan una interfaz gráfica web, de funcionamiento sencillo e intuitivo
  • Admite la implantación de contenedores Docker para garantizar la compatibilidad entre plataformas.
  • Aceleración GPU opcional para aumentar la velocidad de procesamiento
  • Función de conversión por lotes

 

Utilizar la ayuda

Google Colab es gratuito

1. Modalidades de instalación

1.1 Uso de Docker (recomendado)

Docker es la forma más fácil de instalar y garantiza un entorno de ejecución uniforme y estable.

Comando de ejecución de la versión de CPU:

docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

Versión para GPU del comando de ejecución (requiere una tarjeta gráfica NVIDIA):

docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

1.2 Instalación local

  1. Clonar el repositorio de código:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
  1. Instale la dependencia:
  • Python 3.x
  • Calibre (herramienta de conversión de libros electrónicos)
  • FFmpeg (herramienta de procesamiento de audio)
  • Paquetes Python: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm

2. Modalidades de utilización

2.1 Uso de la interfaz gráfica

  1. Tras iniciar el programa, visite http://localhost:7860 a través de su navegador
  2. Cargar archivos de libros electrónicos en la interfaz web
  3. Selección de la lengua de destino y del archivo de sonido (opcional)
  4. Haga clic para iniciar la conversión

2.2 Uso de la línea de comandos

Formato básico del comando:

python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>

3. Descripción de parámetros importantes

  • --ebook: ruta del archivo del libro electrónico (obligatorio)
  • --language: código del idioma de destino (opcional, por defecto inglés)
  • --voice: ruta del archivo de voz (opcional, para clonar voces)
  • --device: elige si utilizar la CPU o la GPU
  • --speed: ajuste de la velocidad de la voz (por defecto 1.0)

4. Formatos de archivo compatibles

Formato de entrada:

  • epub (recomendado, mejor soportado)
  • pdf
  • mobi
  • txt
  • Otros formatos: html, rtf, chm, lit, pdb, fb2, odt, etc.

Formato de salida:

  • m4b (formato de audio con marcadores de capítulos y metadatos)

5. Funciones avanzadas

5.1 Clonación del habla

  1. Prepara archivos de muestra de sonido de destino de 16khz o 24khz
  2. Especifica la ruta del archivo de sonido durante la conversión
  3. El sistema leerá en voz alta utilizando la voz objetivo

5.2 Conversión por lotes

  1. Cree el directorio input-folder y coloque en él el archivo eBook.
  2. Crear directorio de salida de audiolibros
  3. Procesamiento de varios archivos con el comando de conversión por lotes

6. Resolución de problemas comunes

  1. Lenta velocidad de conversión de la CPU
  • Solución: utilizar aceleración por GPU o servicios en la nube
  • Recomendado: Utilizar Hugging Face Space o Google Colab
  1. Problemas de instalación dependientes
  • Versión de Docker recomendada para evitar problemas de dependencia
  • Compruebe la compatibilidad del sistema y las versiones dependientes
  1. Problemas de truncamiento de audio
  • Comprobar el formato del texto introducido
  • Ajuste de los parámetros de segmentación del texto
  • Informar de problemas lingüísticos específicos para mejorar la asistencia
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...