ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

82.9K 00

Introducción general

ebook2audiobook es una potente herramienta de conversión de ebooks a audiolibros de código abierto. Es capaz de convertir múltiples formatos de libros electrónicos en audiolibros con marcadores de capítulos completos y metadatos. La herramienta utiliza Calibre para la conversión de formatos de libros electrónicos, utilizando XTTSv2 de Coqui y Fairseq para la conversión de texto a voz de alta calidad, soporta 1124 idiomas, incluido el chino, y proporciona clonación de voz. La herramienta viene con una GUI web intuitiva, soporta el funcionamiento con CPU y GPU, y tiene bajos requerimientos de recursos, necesitando sólo 4GB de RAM para funcionar. Ya sea para uso personal o para conversión por lotes, permite la producción de audiolibros de calidad profesional.

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

Experiencia en línea: https://huggingface.co/spaces/drewThomasson/ebook2audiobook

Lista de funciones

Soporta una variedad de formatos de conversión de libros electrónicos, incluyendo epub, pdf, mobi y más de 20 formatos
Reconocimiento automático y conservación de la estructura de los capítulos de los libros electrónicos
Texto a voz de alta calidad con el avanzado motor XTTSv2
Admite el procesamiento de texto a voz en 1124 idiomas
Proporcionar la función de clonación de voz, puede personalizar la voz de lectura
Salida en formato m4b con información completa de los capítulos y metadatos
Proporcionan una interfaz gráfica web, de funcionamiento sencillo e intuitivo
Admite la implantación de contenedores Docker para garantizar la compatibilidad entre plataformas.
Aceleración GPU opcional para aumentar la velocidad de procesamiento
Función de conversión por lotes

Utilizar la ayuda

Google Colab es gratuito

1. Modalidades de instalación

1.1 Uso de Docker (recomendado)

Docker es la forma más fácil de instalar y garantiza un entorno de ejecución uniforme y estable.

Comando de ejecución de la versión de CPU:

docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

Versión para GPU del comando de ejecución (requiere una tarjeta gráfica NVIDIA):

docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

1.2 Instalación local

Clonar el repositorio de código:

git clone https://github.com/DrewThomasson/ebook2audiobook.git

Instale la dependencia:

Python 3.x
Calibre (herramienta de conversión de libros electrónicos)
FFmpeg (herramienta de procesamiento de audio)
Paquetes Python: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm

2. Modalidades de utilización

2.1 Uso de la interfaz gráfica

Tras iniciar el programa, visite http://localhost:7860 a través de su navegador
Cargar archivos de libros electrónicos en la interfaz web
Selección de la lengua de destino y del archivo de sonido (opcional)
Haga clic para iniciar la conversión

2.2 Uso de la línea de comandos

Formato básico del comando:

python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>

3. Descripción de parámetros importantes

--ebook: ruta del archivo del libro electrónico (obligatorio)
--language: código del idioma de destino (opcional, por defecto inglés)
--voice: ruta del archivo de voz (opcional, para clonar voces)
--device: elige si utilizar la CPU o la GPU
--speed: ajuste de la velocidad de la voz (por defecto 1.0)

4. Formatos de archivo compatibles

Formato de entrada:

epub (recomendado, mejor soportado)
pdf
mobi
txt
Otros formatos: html, rtf, chm, lit, pdb, fb2, odt, etc.

Formato de salida:

m4b (formato de audio con marcadores de capítulos y metadatos)

5. Funciones avanzadas

5.1 Clonación del habla

Prepara archivos de muestra de sonido de destino de 16khz o 24khz
Especifica la ruta del archivo de sonido durante la conversión
El sistema leerá en voz alta utilizando la voz objetivo

5.2 Conversión por lotes

Cree el directorio input-folder y coloque en él el archivo eBook.
Crear directorio de salida de audiolibros
Procesamiento de varios archivos con el comando de conversión por lotes

6. Resolución de problemas comunes

Lenta velocidad de conversión de la CPU

Solución: utilizar aceleración por GPU o servicios en la nube
Recomendado: Utilizar Hugging Face Space o Google Colab

Problemas de instalación dependientes

Versión de Docker recomendada para evitar problemas de dependencia
Compruebe la compatibilidad del sistema y las versiones dependientes

Problemas de truncamiento de audio

Comprobar el formato del texto introducido
Ajuste de los parámetros de segmentación del texto
Informar de problemas lingüísticos específicos para mejorar la asistencia

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Ajelix: herramientas inteligentes de análisis de datos en Excel, acceso a diversas fuentes de datos, IA para generar varios tipos de gráficos de análisis visual.

Últimos recursos sobre IA # Análisis de datos de IA

hace 1 año

061.1K

Clevrr Computer：使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: Automatización de la inteligencia de manipulación del escritorio con la biblioteca PyAutoGUI

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Inteligencia de automatización de escritorio

hace 1 año

056.2K

Traycer: asistente de programación de IA específico para desarrolladores con planificación de tareas y revisión de código en tiempo real.

Últimos recursos sobre IA # Programación de IA

hace 1 año

072.5K

Gauth（Gauthmath）：使用AI解决作业问题，提供详细解答，字节旗下海外作业辅导APP

Gauth (Gauthmath): utiliza IA para resolver problemas de deberes y ofrecer respuestas detalladas, la aplicación de ayuda para los deberes en el extranjero de Byte.

Últimos recursos sobre IA # AI Herramientas educativas

hace 9 meses

069.1K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general

Lista de funciones

Utilizar la ayuda

1. Modalidades de instalación

1.1 Uso de Docker (recomendado)

1.2 Instalación local

2. Modalidades de utilización

2.1 Uso de la interfaz gráfica

2.2 Uso de la línea de comandos

3. Descripción de parámetros importantes

4. Formatos de archivo compatibles

5. Funciones avanzadas

5.1 Clonación del habla

5.2 Conversión por lotes

6. Resolución de problemas comunes

Memary: un proyecto de código abierto para mejorar la memoria a largo plazo del Agente mediante grafos de conocimiento

MagicMirror: el cliente nativo ligero para cambios de cara, pelo y ropa con un solo clic.

Artículos relacionados

Ajelix: herramientas inteligentes de análisis de datos en Excel, acceso a diversas fuentes de datos, IA para generar varios tipos de gráficos de análisis visual.

Clevrr Computer: Automatización de la inteligencia de manipulación del escritorio con la biblioteca PyAutoGUI

Traycer: asistente de programación de IA específico para desarrolladores con planificación de tareas y revisión de código en tiempo real.

Gauth (Gauthmath): utiliza IA para resolver problemas de deberes y ofrecer respuestas detalladas, la aplicación de ayuda para los deberes en el extranjero de Byte.

Sin comentarios

Últimas colecciones

Últimos artículos

ebook2audiobook: convierte ebooks en audiolibros, herramienta de código abierto con soporte multilingüe y clonación de voz.

Introducción general

Lista de funciones

Utilizar la ayuda

1. Modalidades de instalación

1.1 Uso de Docker (recomendado)

1.2 Instalación local

2. Modalidades de utilización

2.1 Uso de la interfaz gráfica

2.2 Uso de la línea de comandos

3. Descripción de parámetros importantes

4. Formatos de archivo compatibles

5. Funciones avanzadas

5.1 Clonación del habla

5.2 Conversión por lotes

6. Resolución de problemas comunes

Memary: un proyecto de código abierto para mejorar la memoria a largo plazo del Agente mediante grafos de conocimiento

MagicMirror: el cliente nativo ligero para cambios de cara, pelo y ropa con un solo clic.

Artículos relacionados

Ajelix: herramientas inteligentes de análisis de datos en Excel, acceso a diversas fuentes de datos, IA para generar varios tipos de gráficos de análisis visual.

Clevrr Computer: Automatización de la inteligencia de manipulación del escritorio con la biblioteca PyAutoGUI

Traycer: asistente de programación de IA específico para desarrolladores con planificación de tareas y revisión de código en tiempo real.

Gauth (Gauthmath): utiliza IA para resolver problemas de deberes y ofrecer respuestas detalladas, la aplicación de ayuda para los deberes en el extranjero de Byte.

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos