ebook2audiobook: конвертация электронных книг в аудиокниги, инструмент с открытым исходным кодом, многоязыковой поддержкой и клонированием голоса
Общее введение
ebook2audiobook - это мощный инструмент для преобразования электронных книг в аудиокниги с открытым исходным кодом. Она способна конвертировать электронные книги различных форматов в аудиокниги с полными маркерами глав и метаданными. Инструмент использует Calibre для преобразования форматов электронных книг, XTTSv2 и Fairseq от Coqui для высококачественного преобразования текста в речь, поддерживает 1124 языка, включая китайский, и обеспечивает клонирование голоса. Инструмент оснащен интуитивно понятным графическим интерфейсом, поддерживает работу на CPU и GPU и имеет низкие требования к ресурсам: для работы требуется всего 4 ГБ оперативной памяти. Будь то персональное использование или пакетное преобразование, он позволяет создавать аудиокниги профессионального уровня.

Опыт работы в Интернете: https://huggingface.co/spaces/drewThomasson/ebook2audiobook

Список функций
- Поддержка конвертирования различных форматов электронных книг, включая epub, pdf, mobi и еще более 20 форматов
- Автоматическое распознавание и сохранение структуры главы электронной книги
- Высококачественная передача текста в речь с помощью передового движка XTTSv2
- Поддержка преобразования текста в речь на 1124 языках
- Обеспечить голос клонирования функции, может настроить голос чтения
- Выходной формат m4b с полной информацией о главе и метаданными
- Обеспечивает веб-графический интерфейс, простое и интуитивно понятное управление
- Поддержка развертывания контейнеров Docker для обеспечения кросс-платформенной совместимости
- Дополнительное ускорение GPU для повышения скорости обработки данных
- Поддержка функции пакетного преобразования
Использование помощи
Google Colab работает бесплатно
1. Способы установки
1.1 Использование Docker (рекомендуется)
Docker - это самый простой способ установки, обеспечивающий единую и стабильную среду выполнения.
Команда запуска версии процессора:
docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
GPU-версия команды run (требуется видеокарта NVIDIA):
docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py
1.2 Локальная установка
- Клонируйте репозиторий кода:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
- Установите зависимость:
- Python 3.x
- Calibre (инструмент для конвертирования электронных книг)
- FFmpeg (инструмент для обработки звука)
- Пакеты Python: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm
2. Методы использования
2.1 Использование графического интерфейса
- После запуска программы зайдите на сайт http://localhost:7860 через браузер.
- Загрузка файлов электронных книг в веб-интерфейсе
- Выбор целевого языка и звукового файла (по желанию)
- Нажмите, чтобы начать преобразование
2.2 Использование командной строки
Основной формат команды:
python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>
3. описание важных параметров
- --ebook: путь к файлу электронной книги (обязательно)
- --language: код целевого языка (необязательно, по умолчанию - английский)
- --voice: путь к файлу голоса (необязательно, для клонирования голоса)
- -устройство: выбрать, что использовать - CPU или GPU
- -скорость: регулировка скорости голоса (по умолчанию 1.0)
4. Поддерживаемые форматы файлов
Формат входа:
- epub (рекомендуется, лучше всего поддерживается)
- mobi
- txt
- Другие форматы: html, rtf, chm, lit, pdb, fb2, odt и др.
Выходной формат:
- m4b (аудиоформат с маркерами глав и метаданными)
5. Дополнительные функции
5.1 Клонирование речи
- Подготовьте файлы образцов целевых звуков с частотой 16 или 24 кГц
- Укажите путь к звуковому файлу во время преобразования
- Система будет читать вслух, используя целевой голос
5.2 Пакетное преобразование
- Создайте каталог input-folder и поместите в него файл электронной книги.
- Создание выходного каталога аудиокниг
- Обработка нескольких файлов с помощью команды пакетного преобразования
6. решение общих проблем
- Низкая скорость преобразования процессора
- Решение: использовать GPU-ускорение или воспользоваться облачными сервисами
- Рекомендуется: использовать Hugging Face Space или Google Colab
- Зависимые проблемы установки
- Рекомендуемая версия Docker, чтобы избежать проблем с зависимостями
- Проверьте совместимость с системой и наличие зависимых версий
- Проблемы с обрезанием звука
- Проверка форматирования вводимого текста
- Настройка параметров сегментации текста
- Сообщайте о конкретных языковых проблемах, чтобы улучшить поддержку
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...