ebook2audiobook: конвертация электронных книг в аудиокниги, инструмент с открытым исходным кодом, многоязыковой поддержкой и клонированием голоса

Общее введение

ebook2audiobook - это мощный инструмент для преобразования электронных книг в аудиокниги с открытым исходным кодом. Она способна конвертировать электронные книги различных форматов в аудиокниги с полными маркерами глав и метаданными. Инструмент использует Calibre для преобразования форматов электронных книг, XTTSv2 и Fairseq от Coqui для высококачественного преобразования текста в речь, поддерживает 1124 языка, включая китайский, и обеспечивает клонирование голоса. Инструмент оснащен интуитивно понятным графическим интерфейсом, поддерживает работу на CPU и GPU и имеет низкие требования к ресурсам: для работы требуется всего 4 ГБ оперативной памяти. Будь то персональное использование или пакетное преобразование, он позволяет создавать аудиокниги профессионального уровня.

ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

Опыт работы в Интернете: https://huggingface.co/spaces/drewThomasson/ebook2audiobook

 

ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

 

Список функций

  • Поддержка конвертирования различных форматов электронных книг, включая epub, pdf, mobi и еще более 20 форматов
  • Автоматическое распознавание и сохранение структуры главы электронной книги
  • Высококачественная передача текста в речь с помощью передового движка XTTSv2
  • Поддержка преобразования текста в речь на 1124 языках
  • Обеспечить голос клонирования функции, может настроить голос чтения
  • Выходной формат m4b с полной информацией о главе и метаданными
  • Обеспечивает веб-графический интерфейс, простое и интуитивно понятное управление
  • Поддержка развертывания контейнеров Docker для обеспечения кросс-платформенной совместимости
  • Дополнительное ускорение GPU для повышения скорости обработки данных
  • Поддержка функции пакетного преобразования

 

Использование помощи

Google Colab работает бесплатно

1. Способы установки

1.1 Использование Docker (рекомендуется)

Docker - это самый простой способ установки, обеспечивающий единую и стабильную среду выполнения.

Команда запуска версии процессора:

docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

GPU-версия команды run (требуется видеокарта NVIDIA):

docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

1.2 Локальная установка

  1. Клонируйте репозиторий кода:
git clone https://github.com/DrewThomasson/ebook2audiobook.git
  1. Установите зависимость:
  • Python 3.x
  • Calibre (инструмент для конвертирования электронных книг)
  • FFmpeg (инструмент для обработки звука)
  • Пакеты Python: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm

2. Методы использования

2.1 Использование графического интерфейса

  1. После запуска программы зайдите на сайт http://localhost:7860 через браузер.
  2. Загрузка файлов электронных книг в веб-интерфейсе
  3. Выбор целевого языка и звукового файла (по желанию)
  4. Нажмите, чтобы начать преобразование

2.2 Использование командной строки

Основной формат команды:

python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>

3. описание важных параметров

  • --ebook: путь к файлу электронной книги (обязательно)
  • --language: код целевого языка (необязательно, по умолчанию - английский)
  • --voice: путь к файлу голоса (необязательно, для клонирования голоса)
  • -устройство: выбрать, что использовать - CPU или GPU
  • -скорость: регулировка скорости голоса (по умолчанию 1.0)

4. Поддерживаемые форматы файлов

Формат входа:

  • epub (рекомендуется, лучше всего поддерживается)
  • pdf
  • mobi
  • txt
  • Другие форматы: html, rtf, chm, lit, pdb, fb2, odt и др.

Выходной формат:

  • m4b (аудиоформат с маркерами глав и метаданными)

5. Дополнительные функции

5.1 Клонирование речи

  1. Подготовьте файлы образцов целевых звуков с частотой 16 или 24 кГц
  2. Укажите путь к звуковому файлу во время преобразования
  3. Система будет читать вслух, используя целевой голос

5.2 Пакетное преобразование

  1. Создайте каталог input-folder и поместите в него файл электронной книги.
  2. Создание выходного каталога аудиокниг
  3. Обработка нескольких файлов с помощью команды пакетного преобразования

6. решение общих проблем

  1. Низкая скорость преобразования процессора
  • Решение: использовать GPU-ускорение или воспользоваться облачными сервисами
  • Рекомендуется: использовать Hugging Face Space или Google Colab
  1. Зависимые проблемы установки
  • Рекомендуемая версия Docker, чтобы избежать проблем с зависимостями
  • Проверьте совместимость с системой и наличие зависимых версий
  1. Проблемы с обрезанием звука
  • Проверка форматирования вводимого текста
  • Настройка параметров сегментации текста
  • Сообщайте о конкретных языковых проблемах, чтобы улучшить поддержку
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...