ebook2audiobook: конвертация электронных книг в аудиокниги, инструмент с открытым исходным кодом, многоязыковой поддержкой и клонированием голоса

Последние ресурсы по искусственному интеллектуОпубликовано 1 год назад Круг обмена ИИ

84.6K 00

Общее введение

ebook2audiobook - это мощный инструмент для преобразования электронных книг в аудиокниги с открытым исходным кодом. Она способна конвертировать электронные книги различных форматов в аудиокниги с полными маркерами глав и метаданными. Инструмент использует Calibre для преобразования форматов электронных книг, XTTSv2 и Fairseq от Coqui для высококачественного преобразования текста в речь, поддерживает 1124 языка, включая китайский, и обеспечивает клонирование голоса. Инструмент оснащен интуитивно понятным графическим интерфейсом, поддерживает работу на CPU и GPU и имеет низкие требования к ресурсам: для работы требуется всего 4 ГБ оперативной памяти. Будь то персональное использование или пакетное преобразование, он позволяет создавать аудиокниги профессионального уровня.

ebook2audiobook：将电子书转换为有声读物，支持多语言和语音克隆的开源工具

Опыт работы в Интернете: https://huggingface.co/spaces/drewThomasson/ebook2audiobook

Список функций

Поддержка конвертирования различных форматов электронных книг, включая epub, pdf, mobi и еще более 20 форматов
Автоматическое распознавание и сохранение структуры главы электронной книги
Высококачественная передача текста в речь с помощью передового движка XTTSv2
Поддержка преобразования текста в речь на 1124 языках
Обеспечить голос клонирования функции, может настроить голос чтения
Выходной формат m4b с полной информацией о главе и метаданными
Обеспечивает веб-графический интерфейс, простое и интуитивно понятное управление
Поддержка развертывания контейнеров Docker для обеспечения кросс-платформенной совместимости
Дополнительное ускорение GPU для повышения скорости обработки данных
Поддержка функции пакетного преобразования

Использование помощи

Google Colab работает бесплатно

1. Способы установки

1.1 Использование Docker (рекомендуется)

Docker - это самый простой способ установки, обеспечивающий единую и стабильную среду выполнения.

Команда запуска версии процессора:

docker run -it --rm -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

GPU-версия команды run (требуется видеокарта NVIDIA):

docker run -it --rm --gpus all -p 7860:7860 --platform=linux/amd64 athomasson2/ebook2audiobook python app.py

1.2 Локальная установка

Клонируйте репозиторий кода:

git clone https://github.com/DrewThomasson/ebook2audiobook.git

Установите зависимость:

Python 3.x
Calibre (инструмент для конвертирования электронных книг)
FFmpeg (инструмент для обработки звука)
Пакеты Python: tts, pydub, nltk, beautifulsoup4, ebooklib, tqdm

2. Методы использования

2.1 Использование графического интерфейса

После запуска программы зайдите на сайт http://localhost:7860 через браузер.
Загрузка файлов электронных книг в веб-интерфейсе
Выбор целевого языка и звукового файла (по желанию)
Нажмите, чтобы начать преобразование

2.2 Использование командной строки

Основной формат команды:

python app.py --headless --ebook <电子书文件路径> --language <语言代码> --voice <声音文件路径>

3. описание важных параметров

--ebook: путь к файлу электронной книги (обязательно)
--language: код целевого языка (необязательно, по умолчанию - английский)
--voice: путь к файлу голоса (необязательно, для клонирования голоса)
-устройство: выбрать, что использовать - CPU или GPU
-скорость: регулировка скорости голоса (по умолчанию 1.0)

4. Поддерживаемые форматы файлов

Формат входа:

epub (рекомендуется, лучше всего поддерживается)
pdf
mobi
txt
Другие форматы: html, rtf, chm, lit, pdb, fb2, odt и др.

Выходной формат:

m4b (аудиоформат с маркерами глав и метаданными)

5. Дополнительные функции

5.1 Клонирование речи

Подготовьте файлы образцов целевых звуков с частотой 16 или 24 кГц
Укажите путь к звуковому файлу во время преобразования
Система будет читать вслух, используя целевой голос

5.2 Пакетное преобразование

Создайте каталог input-folder и поместите в него файл электронной книги.
Создание выходного каталога аудиокниг
Обработка нескольких файлов с помощью команды пакетного преобразования

6. решение общих проблем

Низкая скорость преобразования процессора

Решение: использовать GPU-ускорение или воспользоваться облачными сервисами
Рекомендуется: использовать Hugging Face Space или Google Colab

Зависимые проблемы установки

Рекомендуемая версия Docker, чтобы избежать проблем с зависимостями
Проверьте совместимость с системой и наличие зависимых версий

Проблемы с обрезанием звука

Проверка форматирования вводимого текста
Настройка параметров сегментации текста
Сообщайте о конкретных языковых проблемах, чтобы улучшить поддержку

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # AI преобразование текста в речь

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

OneFileLLM: интеграция нескольких источников данных в один текстовый файл

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct # Извлечение и очистка документов

11 месяцев назад

051.9K

PhotoDoodle: ИИ-инструмент для добавления художественных каракулей к фотографиям с помощью текстовых команд

Последние ресурсы по искусственному интеллекту # AI Image Editor # AI Java Open Source Projecct

1 год назад

064.3K

女娲智能体OS - 西南财经开源的通用智能体操作系统

Последние ресурсы по искусственному интеллекту

2 месяца назад

033.2K

Flux Gym: удобный пользовательский интерфейс для тренировок FLUX LoRA с малым объемом графической памяти

Последние ресурсы по искусственному интеллекту # AI Средства создания изображений # AI Java Open Source Projecct

1 год назад

094.1K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

ebook2audiobook: конвертация электронных книг в аудиокниги, инструмент с открытым исходным кодом, многоязыковой поддержкой и клонированием голоса

Общее введение

Список функций

Использование помощи

1. Способы установки

1.1 Использование Docker (рекомендуется)

1.2 Локальная установка

2. Методы использования

2.1 Использование графического интерфейса

2.2 Использование командной строки

3. описание важных параметров

4. Поддерживаемые форматы файлов

5. Дополнительные функции

5.1 Клонирование речи

5.2 Пакетное преобразование

6. решение общих проблем

Memary: проект с открытым исходным кодом для улучшения долговременной памяти агента с помощью графов знаний

MagicMirror: легкий нативный клиент для изменения лица, прически и наряда с помощью искусственного интеллекта одним щелчком мыши

Похожие статьи

OneFileLLM: интеграция нескольких источников данных в один текстовый файл

PhotoDoodle: ИИ-инструмент для добавления художественных каракулей к фотографиям с помощью текстовых команд

女娲智能体OS - 西南财经开源的通用智能体操作系统

Flux Gym: удобный пользовательский интерфейс для тренировок FLUX LoRA с малым объемом графической памяти

Нет комментариев

Последние коллекции

Последние статьи

ebook2audiobook: конвертация электронных книг в аудиокниги, инструмент с открытым исходным кодом, многоязыковой поддержкой и клонированием голоса

Общее введение

Список функций

Использование помощи

1. Способы установки

1.1 Использование Docker (рекомендуется)

1.2 Локальная установка

2. Методы использования

2.1 Использование графического интерфейса

2.2 Использование командной строки

3. описание важных параметров

4. Поддерживаемые форматы файлов

5. Дополнительные функции

5.1 Клонирование речи

5.2 Пакетное преобразование

6. решение общих проблем

Memary: проект с открытым исходным кодом для улучшения долговременной памяти агента с помощью графов знаний

MagicMirror: легкий нативный клиент для изменения лица, прически и наряда с помощью искусственного интеллекта одним щелчком мыши

Похожие статьи

OneFileLLM: интеграция нескольких источников данных в один текстовый файл

PhotoDoodle: ИИ-инструмент для добавления художественных каракулей к фотографиям с помощью текстовых команд

女娲智能体OS - 西南财经开源的通用智能体操作系统

Flux Gym: удобный пользовательский интерфейс для тренировок FLUX LoRA с малым объемом графической памяти

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи