Kokoro-ONNX: эффективный инструмент преобразования текста в речь с поддержкой нескольких языков и нескольких голосов
Общее введение
Kokoro-ONNX - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, основанный на среде исполнения ONNX. Проект, разработанный thewh1teagle, нацелен на создание эффективного и быстрого решения для синтеза речи. Kokoro-ONNX поддерживает множество языков, включая английский, планируется поддержка французского, японского, корейского и китайского. Инструмент имеет широкий выбор голосов, включая режим шепота, и обладает отличной производительностью, способной работать практически в реальном времени на macOS M1. Легкий дизайн kokoro-ONNX делает его простым в установке и использовании, что делает его подходящим для разработчиков и исследователей, которым нужно эффективное TTS-решение.
Список функций
- Поддержка преобразования текста в речь (TTS) для нескольких языков
- Несколько вариантов озвучивания, включая режим шепота
- Эффективная производительность, работа практически в режиме реального времени
- Легкий дизайн, установочный пакет около 300 МБ (около 80 МБ после квантования)
- Совместимость с macOS M1
- Открытый исходный код, основанный на лицензиях MIT и Apache 2.0
Использование помощи
Процесс установки
- Откройте терминал (PowerShell / Bash).
- Выполните следующую команду для установки Kokoro-ONNX:
pip install -U kokoro-onnx
- Загрузите необходимые документы
kokoro-v0_19.onnx
ответить пениемvoices.json
и поместите их в тот же каталог.
Использование
- Выполните следующую команду в терминале, чтобы запустить Kokoro-ONNX:
uv init -p 3.12
uv add kokoro-onnx soundfile
- главнокомандующий (военный)
examples/save.py
Вставьте содержимое файлаhello.py
Средний. - Скачать файл
kokoro-v0_19.onnx
ответить пениемvoices.json
и поместите их в тот же каталог. - Выполните следующую команду, чтобы сгенерировать речь:
python hello.py
Функции Поток операций
- Выберите язык и голос: в
voices.json
Выберите нужный язык и голос из списка - текст ввода: в
hello.py
Введите текст, который нужно преобразовать в речь, в поле - Создайте речь: После выполнения скрипта сгенерированный голосовой файл будет сохранен в указанной директории.
Основные функции
- Поддержка нескольких языков: В настоящее время Kokoro-ONNX поддерживает английский язык и планирует поддерживать другие языки, такие как французский, японский, корейский и китайский.
- Несколько вариантов звучания: Пользователи могут выбирать различные звуки, включая режим шепота, для удовлетворения потребностей в различных сценариях.
- Высокая производительность: Работает практически в режиме реального времени на macOS M1 для сценариев приложений, требующих быстрого реагирования.
- Легкая конструкция: Небольшой размер установочного пакета позволяет быстро развернуть и использовать его.
Выполнив описанные выше действия, пользователи смогут легко установить и использовать Kokoro-ONNX для эффективной работы с текстом в речь. Подробные инструкции по эксплуатации и богатые описания функций гарантируют, что пользователи смогут быстро приступить к работе и использовать все преимущества инструмента.
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...