Kokoro-ONNX: эффективный инструмент преобразования текста в речь с поддержкой нескольких языков и нескольких голосов

Общее введение

Kokoro-ONNX - это инструмент преобразования текста в речь (TTS) с открытым исходным кодом, основанный на среде исполнения ONNX. Проект, разработанный thewh1teagle, нацелен на создание эффективного и быстрого решения для синтеза речи. Kokoro-ONNX поддерживает множество языков, включая английский, планируется поддержка французского, японского, корейского и китайского. Инструмент имеет широкий выбор голосов, включая режим шепота, и обладает отличной производительностью, способной работать практически в реальном времени на macOS M1. Легкий дизайн kokoro-ONNX делает его простым в установке и использовании, что делает его подходящим для разработчиков и исследователей, которым нужно эффективное TTS-решение.

 

Список функций

  • Поддержка преобразования текста в речь (TTS) для нескольких языков
  • Несколько вариантов озвучивания, включая режим шепота
  • Эффективная производительность, работа практически в режиме реального времени
  • Легкий дизайн, установочный пакет около 300 МБ (около 80 МБ после квантования)
  • Совместимость с macOS M1
  • Открытый исходный код, основанный на лицензиях MIT и Apache 2.0

 

Использование помощи

Процесс установки

  1. Откройте терминал (PowerShell / Bash).
  2. Выполните следующую команду для установки Kokoro-ONNX:
   pip install -U kokoro-onnx
  1. Загрузите необходимые документыkokoro-v0_19.onnxответить пениемvoices.jsonи поместите их в тот же каталог.

Использование

  1. Выполните следующую команду в терминале, чтобы запустить Kokoro-ONNX:
   uv init -p 3.12
uv add kokoro-onnx soundfile
  1. главнокомандующий (военный)examples/save.pyВставьте содержимое файлаhello.pyСредний.
  2. Скачать файлkokoro-v0_19.onnxответить пениемvoices.jsonи поместите их в тот же каталог.
  3. Выполните следующую команду, чтобы сгенерировать речь:
   python hello.py

Функции Поток операций

  1. Выберите язык и голос: вvoices.jsonВыберите нужный язык и голос из списка
  2. текст ввода: вhello.pyВведите текст, который нужно преобразовать в речь, в поле
  3. Создайте речь: После выполнения скрипта сгенерированный голосовой файл будет сохранен в указанной директории.

Основные функции

  • Поддержка нескольких языков: В настоящее время Kokoro-ONNX поддерживает английский язык и планирует поддерживать другие языки, такие как французский, японский, корейский и китайский.
  • Несколько вариантов звучания: Пользователи могут выбирать различные звуки, включая режим шепота, для удовлетворения потребностей в различных сценариях.
  • Высокая производительность: Работает практически в режиме реального времени на macOS M1 для сценариев приложений, требующих быстрого реагирования.
  • Легкая конструкция: Небольшой размер установочного пакета позволяет быстро развернуть и использовать его.

Выполнив описанные выше действия, пользователи смогут легко установить и использовать Kokoro-ONNX для эффективной работы с текстом в речь. Подробные инструкции по эксплуатации и богатые описания функций гарантируют, что пользователи смогут быстро приступить к работе и использовать все преимущества инструмента.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...