Kokoro TTS API: докеризованная обертка FastAPI для быстрого преобразования текста в речь (модель Kokoro-82M).

Общее введение

Kokoro-FastAPI - это пакет FastAPI на базе Docker, предназначенный для поддержки модели преобразования текста в речь Kokoro-82M. Проект поддерживает ускорение NVIDIA GPU и обеспечивает обработку очередей и автоматическое сращивание, чтобы сделать речевой вывод необработанного выращенного текста более эффективным и связным. Проект разработан пользователем GitHub remsky и находится в открытом доступе на GitHub. Пользователи могут делать запросы на преобразование текста в речь через интерфейс API и получать высококачественный речевой вывод для различных сценариев, требующих генерации речи.

Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)

 

Список функций

  • Предоставление пакета API для модели преобразования текста в речь Kokoro-82M
  • Поддержка NVIDIA GPU-ускорения для повышения эффективности генерации речи
  • Функция обработки очередей для поддержки одновременных запросов
  • Функция автоматического сращивания для создания связного речевого вывода длинных текстов
  • Докерное развертывание для упрощения установки и настройки
  • Предоставьте разработчикам примеры кода и документацию для начала работы.

 

Использование помощи

Процесс установки

  1. Убедитесь, что установлены Docker и поддержка NVIDIA Docker.
  2. Клонируйте репозиторий проекта Kokoro-FastAPI:
    git clone https://github.com/remsky/Kokoro-FastAPI.git
  1. Перейдите в каталог проекта и соберите образ Docker:
    cd Kokoro-FastAPI
    docker build -t kokoro-fastapi .
    
  2. Запустите контейнер Docker:
    docker run --gpus all -d -p 8000:8000 kokoro-fastapi
    

Использование интерфейса API

  1. Доступ к документации по API:
    Откройте браузер и посетите сайт http://localhost:8000/docs, чтобы ознакомиться с документацией по API и протестировать интерфейс.
  2. Отправляет запрос на преобразование текста в речь:
    Используйте POST-запрос, чтобы отправить сообщение в/generateинтерфейс отправляет, например, текстовые данные:

    curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好,世界!"}'
    
  3. Получите речевой вывод:
    При успешном запросе будет возвращен URL сгенерированного голосового файла, и пользователь сможет скачать или воспроизвести его.

пример кода (вычисления)

Проект содержит примеры кода, которые помогут разработчикам быстро приступить к работе:

  • Пример test_openai_tts.py показывает, как сделать запрос на преобразование текста в речь с помощью API.

Подробная процедура работы

  1. Убедитесь, что система соответствует аппаратным и программным требованиям, особенно драйверы NVIDIA GPU и CUDA.
  2. Следуйте процедуре установки, чтобы установить и запустить службу Kokoro-FastAPI.
  3. Обратитесь к документации API и примерам кода, чтобы отправить запрос на преобразование текста в речь.
  4. Получение выходных файлов речи, их последующая обработка и использование.

Выполнив вышеописанные действия, пользователи смогут легко развернуть и использовать Kokoro-FastAPI для достижения эффективной функциональности преобразования текста в речь и предоставления высококачественных услуг генерации речи для различных сценариев применения.

© заявление об авторских правах

Похожие статьи

Groq:AI大模型推理加速解决方案提供商,高速免费大模型接口

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...