Kokoro TTS API: Dockerised FastAPI wrapper for fast text-to-speech (modelo Kokoro-82M)

Introducción general

Kokoro-FastAPI es un paquete FastAPI basado en Docker diseñado para proporcionar compatibilidad con el modelo de conversión de texto a voz Kokoro-82M. El proyecto es compatible con la aceleración de la GPU NVIDIA y proporciona procesamiento de colas y empalme automático para que la salida de voz de texto crecido en bruto sea más eficiente y coherente. El proyecto ha sido desarrollado por el usuario de GitHub remsky y está a disposición del público en GitHub. Los usuarios pueden realizar solicitudes de conversión de texto a voz a través de la interfaz API y obtener una salida de voz de alta calidad para una gran variedad de escenarios de aplicación que requieren la generación de voz.

Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)

 

Lista de funciones

  • Paquete API para el modelo de conversión de texto en voz Kokoro-82M
  • Admite la aceleración de la GPU NVIDIA para mejorar la eficacia de la generación de voz.
  • Función de procesamiento de colas para atender solicitudes simultáneas
  • Función de empalme automático para generar una salida de voz coherente de textos largos
  • Despliegue en Docker para simplificar la instalación y la configuración
  • Proporcionar ejemplos de código y documentación para que los desarrolladores puedan empezar a trabajar.

 

Utilizar la ayuda

Proceso de instalación

  1. Asegúrate de que Docker y el soporte para Docker de NVIDIA están instalados.
  2. Clona el repositorio del proyecto Kokoro-FastAPI:
    git clone https://github.com/remsky/Kokoro-FastAPI.git
  1. Vaya al directorio del proyecto y cree la imagen Docker:
    cd Kokoro-FastAPI
    docker build -t kokoro-fastapi .
    
  2. Inicie el contenedor Docker:
    docker run --gpus all -d -p 8000:8000 kokoro-fastapi
    

Uso de la interfaz API

  1. Acceda a la documentación de la API:
    Abra su navegador y visite http://localhost:8000/docs para consultar la documentación de la API y probar la interfaz.
  2. Envía una solicitud de texto a voz:
    Utilice una solicitud POST para enviar un mensaje a la base de datos/generateenvía datos de texto, por ejemplo:

    curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好,世界!"}'
    
  3. Obtener salida de voz:
    Si la solicitud tiene éxito, se devolverá la URL del archivo de voz generado y el usuario podrá descargarlo o reproducirlo.

código de ejemplo (informática)

El proyecto proporciona código de ejemplo para ayudar a los desarrolladores a empezar rápidamente:

  • El ejemplo test_openai_tts.py muestra cómo realizar una petición de texto a voz utilizando la API.

Procedimiento de funcionamiento detallado

  1. Asegúrate de que el sistema cumple los requisitos de hardware y software, especialmente los controladores de GPU NVIDIA y CUDA.
  2. Siga el procedimiento de instalación para instalar e iniciar el servicio Kokoro-FastAPI.
  3. Consulte la documentación de la API y el código de ejemplo para enviar una solicitud de texto a voz.
  4. Obtención de archivos de salida de voz y posterior tratamiento y utilización.

Con los pasos anteriores, los usuarios pueden implantar y utilizar fácilmente Kokoro-FastAPI para conseguir una funcionalidad eficaz de conversión de texto a voz y proporcionar servicios de generación de voz de alta calidad para diversos escenarios de aplicación.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...