Kokoro TTS API: Dockerised FastAPI wrapper for fast text-to-speech (modelo Kokoro-82M)
Últimos recursos sobre IAPublicado hace 8 meses Círculo de intercambio de inteligencia artificial 23.2K 00
Introducción general
Kokoro-FastAPI es un paquete FastAPI basado en Docker diseñado para proporcionar compatibilidad con el modelo de conversión de texto a voz Kokoro-82M. El proyecto es compatible con la aceleración de la GPU NVIDIA y proporciona procesamiento de colas y empalme automático para que la salida de voz de texto crecido en bruto sea más eficiente y coherente. El proyecto ha sido desarrollado por el usuario de GitHub remsky y está a disposición del público en GitHub. Los usuarios pueden realizar solicitudes de conversión de texto a voz a través de la interfaz API y obtener una salida de voz de alta calidad para una gran variedad de escenarios de aplicación que requieren la generación de voz.

Lista de funciones
- Paquete API para el modelo de conversión de texto en voz Kokoro-82M
- Admite la aceleración de la GPU NVIDIA para mejorar la eficacia de la generación de voz.
- Función de procesamiento de colas para atender solicitudes simultáneas
- Función de empalme automático para generar una salida de voz coherente de textos largos
- Despliegue en Docker para simplificar la instalación y la configuración
- Proporcionar ejemplos de código y documentación para que los desarrolladores puedan empezar a trabajar.
Utilizar la ayuda
Proceso de instalación
- Asegúrate de que Docker y el soporte para Docker de NVIDIA están instalados.
- Clona el repositorio del proyecto Kokoro-FastAPI:
git clone https://github.com/remsky/Kokoro-FastAPI.git
- Vaya al directorio del proyecto y cree la imagen Docker:
cd Kokoro-FastAPI docker build -t kokoro-fastapi .
- Inicie el contenedor Docker:
docker run --gpus all -d -p 8000:8000 kokoro-fastapi
Uso de la interfaz API
- Acceda a la documentación de la API:
Abra su navegador y visite http://localhost:8000/docs para consultar la documentación de la API y probar la interfaz. - Envía una solicitud de texto a voz:
Utilice una solicitud POST para enviar un mensaje a la base de datos/generate
envía datos de texto, por ejemplo:curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好,世界!"}'
- Obtener salida de voz:
Si la solicitud tiene éxito, se devolverá la URL del archivo de voz generado y el usuario podrá descargarlo o reproducirlo.
código de ejemplo (informática)
El proyecto proporciona código de ejemplo para ayudar a los desarrolladores a empezar rápidamente:
- El ejemplo test_openai_tts.py muestra cómo realizar una petición de texto a voz utilizando la API.
Procedimiento de funcionamiento detallado
- Asegúrate de que el sistema cumple los requisitos de hardware y software, especialmente los controladores de GPU NVIDIA y CUDA.
- Siga el procedimiento de instalación para instalar e iniciar el servicio Kokoro-FastAPI.
- Consulte la documentación de la API y el código de ejemplo para enviar una solicitud de texto a voz.
- Obtención de archivos de salida de voz y posterior tratamiento y utilización.
Con los pasos anteriores, los usuarios pueden implantar y utilizar fácilmente Kokoro-FastAPI para conseguir una funcionalidad eficaz de conversión de texto a voz y proporcionar servicios de generación de voz de alta calidad para diversos escenarios de aplicación.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...