Kokoro TTS API: Dockerised FastAPI wrapper for fast text-to-speech (modelo Kokoro-82M)
 Últimos recursos sobre IAPublicado hace 10 meses Círculo de intercambio de inteligencia artificial 58.3K 00
Introducción general
Kokoro-FastAPI es un paquete FastAPI basado en Docker diseñado para proporcionar compatibilidad con el modelo de conversión de texto a voz Kokoro-82M. El proyecto es compatible con la aceleración de la GPU NVIDIA y proporciona procesamiento de colas y empalme automático para que la salida de voz de texto crecido en bruto sea más eficiente y coherente. El proyecto ha sido desarrollado por el usuario de GitHub remsky y está a disposición del público en GitHub. Los usuarios pueden realizar solicitudes de conversión de texto a voz a través de la interfaz API y obtener una salida de voz de alta calidad para una gran variedad de escenarios de aplicación que requieren la generación de voz.

Lista de funciones
- Paquete API para el modelo de conversión de texto en voz Kokoro-82M
- Admite la aceleración de la GPU NVIDIA para mejorar la eficacia de la generación de voz.
- Función de procesamiento de colas para atender solicitudes simultáneas
- Función de empalme automático para generar una salida de voz coherente de textos largos
- Despliegue en Docker para simplificar la instalación y la configuración
- Proporcionar ejemplos de código y documentación para que los desarrolladores puedan empezar a trabajar.
Utilizar la ayuda
Proceso de instalación
- Asegúrate de que Docker y el soporte para Docker de NVIDIA están instalados.
- Clona el repositorio del proyecto Kokoro-FastAPI:
git clone https://github.com/remsky/Kokoro-FastAPI.git
- Vaya al directorio del proyecto y cree la imagen Docker:
cd Kokoro-FastAPI docker build -t kokoro-fastapi .
- Inicie el contenedor Docker:
docker run --gpus all -d -p 8000:8000 kokoro-fastapi
Uso de la interfaz API
- Acceda a la documentación de la API:
 Abra su navegador y visite http://localhost:8000/docs para consultar la documentación de la API y probar la interfaz.
- Envía una solicitud de texto a voz:
 Utilice una solicitud POST para enviar un mensaje a la base de datos/generateenvía datos de texto, por ejemplo:curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好,世界!"}'
- Obtener salida de voz:
 Si la solicitud tiene éxito, se devolverá la URL del archivo de voz generado y el usuario podrá descargarlo o reproducirlo.
código de ejemplo (informática)
El proyecto proporciona código de ejemplo para ayudar a los desarrolladores a empezar rápidamente:
- El ejemplo test_openai_tts.py muestra cómo realizar una petición de texto a voz utilizando la API.
Procedimiento de funcionamiento detallado
- Asegúrate de que el sistema cumple los requisitos de hardware y software, especialmente los controladores de GPU NVIDIA y CUDA.
- Siga el procedimiento de instalación para instalar e iniciar el servicio Kokoro-FastAPI.
- Consulte la documentación de la API y el código de ejemplo para enviar una solicitud de texto a voz.
- Obtención de archivos de salida de voz y posterior tratamiento y utilización.
Con los pasos anteriores, los usuarios pueden implantar y utilizar fácilmente Kokoro-FastAPI para conseguir una funcionalidad eficaz de conversión de texto a voz y proporcionar servicios de generación de voz de alta calidad para diversos escenarios de aplicación.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial  Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...





 Español
Español  简体中文
简体中文  English
English  日本語
日本語  한국어
한국어  Русский
Русский