Kokoro TTS API: Dockerised FastAPI wrapper for fast text-to-speech (modelo Kokoro-82M)

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

109K 00

Introducción general

Kokoro-FastAPI es un paquete FastAPI basado en Docker diseñado para proporcionar compatibilidad con el modelo de conversión de texto a voz Kokoro-82M. El proyecto es compatible con la aceleración de la GPU NVIDIA y proporciona procesamiento de colas y empalme automático para que la salida de voz de texto crecido en bruto sea más eficiente y coherente. El proyecto ha sido desarrollado por el usuario de GitHub remsky y está a disposición del público en GitHub. Los usuarios pueden realizar solicitudes de conversión de texto a voz a través de la interfaz API y obtener una salida de voz de alta calidad para una gran variedad de escenarios de aplicación que requieren la generación de voz.

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Lista de funciones

Paquete API para el modelo de conversión de texto en voz Kokoro-82M
Admite la aceleración de la GPU NVIDIA para mejorar la eficacia de la generación de voz.
Función de procesamiento de colas para atender solicitudes simultáneas
Función de empalme automático para generar una salida de voz coherente de textos largos
Despliegue en Docker para simplificar la instalación y la configuración
Proporcionar ejemplos de código y documentación para que los desarrolladores puedan empezar a trabajar.

Utilizar la ayuda

Proceso de instalación

Asegúrate de que Docker y el soporte para Docker de NVIDIA están instalados.

Clona el repositorio del proyecto Kokoro-FastAPI:

git clone https://github.com/remsky/Kokoro-FastAPI.git

Vaya al directorio del proyecto y cree la imagen Docker:
```
cd Kokoro-FastAPI
docker build -t kokoro-fastapi .
```

Inicie el contenedor Docker:

docker run --gpus all -d -p 8000:8000 kokoro-fastapi

Uso de la interfaz API

Acceda a la documentación de la API:
Abra su navegador y visite http://localhost:8000/docs para consultar la documentación de la API y probar la interfaz.

Envía una solicitud de texto a voz:
Utilice una solicitud POST para enviar un mensaje a la base de datos/generateenvía datos de texto, por ejemplo:

curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好，世界！"}'

Obtener salida de voz:
Si la solicitud tiene éxito, se devolverá la URL del archivo de voz generado y el usuario podrá descargarlo o reproducirlo.

código de ejemplo (informática)

El proyecto proporciona código de ejemplo para ayudar a los desarrolladores a empezar rápidamente:

El ejemplo test_openai_tts.py muestra cómo realizar una petición de texto a voz utilizando la API.

Procedimiento de funcionamiento detallado

Asegúrate de que el sistema cumple los requisitos de hardware y software, especialmente los controladores de GPU NVIDIA y CUDA.
Siga el procedimiento de instalación para instalar e iniciar el servicio Kokoro-FastAPI.
Consulte la documentación de la API y el código de ejemplo para enviar una solicitud de texto a voz.
Obtención de archivos de salida de voz y posterior tratamiento y utilización.

Con los pasos anteriores, los usuarios pueden implantar y utilizar fácilmente Kokoro-FastAPI para conseguir una funcionalidad eficaz de conversión de texto a voz y proporcionar servicios de generación de voz de alta calidad para diversos escenarios de aplicación.

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

NetEase Tianyin: AI Arranging, One-Click Song Writing and Lyrics, One-Stop AI Music Professional Creation Tool

Últimos recursos sobre IA # AI Música

hace 1 año

074.7K

Humva: vídeo gratuito personalizado de una persona o doble digital generado a partir de una sola foto

Últimos recursos sobre IA # AI Digital Man

hace 8 meses

057.7K

Tiangong AI: un completo asistente de inteligencia artificial para trabajar y vivir con eficacia

Últimos recursos sobre IA # AI Big Model Herramienta de diálogo nativa # Aplicación de carrocería inteligente

hace 11 meses

051.5K

Difusión de historias: generar un estilo coherente de cómics de varios paneles (tiras) a partir de la narración textual.

Últimos recursos sobre IA # AI Imagen a Vídeo # AI Control de estilo de imagen

hace 11 meses

046.9K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Kokoro TTS API: Dockerised FastAPI wrapper for fast text-to-speech (modelo Kokoro-82M)

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Uso de la interfaz API

código de ejemplo (informática)

Procedimiento de funcionamiento detallado

CoolCline: otra versión mejorada del asistente de codificación inteligente de Cline, que combina las ventajas de ClineRoo Cline y Bao Cline.

Lobe Vidol: un escenario interactivo para el diálogo de texto y voz con ídolos virtuales

Artículos relacionados

NetEase Tianyin: AI Arranging, One-Click Song Writing and Lyrics, One-Stop AI Music Professional Creation Tool

Humva: vídeo gratuito personalizado de una persona o doble digital generado a partir de una sola foto

Tiangong AI: un completo asistente de inteligencia artificial para trabajar y vivir con eficacia

Difusión de historias: generar un estilo coherente de cómics de varios paneles (tiras) a partir de la narración textual.

Sin comentarios

Últimas colecciones

Últimos artículos

Kokoro TTS API: Dockerised FastAPI wrapper for fast text-to-speech (modelo Kokoro-82M)

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Uso de la interfaz API

código de ejemplo (informática)

Procedimiento de funcionamiento detallado

CoolCline: otra versión mejorada del asistente de codificación inteligente de Cline, que combina las ventajas de ClineRoo Cline y Bao Cline.

Lobe Vidol: un escenario interactivo para el diálogo de texto y voz con ídolos virtuales

Artículos relacionados

NetEase Tianyin: AI Arranging, One-Click Song Writing and Lyrics, One-Stop AI Music Professional Creation Tool

Humva: vídeo gratuito personalizado de una persona o doble digital generado a partir de una sola foto

Tiangong AI: un completo asistente de inteligencia artificial para trabajar y vivir con eficacia

Difusión de historias: generar un estilo coherente de cómics de varios paneles (tiras) a partir de la narración textual.

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos