API Kokoro TTS: wrapper FastAPI do Docker para conversão rápida de texto em fala (modelo Kokoro-82M)

Recursos mais recentes de IAPublicado há 8 meses Círculo de compartilhamento de IA

39.8K 00

Introdução geral

O Kokoro-FastAPI é um pacote FastAPI baseado no Docker projetado para oferecer suporte ao modelo de conversão de texto em fala Kokoro-82M. O projeto oferece suporte à aceleração da GPU NVIDIA e fornece processamento de filas e emenda automática para tornar a saída de fala de texto adulto bruto mais eficiente e coerente. O projeto foi desenvolvido pelo usuário do GitHub remsky e está disponível publicamente no GitHub. Os usuários podem fazer solicitações de conversão de texto em fala por meio da interface da API e obter saída de fala de alta qualidade para uma variedade de cenários de aplicativos que exigem geração de fala.

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Lista de funções

Fornecer um pacote de API para o modelo de conversão de texto em fala Kokoro-82M
Suporta a aceleração de GPU NVIDIA para melhorar a eficiência da geração de fala
Função de processamento de filas para suportar solicitações simultâneas
Função de emenda automática para gerar uma saída de fala coerente de textos longos
Implementação em Docker para instalação e configuração simplificadas
Fornecer código de amostra e documentação para que os desenvolvedores possam começar.

Usando a Ajuda

Processo de instalação

Certifique-se de que o Docker e o suporte ao NVIDIA Docker estejam instalados.

Clone o repositório do projeto Kokoro-FastAPI:

git clone https://github.com/remsky/Kokoro-FastAPI.git

Vá para o diretório do projeto e crie a imagem do Docker:
```
cd Kokoro-FastAPI
docker build -t kokoro-fastapi .
```

Inicie o contêiner do Docker:

docker run --gpus all -d -p 8000:8000 kokoro-fastapi

Usando a interface da API

Acesse a documentação da API:
Abra seu navegador e acesse http://localhost:8000/docs para visualizar a documentação da API e testar a interface.
Envia uma solicitação de conversão de texto em fala:
Use uma solicitação POST para enviar uma mensagem para o/generateenvia dados de texto, por exemplo:
```
curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好，世界！"}'
```
Obter saída de fala:
Após a solicitação bem-sucedida, o URL do arquivo de voz gerado será retornado e o usuário poderá fazer download ou reproduzir o arquivo.

Código de amostra (computação)

O projeto fornece código de amostra para ajudar os desenvolvedores a começar rapidamente:

O exemplo test_openai_tts.py mostra como fazer uma solicitação de conversão de texto em fala usando a API.

Procedimento de operação detalhado

Certifique-se de que o sistema atenda aos requisitos de hardware e software, especialmente os drivers de GPU e CUDA da NVIDIA.
Siga o procedimento de instalação para instalar e iniciar o serviço Kokoro-FastAPI.
Consulte a documentação da API e o código de amostra para enviar uma solicitação de conversão de texto em fala.
Obtenção de arquivos de saída de fala, processamento e uso subsequentes.

Com as etapas acima, os usuários podem implementar e usar facilmente a Kokoro-FastAPI para obter uma funcionalidade eficiente de conversão de texto em fala e fornecer serviços de geração de fala de alta qualidade para vários cenários de aplicativos.

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Kadence AI: plug-in do construtor de páginas de IA para sites do WordPress, plug-in do WordPress para geração inteligente de páginas e conteúdo temáticos

Recursos mais recentes de IA # Design de página de IA

10 meses atrás

018K

ResumeUp.AI: diálogo com a IA para gerar currículos e cartas de apresentação correspondentes a empregos

Recursos mais recentes de IA # Assistente de eficiência de vida de IA

6 meses atrás

019.3K

PDF Craft: documentos digitalizados em PDF para ferramentas de código aberto Markdown

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

6 meses atrás

021.6K

Granola: um assistente de reunião com IA que transcreve as discussões da reunião e aprimora as anotações da reunião com IA

Recursos mais recentes de IA # Ferramenta de resumo de texto e áudio/vídeo com IA

11 meses atrás

025.9K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

API Kokoro TTS: wrapper FastAPI do Docker para conversão rápida de texto em fala (modelo Kokoro-82M)

Introdução geral

Lista de funções