Introdução geral
O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido pelo thewh1teagle, o projeto tem como objetivo fornecer uma solução de síntese de fala rápida e eficiente. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, com suporte planejado para francês, japonês, coreano e chinês. A ferramenta apresenta uma ampla seleção de vozes, incluindo um modo de sussurro, e tem excelente desempenho, capaz de ser executada quase em tempo real no macOS M1. O design leve do kokoro-ONNX facilita a instalação e o uso, tornando-o adequado para desenvolvedores e pesquisadores que precisam de uma solução TTS eficiente.
Lista de funções
- Suporte de conversão de texto em fala (TTS) para vários idiomas
- Várias opções de voz, incluindo o modo sussurro
- Desempenho eficiente, operação quase em tempo real
- Design leve, pacote de instalação com cerca de 300 MB (cerca de 80 MB após a quantificação)
- Compatível com o macOS M1
- Código aberto, com base nas licenças MIT e Apache 2.0
Usando a Ajuda
Processo de instalação
- Abra um terminal (PowerShell / Bash).
- Execute o seguinte comando para instalar o Kokoro-ONNX:
pip install -U kokoro-onnx
- Faça o download dos documentos necessários
kokoro-v0_19.onnx
responder cantandovoices.json
e coloque-os no mesmo diretório.
Uso
- Execute o seguinte comando em um terminal para iniciar o Kokoro-ONNX:
uv init -p 3.12
uv add kokoro-onnx soundfile
- comandante-em-chefe (militar)
examples/save.py
Cole o conteúdo do arquivohello.py
Médio. - Baixar arquivo
kokoro-v0_19.onnx
responder cantandovoices.json
e coloque-os no mesmo diretório. - Execute o seguinte comando para gerar a fala:
python hello.py
Função Fluxo de operação
- Selecione o idioma e a voz: em
voices.json
Selecione o idioma e a voz desejados na lista - texto de entrada: em
hello.py
Digite o texto a ser convertido em fala no campo - Gerar discursoDepois de executar o script, o arquivo de voz gerado será salvo no diretório especificado.
Funções em destaque
- Suporte a vários idiomasKokoro-ONNX: Atualmente, o Kokoro-ONNX oferece suporte ao inglês e planeja oferecer suporte a mais idiomas, como francês, japonês, coreano e chinês.
- Várias opções de somSons: Os usuários podem selecionar diferentes sons, inclusive o modo sussurro, para atender às necessidades de diferentes cenários.
- Alto desempenhoExecuta quase em tempo real no macOS M1 para cenários de aplicativos que exigem uma resposta rápida.
- Design leveO tamanho reduzido do pacote de instalação facilita a implantação e o uso rápido.
Com essas etapas, os usuários podem instalar e usar facilmente o Kokoro-ONNX para obter uma funcionalidade eficiente de conversão de texto em fala. Os procedimentos operacionais detalhados e as descrições detalhadas dos recursos garantem que os usuários possam começar a usar a ferramenta rapidamente e tirar o máximo proveito dela.