Aprendizagem pessoal com IA
e orientação prática

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução geral

O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido pelo thewh1teagle, o projeto tem como objetivo fornecer uma solução de síntese de fala rápida e eficiente. O Kokoro-ONNX é compatível com vários idiomas, inclusive inglês, com suporte planejado para francês, japonês, coreano e chinês. A ferramenta apresenta uma ampla seleção de vozes, incluindo um modo de sussurro, e tem excelente desempenho, capaz de ser executada quase em tempo real no macOS M1. O design leve do kokoro-ONNX facilita a instalação e o uso, tornando-o adequado para desenvolvedores e pesquisadores que precisam de uma solução TTS eficiente.

 

Lista de funções

  • Suporte de conversão de texto em fala (TTS) para vários idiomas
  • Várias opções de voz, incluindo o modo sussurro
  • Desempenho eficiente, operação quase em tempo real
  • Design leve, pacote de instalação com cerca de 300 MB (cerca de 80 MB após a quantificação)
  • Compatível com o macOS M1
  • Código aberto, com base nas licenças MIT e Apache 2.0

 

Usando a Ajuda

Processo de instalação

  1. Abra um terminal (PowerShell / Bash).
  2. Execute o seguinte comando para instalar o Kokoro-ONNX:
   pip install -U kokoro-onnx
  1. Faça o download dos documentos necessárioskokoro-v0_19.onnxresponder cantandovoices.jsone coloque-os no mesmo diretório.

Uso

  1. Execute o seguinte comando em um terminal para iniciar o Kokoro-ONNX:
   uv init -p 3.12
uv add kokoro-onnx soundfile
  1. comandante-em-chefe (militar)examples/save.pyCole o conteúdo do arquivohello.pyMédio.
  2. Baixar arquivokokoro-v0_19.onnxresponder cantandovoices.jsone coloque-os no mesmo diretório.
  3. Execute o seguinte comando para gerar a fala:
   python hello.py

Função Fluxo de operação

  1. Selecione o idioma e a voz: emvoices.jsonSelecione o idioma e a voz desejados na lista
  2. texto de entrada: emhello.pyDigite o texto a ser convertido em fala no campo
  3. Gerar discursoDepois de executar o script, o arquivo de voz gerado será salvo no diretório especificado.

Funções em destaque

  • Suporte a vários idiomasKokoro-ONNX: Atualmente, o Kokoro-ONNX oferece suporte ao inglês e planeja oferecer suporte a mais idiomas, como francês, japonês, coreano e chinês.
  • Várias opções de somSons: Os usuários podem selecionar diferentes sons, inclusive o modo sussurro, para atender às necessidades de diferentes cenários.
  • Alto desempenhoExecuta quase em tempo real no macOS M1 para cenários de aplicativos que exigem uma resposta rápida.
  • Design leveO tamanho reduzido do pacote de instalação facilita a implantação e o uso rápido.

Com essas etapas, os usuários podem instalar e usar facilmente o Kokoro-ONNX para obter uma funcionalidade eficiente de conversão de texto em fala. Os procedimentos operacionais detalhados e as descrições detalhadas dos recursos garantem que os usuários possam começar a usar a ferramenta rapidamente e tirar o máximo proveito dela.


Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil