Aprendizagem pessoal com IA
e orientação prática

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Introdução geral

O Easy-Voice-Toolkit é um kit de ferramentas versátil baseado no Projeto de Fala de Código Aberto que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva, conforme necessário, ou usá-las sequencialmente para converter gradualmente arquivos de áudio brutos em modelos de fala ideais. O kit de ferramentas é compatível com a implantação local e os usuários podem fazer o download de um pacote de instalação leve ou de um pacote portátil para uso.

 


Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

 

 

Lista de funções

  • processamento de áudio

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

 

  • reconhecimento de fala

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

 

  • transcrição de voz

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

 

  • Criação de conjunto de dados (conversão de SRT e divisão de WAV)

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

 

  • treinamento de modelos

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

 

  • síntese de fala

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

 

Usando a Ajuda

Processo de instalação:

  1. Download do instalador levePacotes pequenos que contêm instruções de instalação, mas não contêm as dependências e os modelos de ambiente necessários.
  2. Download do estojo de transporte pronto para usoPacote grande com todas as dependências de ambiente e várias predefinições de modelo, baixe e descompacte para usar.

Implementação local - Instalação do usuário:

  1. Faça o download do pacote de instalação leve ou do pacote portátil pronto para uso.
  2. Descompacte o arquivo baixado.
  3. estar em movimento .exe ou seu atalho.

Implementação local - ambiente de configuração do desenvolvedor:

  1. Certifique-se de que o Python 3.8 ou posterior esteja instalado.
  2. Clonagem do Project Warehouse:
    git clone https://github.com/Spr-Aachen/Easy-Voice-Toolkit.git
    
  3. Mude para o diretório do projeto:
    cd Kit de ferramentas Easy-Voice
    
  4. Instalar dependências:
    pip install -r requirements.txt
    
  5. Instale as dependências da GUI:
    pip install pyside6 QEasyWidgets pywin32==300 psutil pynvml darkdetect PyGithub
    
  6. Executar o programa:
    python Run.py
    

Fluxo de operação funcional:

  1. processamento de áudioImportar o arquivo de áudio, selecionar as ferramentas de processamento desejadas (por exemplo, redução de ruído, edição, etc.), aplicar o processamento e salvar o resultado.
  2. reconhecimento de falaImportar o arquivo de áudio, selecionar o modelo de reconhecimento de fala, executar o reconhecimento e exportar os resultados do texto.
  3. transcrição de vozImportar o arquivo de áudio, selecionar a ferramenta de transcrição, executar a transcrição e exportar o arquivo de legenda (por exemplo, SRT).
  4. Produção de conjuntos de dadosImportar arquivos de áudio, selecionar a ferramenta de criação de conjunto de dados e realizar a conversão SRT ou a divisão WAV para gerar um conjunto de dados de treinamento.
  5. treinamento de modelosImportar o conjunto de dados de treinamento, selecionar a ferramenta de treinamento do modelo, configurar os parâmetros de treinamento, executar o treinamento e salvar o modelo.
  6. transcrição fonéticaImportar arquivos de áudio, selecionar a ferramenta de conversão de voz, configurar os parâmetros de conversão, executar a conversão e salvar o resultado.

advertência

  • Atualmente, a interface da interface do usuário é compatível apenas com sistemas Windows.
  • Garanta uma conexão estável com a Internet durante o download e o uso.
  • Se você tiver problemas, consulte as instruções e as perguntas frequentes no repositório do projeto.
Aprendizagem fácil com IA

O guia do leigo para começar a usar a IA

Ajuda você a aprender a utilizar as ferramentas de IA com baixo custo e a partir de uma base zero.A IA, assim como o software de escritório, é uma habilidade essencial para todos. Dominar a IA lhe dará uma vantagem em sua busca de emprego e metade do esforço em seu trabalho e estudos futuros.

Ver detalhes>
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil