 

Posição atual:Chefe do Círculo de Compartilhamento de IA  Ferramentas de IA  texto principal (em vez de notas de rodapé)

Sapo pintado em alumínio

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

2024-09-04 Fonte:Kit de ferramentas Easy Voice Classificação:Ferramentas de IA

🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Introdução geral

O Easy-Voice-Toolkit é um kit de ferramentas versátil baseado no Projeto de Fala de Código Aberto que oferece uma ampla variedade de ferramentas de áudio automatizadas para reconhecimento de fala, transcrição de fala, conversão de fala, criação de conjuntos de dados e treinamento de modelos. Os usuários podem usar essas ferramentas de forma seletiva, conforme necessário, ou usá-las sequencialmente para converter gradualmente arquivos de áudio brutos em modelos de fala ideais. O kit de ferramentas é compatível com a implantação local e os usuários podem fazer o download de um pacote de instalação leve ou de um pacote portátil para uso.

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

Lista de funções

processamento de áudio

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

reconhecimento de fala

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

transcrição de voz

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

Criação de conjunto de dados (conversão de SRT e divisão de WAV)

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

treinamento de modelos

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

síntese de fala

Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local-1

Usando a Ajuda

Processo de instalação:

Download do instalador levePacotes pequenos que contêm instruções de instalação, mas não contêm as dependências e os modelos de ambiente necessários.
Download do estojo de transporte pronto para usoPacote grande com todas as dependências de ambiente e várias predefinições de modelo, baixe e descompacte para usar.

Implementação local - Instalação do usuário:

Faça o download do pacote de instalação leve ou do pacote portátil pronto para uso.
Descompacte o arquivo baixado.
estar em movimento .exe ou seu atalho.

Implementação local - ambiente de configuração do desenvolvedor:

Certifique-se de que o Python 3.8 ou posterior esteja instalado.

Clonagem do Project Warehouse:

git clone https://github.com/Spr-Aachen/Easy-Voice-Toolkit.git

Mude para o diretório do projeto:
```
cd Kit de ferramentas Easy-Voice
```
Instalar dependências:
```
pip install -r requirements.txt
```

Instale as dependências da GUI:

pip install pyside6 QEasyWidgets pywin32==300 psutil pynvml darkdetect PyGithub

Executar o programa:
```
python Run.py
```

Fluxo de operação funcional:

processamento de áudioImportar o arquivo de áudio, selecionar as ferramentas de processamento desejadas (por exemplo, redução de ruído, edição, etc.), aplicar o processamento e salvar o resultado.
reconhecimento de falaImportar o arquivo de áudio, selecionar o modelo de reconhecimento de fala, executar o reconhecimento e exportar os resultados do texto.
transcrição de vozImportar o arquivo de áudio, selecionar a ferramenta de transcrição, executar a transcrição e exportar o arquivo de legenda (por exemplo, SRT).
Produção de conjuntos de dadosImportar arquivos de áudio, selecionar a ferramenta de criação de conjunto de dados e realizar a conversão SRT ou a divisão WAV para gerar um conjunto de dados de treinamento.
treinamento de modelosImportar o conjunto de dados de treinamento, selecionar a ferramenta de treinamento do modelo, configurar os parâmetros de treinamento, executar o treinamento e salvar o modelo.
transcrição fonéticaImportar arquivos de áudio, selecionar a ferramenta de conversão de voz, configurar os parâmetros de conversão, executar a conversão e salvar o resultado.

advertência

Atualmente, a interface da interface do usuário é compatível apenas com sistemas Windows.
Garanta uma conexão estável com a Internet durante o download e o uso.
Se você tiver problemas, consulte as instruções e as perguntas frequentes no repositório do projeto.

Artigos relacionados

CDN1

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Easy Voice Toolkit: kit de ferramentas de voz com IA para implantação local

Projeto de código aberto de IA Conversão de texto em fala com IA Clonagem de voz com IA AI Speech to Text

Recomendado

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco

voltar ao topo

Português do Brasil