Aprendizagem pessoal com IA
e orientação prática

MockingBird: clonagem rápida de voz e treinamento de modelos, conversão de texto em fala com base no xtts v2

Introdução geral

O MockingBird é um projeto de código aberto que visa à clonagem rápida de voz e à conversão de texto em fala por meio da tecnologia de IA. Os usuários só precisam fornecer 5 segundos de amostras de voz para gerar qualquer conteúdo de voz. O projeto suporta uma variedade de conjuntos de dados chineses e funciona bem em sistemas Windows e Linux. O MockingBird usa a estrutura PyTorch e fornece ferramentas fáceis de usar e instruções detalhadas de instalação para desenvolvedores e pesquisadores.

MockingBird: clonagem rápida de voz, conversão de texto em fala com base na implementação do xtts_v2-1


 

MockingBird: clonagem rápida de voz e treinamento de modelos, conversão de texto em fala com base no xtts v2-1

 

Lista de funções

  • Clonagem de fala: gere conteúdo de fala arbitrário a partir de amostras de voz de 5 segundos
  • Texto para fala: insira o texto para gerar a fala correspondente
  • Suporte a vários idiomas: suporta mandarim e vários conjuntos de dados chineses
  • Operação em várias plataformas: compatível com os sistemas Windows e Linux
  • Processamento em tempo real: fornece geração de fala em tempo real
  • Código-fonte aberto: o código é aberto para facilitar o desenvolvimento secundário e a pesquisa

 

Usando a Ajuda

Processo de instalação

  1. Preparação ambiental::
    • Instale o Python 3.7 ou posterior.
    • Instale o PyTorch (recomenda-se a versão 1.9.0).
    • Instale o ffmpeg.
  2. Download do projeto::
    • Abra o endereço do projeto MockingBird, clique no botão verde "Code" (Código) e selecione "Download ZIP" (Baixar ZIP) para baixar o arquivo do projeto.
    • Ou use o comando git para fazer o download:git clone https://github.com/babysor/MockingBird.git
  3. Instalação de dependências::
    • Vá para o diretório do projeto e execute pip install -r requirements.txt Instale os pacotes Python necessários.
    • Se necessário, você pode usar o conda para criar um ambiente virtual e instalar dependências:conda env create -n env_name -f env.ymle, em seguida, ative o ambiente:conda activate env_name.
  4. modelo de transcrição fonética

Para reduzir o tamanho do arquivo principal, ele não contém o modelo de som para som. Se você precisar fazer o download separadamente, clique para ir paraModelo de download (3G)

 

Processo de uso

  1. Caixa de ferramentas de tempo de execução::
    • estar em movimento demo_toolbox.pypara abrir a tela Toolbox.
    • Selecione o arquivo de amostra de fala na caixa de ferramentas, insira o conteúdo do texto e clique no botão Generate (Gerar) para gerar o arquivo de fala correspondente.
  2. Modelos de treinamento::
  3. chamada remota::
    • O MockingBird fornece uma função de servidor da Web que permite que você use os resultados de fala gerados por invocação remota.
    • Configure e inicie o servidor da Web a ser chamado usando a interface da API.

problemas comuns

  • falha na instalaçãoVerifique se a sua versão do Python atende aos requisitos e preste atenção à compatibilidade de versões ao instalar o PyTorch.
  • qualidade de vozA qualidade das amostras de fala e a riqueza do conjunto de dados de treinamento afetam a eficácia da fala gerada, e é recomendável usar amostras de fala de alta qualidade e conjuntos de dados diversos para treinamento.

 

Download pré-empacotado para Windows (3,7 G/com modelagem de texto para som)

Chefe do Círculo de Compartilhamento de IAEste conteúdo foi ocultado pelo autor. Digite o código de verificação para visualizar o conteúdo
Captcha:
Preste atenção ao número público do WeChat deste site, responda "CAPTCHA, um tipo de teste de desafio-resposta (computação)", obtenha o código de verificação. Pesquise no WeChat por "Chefe do Círculo de Compartilhamento de IA"ou"Aparência-AI"ou WeChat escaneando o lado direito do código QR pode prestar atenção a esse número público do WeChat do site.

Aprendizagem fácil com IA

O guia do leigo para começar a usar a IA

Ajuda você a aprender a utilizar as ferramentas de IA com baixo custo e a partir de uma base zero.A IA, assim como o software de escritório, é uma habilidade essencial para todos. Dominar a IA lhe dará uma vantagem em sua busca de emprego e metade do esforço em seu trabalho e estudos futuros.

Ver detalhes>
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " MockingBird: clonagem rápida de voz e treinamento de modelos, conversão de texto em fala com base no xtts v2

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil