Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1

RapBank: um modelo para gerar diretamente vocais de rap (Rap) a partir de letras e faixas de apoio (conjunto de dados atualmente aberto)

Introdução geral

O RapBank é um conjunto de dados e ferramentas projetado para a geração de letras de músicas de rap. O RapBank contém mais de 90.000 músicas de rap em 84 idiomas e fornece pipelines de processamento detalhados e instruções de uso para ajudar os usuários a processar os dados e treinar modelos com eficiência. Os dados e o código do projeto são de código aberto no GitHub sob a licença CC BY-NC-SA 4.0.

RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)-1


 

Lista de funções

  • Download do conjunto de dados: um conjunto de dados com mais de 90.000 músicas de rap em vários idiomas.
  • Pipeline de processamento de dados: inclui etapas como separação de fontes, segmentação e reconhecimento de letras para ajudar os usuários a processar dados com eficiência.
  • Documentação detalhada: forneça instruções completas e exemplos de código para ajudar os usuários a começar rapidamente.
  • Código-fonte aberto: todos os códigos e dados são de código aberto no GitHub, o que é conveniente para os usuários fazerem o desenvolvimento secundário.
  • Contrato de licença: os dados e o código estão sujeitos ao contrato de licença CC BY-NC-SA 4.0, garantindo que os usuários permaneçam dentro dos limites da legalidade.

 

Usando a Ajuda

Processo de instalação

  1. Clonagem do Project Warehouse:
   git clone https://github.com/NZqian/RapBank.git
cd RapBank
  1. Instale a dependência:
   pip install -r requirements.txt
  1. Faça o download do conjunto de dados e coloque-o na pasta especificada, por exemplo /path/to/your/data/wav.

processamento de dados

  1. Use os scripts fornecidos para processar os dados:
   bash pipeline.sh /path/to/your/data /path/to/save/features start_stage stop_stage
  • start_stage responder cantando stop_stage são usados para especificar os estágios inicial e final do processamento, variando de 0 a 5.
  • Recomenda-se o uso de várias GPUs para um processamento mais rápido.

Função Fluxo de operação

  1. Download do conjunto de dados: visite a página do GitHub para fazer o download dos arquivos necessários do conjunto de dados.
  2. Processamento de dados: siga as etapas acima para instalar as dependências e executar os scripts de processamento para gerar os arquivos de recursos necessários.
  3. Treinamento do modelo: use os dados processados para o treinamento do modelo. Consulte o código de amostra no documento do projeto para obter as etapas específicas.
  4. Análise dos resultados: geração de letras de rap usando o modelo gerado e análise e otimização dos resultados.

Funções detalhadas

  • Download do conjunto de dadosUm conjunto de dados de mais de 90.000 músicas de rap está disponível para os usuários baixarem e usarem para pesquisa e desenvolvimento, conforme necessário.
  • Pipeline de processamento de dadosInclui várias etapas, como separação de fontes, segmentação e reconhecimento de letras, para ajudar os usuários a processar e analisar dados com eficiência.
  • Documentação detalhadaO projeto fornece instruções completas e exemplos de código para ajudar os usuários a iniciar rapidamente o desenvolvimento secundário.
  • código abertoTodos os códigos e dados são de código aberto no GitHub e podem ser baixados e usados livremente pelos usuários.
  • licençaOs dados e o código seguem o contrato de licença CC BY-NC-SA 4.0, garantindo que o usuário os utilize dentro dos limites legais.
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " RapBank: um modelo para gerar diretamente vocais de rap (Rap) a partir de letras e faixas de apoio (conjunto de dados atualmente aberto)
pt_BRPortuguês do Brasil