Introdução geral
O RapBank é um conjunto de dados e ferramentas projetado para a geração de letras de músicas de rap. O RapBank contém mais de 90.000 músicas de rap em 84 idiomas e fornece pipelines de processamento detalhados e instruções de uso para ajudar os usuários a processar os dados e treinar modelos com eficiência. Os dados e o código do projeto são de código aberto no GitHub sob a licença CC BY-NC-SA 4.0.
Lista de funções
- Download do conjunto de dados: um conjunto de dados com mais de 90.000 músicas de rap em vários idiomas.
- Pipeline de processamento de dados: inclui etapas como separação de fontes, segmentação e reconhecimento de letras para ajudar os usuários a processar dados com eficiência.
- Documentação detalhada: forneça instruções completas e exemplos de código para ajudar os usuários a começar rapidamente.
- Código-fonte aberto: todos os códigos e dados são de código aberto no GitHub, o que é conveniente para os usuários fazerem o desenvolvimento secundário.
- Contrato de licença: os dados e o código estão sujeitos ao contrato de licença CC BY-NC-SA 4.0, garantindo que os usuários permaneçam dentro dos limites da legalidade.
Usando a Ajuda
Processo de instalação
- Clonagem do Project Warehouse:
git clone https://github.com/NZqian/RapBank.git
cd RapBank
- Instale a dependência:
pip install -r requirements.txt
- Faça o download do conjunto de dados e coloque-o na pasta especificada, por exemplo
/path/to/your/data/wav
.
processamento de dados
- Use os scripts fornecidos para processar os dados:
bash pipeline.sh /path/to/your/data /path/to/save/features start_stage stop_stage
start_stage
responder cantandostop_stage
são usados para especificar os estágios inicial e final do processamento, variando de 0 a 5.- Recomenda-se o uso de várias GPUs para um processamento mais rápido.
Função Fluxo de operação
- Download do conjunto de dados: visite a página do GitHub para fazer o download dos arquivos necessários do conjunto de dados.
- Processamento de dados: siga as etapas acima para instalar as dependências e executar os scripts de processamento para gerar os arquivos de recursos necessários.
- Treinamento do modelo: use os dados processados para o treinamento do modelo. Consulte o código de amostra no documento do projeto para obter as etapas específicas.
- Análise dos resultados: geração de letras de rap usando o modelo gerado e análise e otimização dos resultados.
Funções detalhadas
- Download do conjunto de dadosUm conjunto de dados de mais de 90.000 músicas de rap está disponível para os usuários baixarem e usarem para pesquisa e desenvolvimento, conforme necessário.
- Pipeline de processamento de dadosInclui várias etapas, como separação de fontes, segmentação e reconhecimento de letras, para ajudar os usuários a processar e analisar dados com eficiência.
- Documentação detalhadaO projeto fornece instruções completas e exemplos de código para ajudar os usuários a iniciar rapidamente o desenvolvimento secundário.
- código abertoTodos os códigos e dados são de código aberto no GitHub e podem ser baixados e usados livremente pelos usuários.
- licençaOs dados e o código seguem o contrato de licença CC BY-NC-SA 4.0, garantindo que o usuário os utilize dentro dos limites legais.