랩뱅크: 가사와 백킹 트랙에서 랩(Rap) 보컬을 직접 생성하는 모델(현재 오픈 데이터 세트)

59.4K 00

일반 소개

랩뱅크는 랩 가사 생성을 위해 설계된 데이터 세트 및 도구 세트입니다. NZqian이 만든 이 프로젝트는 YouTube에서 랩송을 수집하고 처리하여 연구자와 개발자에게 고품질의 랩 가사 데이터 세트를 제공하는 것을 목표로 하며, 84개 언어로 된 9만 개 이상의 랩송이 포함되어 있고 사용자가 데이터를 효율적으로 처리하고 모델을 훈련할 수 있도록 상세한 처리 파이프라인과 사용 지침을 제공합니다. 이 프로젝트의 데이터와 코드는 CC BY-NC-SA 4.0 라이선스에 따라 GitHub에서 오픈 소스로 제공됩니다.

RapBank：根据歌词和伴奏直接生成说唱(Rap)人声的模型（目前开放了数据集）

기능 목록

데이터 세트 다운로드: 여러 언어로 된 90,000곡 이상의 랩 노래 데이터 세트입니다.
데이터 처리 파이프라인: 사용자가 데이터를 효율적으로 처리할 수 있도록 소스 분리, 세분화, 가사 인식과 같은 단계를 포함합니다.
상세 문서: 사용자가 빠르게 시작할 수 있도록 전체 지침과 샘플 코드를 제공합니다.
오픈 소스 코드: 모든 코드와 데이터는 GitHub에서 오픈 소스로 제공되므로 사용자가 2차 개발을 하기에 편리합니다.
라이선스 계약: 데이터와 코드는 CC BY-NC-SA 4.0 라이선스 계약의 적용을 받으며, 사용자가 합법적인 범위 내에서 사용할 수 있도록 보장합니다.

도움말 사용

설치 프로세스

프로젝트 웨어하우스 복제:

   git clone https://github.com/NZqian/RapBank.git
cd RapBank

종속성을 설치합니다:

   pip install -r requirements.txt

데이터 집합을 다운로드하여 지정된 폴더에 배치합니다(예 /path/to/your/data/wav.

데이터 처리

제공된 스크립트를 사용하여 데이터를 처리합니다:

   bash pipeline.sh /path/to/your/data /path/to/save/features start_stage stop_stage

start_stage 노래로 응답 stop_stage 매개 변수를 사용하여 0에서 5까지의 처리 시작 및 종료 단계를 지정할 수 있습니다.
빠른 처리를 위해 다중 GPU를 사용하는 것이 좋습니다.

기능 작동 흐름

데이터 세트 다운로드: 필요한 데이터 세트 파일을 다운로드하려면 GitHub 페이지를 방문하세요.
데이터 처리: 위의 단계에 따라 종속성을 설치하고 처리 스크립트를 실행하여 필요한 기능 파일을 생성합니다.
모델 학습: 처리된 데이터를 모델 학습에 사용하며, 구체적인 단계는 프로젝트 문서의 샘플 코드를 참조하세요.
결과 분석: 생성된 모델을 사용하여 랩 가사를 생성하고 결과를 분석 및 최적화합니다.

세부 기능

데이터 세트 다운로드90,000곡 이상의 랩 노래 데이터 세트를 사용자가 필요에 따라 다운로드하여 연구 개발에 사용할 수 있습니다.
데이터 처리 파이프라인소스 분리, 세분화, 가사 인식과 같은 여러 단계를 포함하여 사용자가 데이터를 효율적으로 처리하고 분석할 수 있도록 도와줍니다.
상세 문서이 프로젝트는 사용자가 빠르게 시작하고 2차 개발을 할 수 있도록 전체 지침과 샘플 코드를 제공합니다.
오픈 소스모든 코드와 데이터는 GitHub에서 오픈 소스로 제공되며 사용자가 자유롭게 다운로드하여 사용할 수 있습니다.
라이선스데이터와 코드는 CC BY-NC-SA 4.0 라이선스 계약을 따르며, 사용자가 합법적인 범위 내에서 사용하도록 보장합니다.