MuseGAN: um modelo de código aberto para gerar músicas/trilhas sonoras de várias faixas e criar facilmente clipes de música para vários instrumentos

Recursos mais recentes de IAPublicado há 8 meses Círculo de compartilhamento de IA

1.9K 00

Introdução geral

O MuseGAN é um projeto de geração de música baseado em Redes Adversárias Generativas (GANs) projetado para gerar músicas com várias faixas (vários instrumentos). O projeto é capaz de gerar músicas do zero ou acompanhadas por faixas fornecidas pelo usuário. O MuseGAN é treinado usando o conjunto de dados Lakh Pianoroll para gerar trechos de músicas populares contendo baixo, bateria, guitarras, piano e cordas. A implementação mais recente baseia-se em uma arquitetura de rede de camadas convolucionais 3D com um tamanho de rede menor, mas com controle reduzido. O MuseGAN oferece vários scripts para facilitar as operações, como o gerenciamento de experimentos, o treinamento de novos modelos e a inferência e interpolação usando modelos pré-treinados.

Lista de funções

Gerar música de várias faixas: gere clipes de música do zero contendo vários instrumentos.
Geração de acompanhamento: gere acompanhamentos com base em faixas fornecidas pelo usuário.
Treinamento de novos modelos: Scripts e arquivos de configuração são fornecidos para facilitar aos usuários o treinamento de seus próprios modelos de geração de música.
Uso de modelos pré-treinados: baixe e use modelos pré-treinados para geração de música.
Processamento de dados: faça o download e processe os dados de treinamento com suporte para o Lakh Pianoroll Dataset.
Gerenciamento de experimentos: forneça uma variedade de scripts para facilitar aos usuários a configuração e o gerenciamento de experimentos.
Formato de saída: a música gerada pode ser salva em matrizes numpy, arquivos de imagem e formatos de arquivo pianoroll de várias faixas.

Usando a Ajuda

Processo de instalação

Certifique-se de que o pipenv (recomendado) ou o pip esteja instalado.
Use o pipenv para instalar as dependências:

bash
instalação do pipenv
shell do pipenv

或使用pip安装依赖：

bash
pip install -r requirements.txt

### 数据准备
1. 下载训练数据：

bash
. /scripts/download_data.sh

2. 处理训练数据：

bash
. /scripts/process_data.sh

### 训练新模型
1. 设置新实验：

bash
. /scripts/setupexp.sh ". /exp/myexperiment/" "Observações sobre o experimento"

2. 修改配置文件和模型参数文件以设置实验参数。
3. 训练模型：

bash
. /scripts/runtrain.sh ". /exp/myexperimento/" "0"

或运行完整实验（训练+推理+插值）：

bash
. /scripts/runexp.sh ". /exp/myexperimento/" "0"

### 使用预训练模型
1. 下载预训练模型：

bash
. /scripts/download_models.sh

2. 使用预训练模型进行推理：

bash
. /scripts/run_inference.sh ". /exp/default/" "0"

或进行插值：

bash
. /scripts/run_interpolation.sh ". /exp/default/" "0"

### 输出管理
生成的音乐样本默认会在训练过程中生成，可以通过设置配置文件中的`save_samples_steps`为0来禁用此行为。生成的音乐样本会以以下三种格式保存：
- `.npy`：原始numpy数组
- `.png`：图像文件
- `.npz`：多轨pianoroll文件，可通过Pypianoroll包加载
可以通过设置配置文件中的`save_array_samples`、`save_image_samples`和`save_pianoroll_samples`为False来禁用特定格式的保存。生成的pianoroll文件以`.npz`格式保存，以节省空间和处理时间。可以使用以下代码将其写入MIDI文件：

python
from pypianoroll import Multitrack
m = Multitrack('. /test.npz')
m.write('. /test.mid')

Exemplos de resultados

Alguns exemplos de resultados podem ser encontrados na seção./exp/pode ser encontrado no catálogo. Mais exemplos podem ser baixados nos links a seguir:

sample_results.tar.gz(54,7 MB): Exemplos de resultados de inferência e interpolação
training_samples.tar.gz(18,7 MB): Exemplos de resultados gerados em diferentes etapas

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

DreamTalk: Gere vídeos de conversação expressivos com uma única imagem de avatar!

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Digital Man Sincronização de portas #

8 meses atrás

02.6K

BlinkShot：输入提示词实时生成图像（免费接入Flux Schnell模型）

BlinkShot: geração de imagens em tempo real digitando palavras de alerta (acesso gratuito ao modelo Flux Schnell)

Recursos mais recentes de IA Geração de imagens on-line # AI # Projeto de código aberto AI Java

10 meses atrás

02.8K

匠邦AI：教师教学辅助AI助手，为老师提供备案教案/PPT课件/课题论文/出题组卷

Artisan AI: assistente de IA de auxílio ao ensino de professores, fornecendo aos professores planos de aula arquivados, material didático PPT, documentos de matérias, perguntas e documentos.

Recursos mais recentes de IA # Ferramentas educacionais de IA

7 meses atrás

03K

Hedra: Vídeo gratuito de fotos em personagens falantes e cantantes

Recursos mais recentes de IA # Controle de estilo de imagem AI # AI Digital Man

10 meses atrás

03.3K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

MuseGAN: um modelo de código aberto para gerar músicas/trilhas sonoras de várias faixas e criar facilmente clipes de música para vários instrumentos

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Exemplos de resultados

MoneyPrinterTurbo: gere cópias de vídeo e vídeos curtos em HD com um clique, inserindo um tema de vídeo

Mínimo: contêiner RAG de código aberto com suporte para implantação local ou integração ao ChatGPT, Claude

Artigos relacionados

DreamTalk: Gere vídeos de conversação expressivos com uma única imagem de avatar!

BlinkShot: geração de imagens em tempo real digitando palavras de alerta (acesso gratuito ao modelo Flux Schnell)

Artisan AI: assistente de IA de auxílio ao ensino de professores, fornecendo aos professores planos de aula arquivados, material didático PPT, documentos de matérias, perguntas e documentos.

Hedra: Vídeo gratuito de fotos em personagens falantes e cantantes

Sem comentários

Últimas coleções

Artigos mais recentes

MuseGAN: um modelo de código aberto para gerar músicas/trilhas sonoras de várias faixas e criar facilmente clipes de música para vários instrumentos

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Exemplos de resultados

MoneyPrinterTurbo: gere cópias de vídeo e vídeos curtos em HD com um clique, inserindo um tema de vídeo

Mínimo: contêiner RAG de código aberto com suporte para implantação local ou integração ao ChatGPT, Claude

Artigos relacionados

DreamTalk: Gere vídeos de conversação expressivos com uma única imagem de avatar!

BlinkShot: geração de imagens em tempo real digitando palavras de alerta (acesso gratuito ao modelo Flux Schnell)

Artisan AI: assistente de IA de auxílio ao ensino de professores, fornecendo aos professores planos de aula arquivados, material didático PPT, documentos de matérias, perguntas e documentos.

Hedra: Vídeo gratuito de fotos em personagens falantes e cantantes

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes