InspireMusic: estrutura de geração de música, canção e áudio unificada e de código aberto da Ali

Recursos mais recentes de IAAtualizado há 6 meses Círculo de compartilhamento de IA

18.6K 00

Introdução geral

O InspireMusic é um kit de ferramentas de código aberto baseado no PyTorch voltado para a geração de música, canções e áudio. Ele fornece uma estrutura unificada para a geração de áudio de alta qualidade com controle sobre dicas de texto, estrutura musical e estilo musical. O InspireMusic é compatível com a geração de áudio de 24kHz e 48kHz e é capaz de gerar áudio longo. O kit de ferramentas não só fornece código de inferência e treinamento, mas também suporta treinamento de precisão mista para ajuste fino e inferência de modelos. O objetivo do InspireMusic é ajudar os usuários a inovar paisagens sonoras e aprimorar a estética harmônica na pesquisa musical por meio do processo de rotulagem e desrotulagem de áudio.

Demonstração: https://modelscope.cn/studios/iic/InspireMusic/summary

Lista de funções

Texto para músicaGeração de música a partir de dicas de texto.
Controle da estrutura musicalSuporte para geração de música com base em estruturas musicais.
Controle de estilo musicalMúsica: Você pode controlar o estilo da música gerada.
Geração de áudio de alta qualidadeSuporte para geração de áudio de 24kHz e 48kHz.
Geração de áudio longoSuporte à geração de áudio de longa duração: suporta a geração de áudio de longa duração.
Treinamento de precisão mistoSuporte para treinamento de precisão mista BF16, FP16/FP32.
Ajuste fino e inferência de modelosPermite fácil ajuste fino e raciocínio sobre scripts e estratégias.
Demonstração on-lineDemonstração on-line: Uma demonstração on-line está disponível e os usuários podem experimentá-la no ModelScope e no HuggingFace.

Usando a Ajuda

Processo de instalação

Armazém de Clonagem:

   git clone https://github.com/FunAudioLLM/InspireMusic.git
cd InspireMusic

Instale a dependência:

   pip install -r requirements.txt

Instale o PyTorch (escolha o comando de instalação apropriado para sua versão do CUDA):

   pip install torch torchvision torchaudio

Diretrizes para uso

Texto para música

Preparar instruções de texto, por exemplo, "Generate an upbeat piece of piano music" (Crie uma música de piano animada).
Execute o script de geração:

   python app.py --text "生成一段欢快的钢琴音乐"

A música gerada será salva no diretório de saída especificado.

Controle da estrutura musical

Prepare um arquivo de estrutura musical que defina os ritmos, acordes etc. da música.
Execute o script de geração:

   python app.py --structure path/to/structure/file

A música gerada será baseada no arquivo de estrutura.

Controle de estilo musical

Selecione um estilo musical predefinido, por exemplo, "Clássico", "Jazz", etc.
Execute o script de geração:

   python app.py --style "古典"

A música gerada corresponderá ao estilo musical selecionado.

Ajuste fino e inferência de modelos

O InspireMusic oferece scripts convenientes de ajuste fino e inferência que permitem aos usuários ajustar o modelo e a inferência de acordo com suas necessidades. Veja abaixo um exemplo simples de ajuste fino:

Prepare o conjunto de dados de treinamento.
Execute o script de ajuste fino:

   python finetune.py --data path/to/dataset --output path/to/output/model

Inferência usando um modelo com ajuste fino:

   python app.py --model path/to/output/model --text "生成一段新的音乐"

Demonstração on-line

Os usuários podem visitar as páginas de demonstração on-line no ModelScope e no HuggingFace para experimentar o poder do InspireMusic. Basta inserir prompts de texto para gerar músicas de alta qualidade.

jian27 Pacote de integração

Quark: https://pan.quark.cn/s/4843d9c54615

Baidu: https://pan.baidu.com/s/1hKIHENqPbKRBjnbVRBni7Q?pwd=2727

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Clarisign: uma ferramenta inteligente para elaboração e assinatura rápida de contratos com IA

Recursos mais recentes de IA # Ferramentas de produtividade profissional

5 meses atrás

017.6K

AIFlowy - Plataforma de desenvolvimento de aplicativos de IA empresarial de código aberto

Recursos mais recentes de IA

3 meses atrás

015.7K

Rabbit Android Agent: inteligência controlada por voz para aplicativos Android (não aberto)

Recursos mais recentes de IA # Inteligência de automação de desktop

7 meses atrás

017.2K

Sana Labs: uma ferramenta de IA para gestão de conhecimento empresarial e ciência de treinamento de funcionários

Recursos mais recentes de IA # Ferramentas educacionais de IA # Recuperação de conhecimento e estrutura RAG

8 meses atrás

021.5K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

InspireMusic: estrutura de geração de música, canção e áudio unificada e de código aberto da Ali

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Diretrizes para uso

Texto para música

Controle da estrutura musical

Controle de estilo musical

Ajuste fino e inferência de modelos

Demonstração on-line

Gemini Playground: implantação sem servidor de um site de diálogo multimodal Gemini

HunyuanVideoGP: um modelo de geração de vídeo híbrido com suporte para operação de GPU de baixo custo

Artigos relacionados

Clarisign: uma ferramenta inteligente para elaboração e assinatura rápida de contratos com IA

AIFlowy - Plataforma de desenvolvimento de aplicativos de IA empresarial de código aberto

Rabbit Android Agent: inteligência controlada por voz para aplicativos Android (não aberto)

Sana Labs: uma ferramenta de IA para gestão de conhecimento empresarial e ciência de treinamento de funcionários

Sem comentários

Últimas coleções

Artigos mais recentes

InspireMusic: estrutura de geração de música, canção e áudio unificada e de código aberto da Ali

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Diretrizes para uso

Texto para música

Controle da estrutura musical

Controle de estilo musical

Ajuste fino e inferência de modelos

Demonstração on-line

Gemini Playground: implantação sem servidor de um site de diálogo multimodal Gemini

HunyuanVideoGP: um modelo de geração de vídeo híbrido com suporte para operação de GPU de baixo custo

Artigos relacionados

Clarisign: uma ferramenta inteligente para elaboração e assinatura rápida de contratos com IA

AIFlowy - Plataforma de desenvolvimento de aplicativos de IA empresarial de código aberto

Rabbit Android Agent: inteligência controlada por voz para aplicativos Android (não aberto)

Sana Labs: uma ferramenta de IA para gestão de conhecimento empresarial e ciência de treinamento de funcionários

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes