InspireMusic: marco unificado de generación de música, canciones y audio de código abierto de Ali.

Introducción general

InspireMusic es un conjunto de herramientas de código abierto basado en PyTorch centrado en la generación de música, canciones y audio. Proporciona un marco unificado para generar audio de alta calidad con control sobre las pistas de texto, la estructura de la música y el estilo musical. InspireMusic admite la generación de audio a 24kHz y 48kHz y es capaz de generar audio de larga duración. El objetivo de InspireMusic es ayudar a los usuarios a innovar los paisajes sonoros y mejorar la estética armónica en la investigación musical a través del proceso de etiquetado y des-etiquetado de audio.

InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

Demostración: https://modelscope.cn/studios/iic/InspireMusic/summary

 

Lista de funciones

  • Texto a música: Genera música a partir de pistas de texto.
  • Control de la estructura musical: Soporte para generar música basada en estructuras musicales.
  • Control del estilo musical: Puedes controlar el estilo de la música generada.
  • Generación de audio de alta calidad: Admite la generación de audio de 24 kHz y 48 kHz.
  • Generación de audio de larga duración: Admite la generación de audio de larga duración.
  • Entrenamiento de precisión mixtoAdmite la formación de precisión mixta BF16, FP16/FP32.
  • Ajuste e inferencia del modelo: Facilita el ajuste y el razonamiento sobre guiones y estrategias.
  • Demostración en línea: Está disponible una demostración en línea y los usuarios pueden experimentarla en ModelScope y HuggingFace.

 

Utilizar la ayuda

Proceso de instalación

  1. Almacén de clonación:
   git clone https://github.com/FunAudioLLM/InspireMusic.git
cd InspireMusic
  1. Instale la dependencia:
   pip install -r requirements.txt
  1. Instale PyTorch (elija el comando de instalación adecuado para su versión de CUDA):
   pip install torch torchvision torchaudio

Normas de uso

Texto a música

  1. Prepare indicaciones de texto, por ejemplo: "Genere una pieza optimista de música para piano".
  2. Ejecute el script de generación:
   python app.py --text "生成一段欢快的钢琴音乐"
  1. La música generada se guardará en el directorio de salida especificado.

Control de la estructura musical

  1. Prepara un archivo de estructura musical que defina los ritmos, acordes, etc. de la música.
  2. Ejecute el script de generación:
   python app.py --structure path/to/structure/file
  1. La música generada se basará en el archivo de estructura.

Control del estilo musical

  1. Seleccione un estilo musical predefinido, por ejemplo "Clásica", "Jazz", etc.
  2. Ejecute el script de generación:
   python app.py --style "古典"
  1. La música generada coincidirá con el estilo musical seleccionado.

Ajuste e inferencia del modelo

InspireMusic proporciona cómodos scripts de ajuste e inferencia que permiten a los usuarios ajustar el modelo y la inferencia según sus necesidades. A continuación se muestra un sencillo ejemplo de ajuste:

  1. Prepare el conjunto de datos de entrenamiento.
  2. Ejecute el script de ajuste:
   python finetune.py --data path/to/dataset --output path/to/output/model
  1. Inferencia mediante un modelo ajustado:
   python app.py --model path/to/output/model --text "生成一段新的音乐"

Demostración en línea

Los usuarios pueden visitar las páginas de demostración en línea de ModelScope y HuggingFace para experimentar la potencia de InspireMusic. Basta con introducir texto para generar música de alta calidad.

 

jian27 Paquete de integración

Quark: https://pan.quark.cn/s/4843d9c54615

Baidu: https://pan.baidu.com/s/1hKIHENqPbKRBjnbVRBni7Q?pwd=2727

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...