AIパーソナル・ラーニング
と実践的なガイダンス
讯飞绘镜

InspireMusic:Aliのオープンソース統合音楽・楽曲・音声生成フレームワーク

はじめに

InspireMusicはPyTorchベースのオープンソースツールキットで、音楽、歌、オーディオの生成に特化しています。InspireMusicは24kHzと48kHzのオーディオ生成をサポートし、長時間のオーディオ生成が可能です。InspireMusicの目標は、オーディオのラベリングとデラベリングのプロセスを通じて、ユーザーがサウンドスケープを革新し、音楽研究の調和美を高めるのを支援することです。

InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架-1

デモ:https://modelscope.cn/studios/iic/InspireMusic/summary


 

機能一覧

  • テキストから音楽へテキストキューから音楽を生成。
  • 音楽構成コントロール音楽構造に基づいて音楽を生成するためのサポート。
  • 音楽スタイル・コントロール生成される音楽のスタイルをコントロールできます。
  • 高品質オーディオ生成24kHzと48kHzのオーディオ生成に対応。
  • ロング・オーディオ・ジェネレーション長時間のオーディオ生成に対応。
  • ミックス精密トレーニングBF16、FP16/FP32の混合精度トレーニングに対応。
  • モデルの微調整と推論スクリプトや戦略の微調整や推論が容易。
  • オンラインデモModelScopeとHuggingFaceで体験できます。

 

ヘルプの使用

設置プロセス

  1. クローン倉庫
   git clone https://github.com/FunAudioLLM/InspireMusic.git
cd InspireMusic
  1. 依存関係をインストールします:
   pip install -r requirements.txt
  1. PyTorchをインストールする(CUDAのバージョンに適したインストールコマンドを選択する):
   pip install torch torchvision torchaudio

使用ガイドライン

テキストから音楽へ

  1. 例えば、"明るいピアノ曲を作ってください "などのプロンプトを用意する。
  2. 生成スクリプトを実行する:
   python app.py --text "生成一段欢快的钢琴音乐"
  1. 生成された音楽は指定された出力ディレクトリに保存されます。

音楽構成コントロール

  1. 音楽のリズムやコードなどを定義した音楽構造ファイルを用意する。
  2. 生成スクリプトを実行する:
   python app.py --structure path/to/structure/file
  1. 生成される音楽はストラクチャーファイルに基づいています。

音楽スタイル・コントロール

  1. クラシック」や「ジャズ」など、あらかじめ定義された音楽スタイルを選択します。
  2. 生成スクリプトを実行する:
   python app.py --style "古典"
  1. 生成される音楽は、選択された音楽スタイルにマッチします。

モデルの微調整と推論

InspireMusicは、ユーザーが必要に応じてモデルと推論を微調整できるように、便利な微調整と推論スクリプトを提供します。以下は簡単な微調整の例です:

  1. トレーニングデータセットを準備する。
  2. 微調整スクリプトを実行する:
   python finetune.py --data path/to/dataset --output path/to/output/model
  1. 微調整されたモデルによる推論:
   python app.py --model path/to/output/model --text "生成一段新的音乐"

オンラインデモ

ユーザーは、ModelScopeとHuggingFaceのオンライン・デモ・ページで、InspireMusicのパワーを体験することができます。テキストプロンプトを入力するだけで、高品質の音楽が生成されます。

 

jian27 統合パック

首席AI分享圈このコンテンツは作者によって非表示にされています。コンテンツを表示するには認証コードを入力してください。
キャプチャ
このサイトWeChat公開番号に注意してください、返信"CAPTCHA、チャレンジ・レスポンス・テストの一種(コンピューティング)"、認証コードを取得します。WeChatで"チーフAIシェアリングサークル「またはルックスAI"またはWeChatは、QRコードの右側をスキャンすると、このサイトWeChatの公開番号に注意を払うことができます。

無断転載を禁じます:チーフAIシェアリングサークル " InspireMusic:Aliのオープンソース統合音楽・楽曲・音声生成フレームワーク
ja日本語