SongBloom-テンセントがHKCSとNTUと共同開発したオープンソースの楽曲生成モデル

堆友AI

SongBloomとは?

SongBloomは、テンセントAIラボが香港中文大学(深圳)、南京大学と共同で開発したオープンソースの楽曲生成モデルで、AI音楽生成における「可塑性」の問題を解決し、高品質で構造的に完全な楽曲生成を実現している。わずか10秒間のリファレンス音声とそれに対応する歌詞を入力するだけで、イントロ、メイン曲、サビ、コーラス、エンディングを含む2分30秒のデュアルチャンネル/48kHz高忠実度完全構造曲を生成することができる。革新的な技術により、歌詞とメロディが不一致になる「錯覚発生」現象を劇的に低減し、音素エラー率を大幅に削減し、歌詞の精度を業界で新たなレベルに引き上げました。ボーカルの繊細さは市販のトップモデルSuno-V4.5を凌ぎ、音楽性はプロの作曲に匹敵する。 長時間楽曲生成に初めて自己回帰拡散モデルを導入し、離散スケッチトークンとVAE潜在技術を組み合わせることで、構造の一貫性と音のディテールを考慮している。

SongBloom - 腾讯联合港中文、南大开源的歌曲生成模型

SongBloomの特徴

  • 効率的なキャパシティの創出最新の機能は、10秒間のオーディオ・サンプルとそれに対応する歌詞だけで、2分30秒に及ぶフル・ソングを素早く生成できることだ。
  • 高品質オーディオ出力デュアルチャンネル、48kHz高音質オーディオをサポートし、クリアでプロフェッショナルな音質を実現。
  • イノベーション創出のパラダイム曲の構成と音質を最適化するために、自己回帰スケッチと拡散モデルの改良を組み合わせたインターリーブ生成技術を使用。
  • マルチモーダル入力サポート歌詞と音声サンプルの両方の入力をサポートし、マルチモーダルな情報を正確に融合して、よりニーズに合った楽曲を生成します。
  • オープンソースの使いやすさこのプロジェクトはオープンソースであり、詳細なガイドラインと複数のモデルバージョンを提供し、導入と使用が容易で、さまざまなデバイスの実行に適しています。
  • SOTAに近いパフォーマンス音質と歌詞の正確さにおいて、既存のオープンソースモデルを凌駕しています。

SongBloomの強み

  • 効率的な完全楽曲の生成イントロ、リード、コーラス、アウトロの完全な構成を持つ2分30秒のデュアル・チャンネル/48kHz Hi-Fiフル・ソングを生成します。
  • 正確な歌詞マッチング歌詞とメロディーの不一致という「錯覚発生」現象は、革新的な技術によって大幅に軽減され、音韻エラー率も大幅に減少した結果、歌詞の精度は業界で新たな高水準に達した。
  • 優れた音質と音楽性業務用トップモデル「Suno-V4.5」を凌駕する繊細なボーカルと、プロの作曲に匹敵する音楽性で、この分野の最高峰に迫る。
  • 高品質出力音声品質は、2チャンネル、48kHzの高音質オーディオ生成に対応し、フィールド(SOTA)で最高レベルに近い、クリアでプロフェッショナルなものです。
  • 革新的産業曲の全体的な構造と音質を最適化するために、自己回帰スケッチと拡散モデルの改良を組み合わせたスタッガード生成パラダイムが使用され、技術的に先導している。
  • マルチモーダルフュージョン歌詞と音声サンプルの両方の入力をサポートし、マルチモーダルな情報を正確に融合して、よりニーズに合った楽曲を生成します。

SongBloomの公式ウェブサイトは?

  • Githubリポジトリ:: https://github.com/tencent-ailab/SongBloom
  • HuggingFaceモデルライブラリ:: https://huggingface.co/CypressYang/SongBloom
  • arXivテクニカルペーパー:: https://arxiv.org/pdf/2506.07634
  • オンライン体験デモ:: https://cypress-yang.github.io/SongBloom_demo/

SongBloomの対象者

  • 音楽クリエイタープロのミュージシャンにもアマチュアにも、創造的なインスピレーションと楽曲を素早く生み出すフレームワークを提供し、新しい音楽スタイルやクリエイティブな方向性を探求する手助けをする。
  • オーディオ・プロデューサー映画、テレビ、ゲーム、広告などの音響制作において、BGMやテーマソングを素早く生成し、制作効率を高めるために使用される。
  • 音楽教育者と学生生徒が音楽の構造と創造過程を理解し、学習への興味を喚起し、教師の指導を助けるための音楽教育ツールとして。
  • コンテンツクリエーターソーシャル・メディア、ショート・ビデオ、その他のプラットフォームで、ユーザーにパーソナライズされた音楽コンテンツを提供し、双方向性と楽しさを高める。
  • 企業・ブランドサイド企業やブランドのためにカスタマイズされた音楽を生成し、製品プロモーションやイベント宣伝などに使用することで、ブランドインパクトやユーザーエンゲージメントを高めることができます。
© 著作権表示

関連記事

コメントなし

コメントに参加するにはログインが必要です!
今すぐログイン
なし
コメントはありません