AIパーソナル・ラーニング
と実践的なガイダンス

検索ベースの音声変換WebUI:検索ベースの音声変換フレームワーク|実際の歌声をシミュレートする

はじめに

検索ベースの音声変換WebUIは、シンプルで使いやすいVITSベースの音声変換フレームワークです。Nカード、Aカード、Iカードアクセラレーションをサポートし、ウェブインタフェースとリアルタイム音声変換インタフェースを提供します。また、UVR5モデルを呼び出して、人間の声とバッキングボーカルを素早く分離し、最先端の人間の声ピッチ抽出アルゴリズムRMVPEを使用して、ミュートボイスの問題を解消することができます。

コラボ・オンライン・エクスペリエンス

一番下のモデルは、オープンソースの高品質なVCTKトレーニングセットを50時間近く使用してトレーニングされており、著作権上の問題はない。


より大きなパラメーター、より大きなデータ、より良い結果、基本的に同等の推論スピード、より少ないトレーニングデータで、RVCv3のボトムモデルを楽しみにしていてほしい。

 

-1

トレーニング推論インターフェース

 

-2

リアルタイム音声変更インターフェース

 

 

機能一覧

 

  • わずか10分の音声データで独自の音声変換モデルをトレーニング
  • 事前に訓練された音声変換モデルを使用して、複数のサンプルレートとトーンをサポートします。
  • エンド・ツー・エンドの低遅延をサポートするウェブ・インターフェイスまたはリアルタイム音声変換インターフェイスを使用した音声変換
  • UVR5モデリングを使用してボーカルとバッキングトラックを分離、複数のオーディオファイル形式に対応
  • RMVPEアルゴリズムを使ってボーカルのピッチを抽出し、pytorch/onnx/DirectMLをサポートする。

 

 

ヘルプの使用

 

  • このリポジトリをダウンロードまたはクローンし、必要な依存関係とプリモデルをインストールする。
  • go-web.batまたはgo-realtime-gui.batを実行し、実行したいアクションを選択する。
  • インターフェイスのプロンプトに従って、入力と出力の音声ファイルまたはデバイスを選択し、パラメータとオプションを調整します。
  • 開始または停止をクリックして、音声変換をお楽しみください!
AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " 検索ベースの音声変換WebUI:検索ベースの音声変換フレームワーク|実際の歌声をシミュレートする

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語