検索ベースの音声変換WebUI：検索ベースの音声変換フレームワーク｜リアルな歌声をシミュレートする

はじめに

検索 VITSベースの音声変換WebUIは、シンプルで使いやすいVITSベースの音声変換フレームワークです。Nカード、Aカード、Iカードアクセラレーションをサポートし、ウェブインタフェースとリアルタイム音声変換インタフェースを提供します。また、UVR5モデルを呼び出して、人間の声とバッキングボーカルを素早く分離し、最先端のボーカルピッチ抽出アルゴリズムRMVPEを使用して、ミュートボイスの問題を解消します。

コラボ・オンライン・エクスペリエンス

一番下のモデルは、オープンソースの高品質なVCTKトレーニングセットを50時間近く使用してトレーニングされており、著作権上の問題はない。

より大きなパラメーター、より大きなデータ、より良い結果、基本的に同等の推論スピード、より少ないトレーニングデータで、RVCv3のボトムモデルを楽しみにしていてほしい。

トレーニング推論インターフェース

リアルタイム音声変更インターフェース

機能一覧

わずか10分の音声データで独自の音声変換モデルをトレーニング
事前に訓練された音声変換モデルを使用して、複数のサンプルレートとトーンをサポートします。
エンド・ツー・エンドの低遅延をサポートするウェブ・インターフェイスまたはリアルタイム音声変換インターフェイスを使用した音声変換
UVR5モデリングを使用してボーカルとバッキングトラックを分離、複数のオーディオファイル形式に対応
RMVPEアルゴリズムを使ってボーカルのピッチを抽出し、pytorch/onnx/DirectMLをサポートする。

ヘルプの使用

このリポジトリをダウンロードまたはクローンし、必要な依存関係とプリモデルをインストールする。
go-web.batまたはgo-realtime-gui.batを実行し、実行したいアクションを選択する。
インターフェイスのプロンプトに従って、入力と出力の音声ファイルまたはデバイスを選択し、パラメータとオプションを調整します。
開始または停止をクリックして、音声変換をお楽しみください！

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ

検索ベースの音声変換WebUI：検索ベースの音声変換フレームワーク｜実際の歌声をシミュレートする

はじめに

機能一覧

ヘルプの使用

関連記事

フィッシュ・エージェント：エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

CosyVoice：3秒間の突進ボイス・クローニング・オープンソース・プロジェクトがアリによって立ち上げられる。

Coqui TTS (xTTS)：多言語サポートと音声クローン機能を備えた音声合成用ディープラーニングツールキット

F5-TTS: 滑らかで感情豊かなクローン音声を生成するサンプルレス・スピーチ・クローニング

おすすめ

AIツールが見つからない？こちらをお試しください！

FLUX.1イメージジェネレーター（中国語入力対応）

新着情報

人気記事

ホットタグ

チーフAIシェアリングサークル