AIパーソナル・ラーニング
と実践的なガイダンス

MockingBird: 高速音声クローニングとモデルトレーニング、xtts v2に基づく音声合成

はじめに

MockingBirdは、AI技術によって高速な音声クローンと音声合成を実現することを目的としたオープンソースプロジェクトである。ユーザーは5秒間の音声サンプルを提供するだけで、あらゆる音声コンテンツを生成することができる。MockingBirdはPyTorchフレームワークを使用し、開発者や研究者向けに使いやすいツールと詳細なインストール手順を提供している。

MockingBird: 高速音声クローン、xtts_v2実装に基づく音声合成-1


 

機能一覧

  • 音声クローニング:5秒間の音声サンプルから任意の音声コンテンツを生成
  • 音声合成:テキストを入力し、対応する音声を生成する
  • 多言語サポート:北京語と複数の中国語データセットをサポート
  • クロスプラットフォーム動作:WindowsとLinuxシステムに対応
  • リアルタイム処理:リアルタイムの音声生成を提供
  • オープンソース・コード:二次開発や研究を容易にするためにコードが公開されている。

 

ヘルプの使用

設置プロセス

  1. 環境準備::
    • Python 3.7以降をインストールする。
    • PyTorchをインストールする(バージョン1.9.0推奨)。
    • ffmpegをインストールする。
  2. ダウンロード・プロジェクト::
    • MockingBirdプロジェクトのアドレスを開き、緑の "Code "ボタンをクリックし、"Download ZIP "を選択してプロジェクトファイルをダウンロードする。
    • またはgitコマンドを使ってダウンロードする:git clone https://github.com/babysor/MockingBird.git
  3. 依存関係のインストール::
    • プロジェクト・ディレクトリに移動し、以下を実行する。 pip install -r requirements.txt 必要なPythonパッケージをインストールする。
    • 必要であれば、condaを使って仮想環境を作成し、依存関係をインストールすることができる:conda env create -n env_name -f env.ymlそして環境をアクティブにする:condaはenv_nameをアクティブにする.
  4. 音声転写モデル

あなたが個別にダウンロードする必要がある場合は、メインファイルのサイズを小さくするために、サウンドモデルに音が含まれていない、に移動するにはクリックしてください。ダウンロードモデル(3G)

 

使用プロセス

  1. ランタイムツールボックス::
    • うごきだす demo_toolbox.pyをクリックしてツールボックス画面を開きます。
    • ツールボックスで音声サンプルファイルを選択し、テキスト内容を入力して「生成」ボタンをクリックすると、対応する音声ファイルが生成されます。
  2. トレーニングモデル::
    • 独自のモデルをトレーニングする必要がある場合は、プロジェクトのトレーニングチュートリアルに従うことができます。
    • トレーニングデータセットをダウンロードして準備し、以下を実行する。 train.py トレーニングを開始する。
    • トレーニングモデル用中国語ヘルプファイル
  3. リモートコール::
    • MockingBirdはウェブサーバー機能を提供しており、生成された発話結果をリモート呼び出しで利用することができます。
    • APIインターフェースを使用して呼び出されるウェブサーバーを設定し、起動する。

一般的な問題

  • 設置失敗Pythonのバージョンが要件を満たしていることを確認し、PyTorchをインストールする際にはバージョンの互換性に注意してください。
  • 声質音声サンプルの品質とトレーニングデータセットの豊富さは、生成音声の有効性に影響するため、トレーニングには高品質の音声サンプルと多様なデータセットを使用することが推奨されます。

 

Windows用プリパッケージダウンロード(3.7G/テキストからサウンドへのモデリング付き)

チーフAIシェアリングサークルこのコンテンツは作者によって非表示にされています。コンテンツを表示するには認証コードを入力してください。
キャプチャ
このサイトWeChat公開番号に注意してください、返信"CAPTCHA、チャレンジ・レスポンス・テストの一種(コンピューティング)"、認証コードを取得します。WeChatで"チーフAIシェアリングサークル「またはルックスAI"またはWeChatは、QRコードの右側をスキャンすると、このサイトWeChatの公開番号に注意を払うことができます。

AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " MockingBird: 高速音声クローニングとモデルトレーニング、xtts v2に基づく音声合成

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語