AIパーソナル・ラーニング
と実践的なガイダンス

EchoMimic:音声によるリアルな肖像画アニメーション

はじめに

EchoMimicは、音声によってリアルな肖像画アニメーションを生成することを目的としたオープンソースプロジェクトです。AntグループのTerminal Technologies部門によって開発されたこのプロジェクトは、編集可能なマーカーポイント条件を利用し、音声と顔のマーカーポイントを組み合わせたダイナミックなポートレート動画を生成します。EchoMimicは、複数の公開データセットと専有データセットで包括的に比較され、定量的評価と定性的評価の両方で優れた性能を実証しています。

EchoMimicバージョンV2は推論速度を最適化するものであり、これを推奨する。


EchoMimic: オーディオ駆動のリアルなポートレート・アニメーション-1

デモアドレス:https://www.modelscope.cn/studios/BadToBest/BadToBest

 

機能一覧

  • オーディオドライバーアニメーション音声入力でリアルな似顔絵アニメーションを生成。
  • マーカーポイント駆動アニメーション顔のマーカーポイントを使って安定したポートレートアニメーションを生成します。
  • オーディオ+マーカードライバー音声と顔のマーカーを組み合わせて、より自然な似顔絵アニメーションを作成できます。
  • 多言語サポート中国語、英語、その他の言語の音声入力に対応。
  • 効率的な推論最適化されたモデルとパイプラインは、推論速度を大幅に向上させます。

 

ヘルプの使用

設置プロセス

  1. ダウンロードコード::
    git clone https://github.com/BadToBest/EchoMimic
    cd エコーミミック
    
  2. Python環境のセットアップ::
    • 仮想環境を作るにはcondaを使うことをお勧めする:
      conda create -n echomimic python=3.8
      echomimic を起動する
      
    • 依存パッケージをインストールします:
      pip install -r requirements.txt
      
  3. ffmpeg-staticをダウンロードして解凍する。::
    • ffmpeg-staticをダウンロードして解凍し、環境変数を設定する:
      export FFMPEG_PATH=/path/to/ffmpeg-4.4-amd64-static
      
  4. トレーニング前のウエイトをダウンロードする::
    • プロジェクトの説明に従って、適切な訓練済みモデルの重みをダウンロードする。

使用プロセス

  1. ウェブインターフェースの実行::
    • ウェブインターフェースを起動する:
      python webgui.py
      
    • ローカルサーバーにアクセスしてインターフェイスを表示し、アニメーション生成用の音声ファイルをアップロードする。
  2. コマンドライン推論::
    • 音声によるポートレート・アニメーションの生成には、以下のコマンドを使用します:
      python infer_audio2vid.py --audio_path /path/to/audio --output_path /path/to/output
      
    • 道しるべと連動した推論:
      python infer_audio2vid_pose.py --audio_path /path/to/audio --landmark_path /path/to/landmark --output_path /path/to/output
      
  3. モデルの最適化::
    • 最適化されたモデルとパイプラインを使用することで、推論速度を大幅に向上させることができます。例えば、V100 GPUでは7分/240 fpsから50秒/240 fpsになります。

ほら

  • 使用するPythonのバージョンとCUDAのバージョンがプロジェクトの要件と一致していることを確認する。
  • 使用中に問題が発生した場合は、プロジェクトのREADMEファイルを参照するか、GitHubにissueを送信して助けを求めることができます。

 

Windowsワンクリックインストーラー

チーフAIシェアリングサークルこのコンテンツは作者によって非表示にされています。コンテンツを表示するには認証コードを入力してください。
キャプチャ
このサイトWeChat公開番号に注意してください、返信"CAPTCHA、チャレンジ・レスポンス・テストの一種(コンピューティング)"、認証コードを取得します。WeChatで"チーフAIシェアリングサークル「またはルックスAI"またはWeChatは、QRコードの右側をスキャンすると、このサイトWeChatの公開番号に注意を払うことができます。

AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " EchoMimic:音声によるリアルな肖像画アニメーション

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語