VideoReTalking：音声駆動型リップシンク＆ビデオ編集システム

中国初のAI IDE インテリジェント・プログラミング・ソフトウェア 🚀体験への招待 Trae 中国語版ダウンロードDeepSeek-R1とDoubao-proは無制限で利用できる！

はじめに

VideoReTalkingは、入力音声に基づいてリップシンクされた顔映像を生成し、異なる感情であっても高品質でリップシンクされた出力映像を生成できる革新的なシステムです。このシステムは、典型的な表情を持つ顔映像の生成、音声によるリップシンクロ、フォトリアリズムを向上させるための顔強調という3つのタスクに分かれています。VideoReTalkingは、この3つのステップを学習ベースのアプローチで処理し、ユーザーの介入なしに順次実行することができます。VideoReTalkingとその音声駆動型リップシンクロ・トーキングヘッド・ビデオ編集への応用については、提供されたリンクからご覧ください。

VideoReTalking：音频驱动的嘴唇同步和视频编辑系统-1

(鮮明でない、ビデオの画質を2回上げる必要がある、中国語へのリップシンクが少し悪い)

機能一覧

顔動画生成：入力音声をもとに、典型的な表情の顔動画を生成する。
オーディオ・ドリブン・リップシンク：与えられたオーディオに基づいてリップシンクされたビデオを生成します。
フェイシャル・エンハンスメント：アイデンティティを意識したフェイシャル・エンハンスメント・ネットワークと後処理により、合成顔のフォトリアリズムを向上させる。

ヘルプの使用

訓練済みモデルをダウンロードし、`./checkpoints`に置く。
python3 inference.py`を実行して、ビデオを素早く推論する。
エクスプレッションは `--exp_img` または `--up_face` という引数を追加することで制御できる。

オンライン体験アドレス

このコンテンツは作者によって非表示にされています。コンテンツを表示するには認証コードを入力してください。

このサイトWeChat公開番号に注意してください、返信"CAPTCHA、チャレンジ・レスポンス・テストの一種（コンピューティング）"、認証コードを取得します。WeChatで"チーフAIシェアリングサークル「またはルックスAI"またはWeChatは、QRコードの右側をスキャンすると、このサイトWeChatの公開番号に注意を払うことができます。

VideoReTalking：音声駆動型リップシンクロ・ビデオ編集システム

はじめに

機能一覧

ヘルプの使用

関連記事

おすすめ

AIツールが見つからない？こちらをお試しください！

FLUX.1イメージジェネレーター（中国語入力対応）

最近のAIホットスポット

AIツールのススメ

AIツールの分類