VideoReTalking：音声駆動型リップシンクロ・ビデオ編集システム

最新のAIリソース更新：11ヶ月前 AIシェアリングサークル

27.6K 00

はじめに

VideoReTalkingは、入力音声に基づいてリップシンクされた顔映像を生成し、異なる感情であっても高品質でリップシンクされた出力映像を生成できる革新的なシステムです。このシステムは、典型的な表情を持つ顔映像の生成、音声によるリップシンクロ、フォトリアリズムを向上させるための顔強調という3つのタスクに分かれています。VideoReTalkingは、この3つのステップを学習ベースのアプローチで処理し、ユーザーの介入なしに順次実行することができます。VideoReTalkingとその音声駆動型リップシンクロ・トーキングヘッド・ビデオ編集への応用については、提供されたリンクからご覧ください。

VideoReTalking：音频驱动的嘴唇同步和视频编辑系统

(鮮明でない、ビデオの画質を2回上げる必要がある、中国語へのリップシンクが少し悪い)

機能一覧

顔動画生成：入力音声をもとに、典型的な表情の顔動画を生成する。
オーディオ・ドリブン・リップシンク：与えられたオーディオに基づいてリップシンクされたビデオを生成します。
フェイシャル・エンハンスメント：アイデンティティを意識したフェイシャル・エンハンスメント・ネットワークと後処理により、合成顔のフォトリアリズムを向上させる。

ヘルプの使用

訓練済みモデルをダウンロードし、`./checkpoints`に置く。
python3 inference.py`を実行して、ビデオを素早く推論する。
エクスプレッションは `--exp_img` または `--up_face` という引数を追加することで制御できる。

オンライン体験アドレス

経験を複製する

ビデオレトーキング・コラボ・ランの場所

最新のAIリソース # AI Java オープンソースプロジェクト #ポート同期

© 著作権表示

記事の著作権 AIシェアリングサークル無断転載はご遠慮ください。

関連記事

WeWe RSS：生成微信公众号RSS订阅的开源工具

WeWe RSS：WeChatの公開RSSフィードを生成するオープンソースツール

最新のAIリソース # AI Java オープンソースプロジェクト

8ヶ月前

041.7K

Galaxy.ai：集成1700+AI工具库的多功能平台，用于了解市场中各类生成式AI工具（付费）

Galaxy.ai：市場のあらゆる種類のジェネレーティブAIツールを理解するための1700以上のAIツールライブラリを統合した多機能プラットフォーム（有料）

最新のAIリソース # AIオープンサービス

11ヶ月前

043.1K

SumBuddy：使用自己API密钥的免费浏览器AI助手

SumBuddy：独自のAPIキーを使用する無料のブラウザAIアシスタント

最新のAIリソース #ブラウザAIアシスタント

7ヶ月前

026.2K

Presentations.AI：自动生成专业演示文稿的AI工具

Presentations.AI：プロフェッショナルなプレゼンテーションを自動生成するAIツール

最新のAIリソース # AI生成プレゼンテーション/PPT

7ヶ月前

027.8K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません