はじめに
ChatAnyoneはHumanAIGCチームによって開発された革新的なプロジェクトである。人工知能技術を用いて、1枚の写真と音声入力から、上半身の動きを伴うデジタル人物のポートレート動画を生成する。ChatAnyoneは、512×768の解像度と30フレーム/秒のビデオ出力をサポートし、効率的な生成を特徴としています。このプロジェクトは現在GitHubで技術的な詳細を公開しているが、まだ完全なオープンソースではないため、デジタルヒューマン生成技術に興味を持つ多くのユーザーの注目を集めている。
機能一覧
- フォト・ジェネレーション・ビデオ一枚の写真と音声入力から、上半身の動きを含む人間のデジタル映像を生成する。
- モーションコントロール自然な頭の動き、ジェスチャー、表情の生成をサポート。
- 音声同期唇の動きを音声に合わせることで、臨場感を高めています。
- 高性能4090GPUで解像度512×768、毎秒30フレームをサポート。
- テクノロジー・ショーケースGitHubのページで結果を共有し、ユーザーが学び、探求できるようにする。
ヘルプの使用
ChatAnyoneは現在技術実証プロジェクトであり、完全なオープンソースではないため、直接ダウンロードしたりインストールしたりすることはできません。以下のコンテンツは公式情報に基づいており、ユーザーがプロジェクトを理解し、将来的にオープンな利用が可能になることを期待するために、その機能と動作ロジックを詳しく説明しています。
主な機能
1.写真からビデオを生成する
- 操作ロジックユーザーが顔写真と音声(話し声や歌声など)を入力すると、上半身を動かしたデジタル人物の映像が生成される。映像には、首振りやジェスチャーなどの動きも含まれる。
- 効果最大解像度512×768、フレームレート30フレーム/秒。人間のデジタルな動きを音声のテンポに合わせ、バーチャル映像の表示に適しています。
- 使用方法現時点では、公式のデモンストレーション・ビデオやドキュメントで確認できる機能であり、将来的にはベータ版が公開される可能性もある。
2.動作制御
- 操作ロジック音声をもとに、頭や手の動きなど自然な上半身の動きを生成。ユーザーは例題を通して可動域を学ぶことができる。
- 効果生成されたデジタル人物は、うなずきやジェスチャーの変化など、さまざまな動きを見せることができ、表現力を高めることができます。
- 使用方法この機能はデモの段階であり、ユーザーはGitHubのページで動作を確認することができる。
3.オーディオ同期
- 操作ロジッククリアな音声を入力すると、そのリズムに合わせた唇の動きを生成する。
- 効果リップは、バーチャル・キャスターやアニメーション・プレゼンテーションの音声と高度に同期しています。
- 使用方法現在は公式サンプル映像で体験しているが、将来的にはユーザーテストにも対応する予定。
詳細情報の入手方法
- 公式ページを見るに移動する。
https://github.com/HumanAIGC/chat-anyone
プロジェクトの説明とプレゼンテーションビデオをご覧ください。 - 最新情報をフォローするこのプロジェクトはまだオープンソースではありませんが、チームは将来コードやツールを公開するかもしれません。GitHubのリポジトリを定期的にチェックすることをお勧めする。
- チームへのお問い合わせ詳細については、GitHubにメッセージを残すか、公式の連絡先をご覧ください。
ほら
- ChatAnyoneは現在、技術実証プロジェクトであり、直接利用することはできない。
- 生成には高性能ハードウェア(例えば4090GPU)が必要だが、一般ユーザーがローカルで体験するのは難しい。
- このプロジェクトは将来オープンソース化される可能性があり、その時にはより詳細なガイドが利用できるようになるだろう。
アプリケーションシナリオ
- バーチャル・イメージ・プレゼンテーション
ユーザーは、写真を使ってデジタル人物のビデオを作成し、パーソナライズされたバーチャルイメージを見せることができる。 - アニメーション・コンテンツ制作
クリエイターは、生成された半人前のデジタル・パーソンの映像を使って、ショート・フィルムやプレゼンテーション・コンテンツを作ることができる。 - 技術研究
研究者たちは、このプロジェクトを通じて、音声によるデジタル人物生成技術について学ぶことができる。
品質保証
- ChatAnyone はリアルタイムでチャットできますか?
現在は違います。ライブチャットツールではなく、写真と音声からビデオを生成することに重点を置いている。 - どのような種類の写真がサポートされていますか?
正式なプレゼンテーションは肖像写真に基づいており、具体的な要件は今後の文書で確認できる。 - ビデオは市販されていますか?
現在のところ、明確なライセンスはなく、オープンソースを待つ必要がある。