AIパーソナル・ラーニング
と実践的なガイダンス

TANGO: 音声、ディクテーションに基づく協調ジェスチャー動画生成ツール

はじめに

TANGOは、ビデオ内のジェスチャーと音声を正確に同期させるために設計された、オープンソースの共同話者ジェスチャービデオ生成ツールです。東京大学とサイバーエージェントAI研究所によって開発されたこのツールは、高度なAI技術を活用し、様々な環境において高品質なジェスチャー生成を可能にします。研究、学術、個人での使用に適したTANGOは、トレーニングコード、推論コード、および事前にトレーニングされたモデルと共に提供されます。

ボイス・リップ・シンク・ツールを使って、完全なデジタル・パーソン・プロジェクトに取り組みましょう:同期 そしてWav2Lip

TANGO: 音声、ディクテーションに基づく協調ジェスチャー動画生成ツール-1

 

機能一覧

  • 高精度のジェスチャー同期:ビデオのジェスチャーと音声を正確に同期させます。
  • 多言語サポート:CGIの顔や合成音など、さまざまな言語やサウンドに対応。
  • オープンソースで無料:コードは完全に公開されており、ユーザーは自由に使用、変更することができる。
  • インタラクティブ・デモ:ユーザーがビデオやオーディオファイルをアップロードして体験できるオンライン・デモを提供します。
  • 事前学習モデル:様々な事前学習モデルを提供し、ユーザーが直接使用したり、二次学習することができます。
  • 完全なトレーニングコード:ジェスチャー同期識別器とTANGOモデルのトレーニングコードを含む。

 

ヘルプの使用

設置プロセス

  1. クローン倉庫:
    バッシュコピー
ギット clonehttps://github.com/CyberAgentAILab/TANGO
  1. 依存関係のインストール :
    バッシュコピー
ピップインストール -r requirements.txt
  1. 事前学習済みモデルのダウンロード:事前学習済みモデルを指定されたディレクトリにダウンロードする。 顔検出/検出/sfd/s3fd.pth.
  2. 推論コードを実行する:
    バッシュコピー
python inference.py --チェックポイント・パス <チェックポイント> --<video.mp4 --オーディオ <アン-オーディオ-ソース>

使用プロセス

  1. ローカルサーバーへのアクセス:ブラウザで開く http://localhost:3000.
  2. ビデオとオーディオのアップロード:入力ボックスに同期したいオーディオとビデオファイルをアップロードします。
  3. ジェスチャー同期を実行:「同期」ボタンをタップすると、システムは自動的にジェスチャー同期プロセスを実行します。
  4. 結果の表示とダウンロード : 同期が完了した後、結果をプレビューしたり、同期されたビデオファイルをダウンロードすることができます。
  5. インタラクティブデモの使用:デモページにビデオやオーディオファイルをアップロードして、ジェスチャー同期効果をリアルタイムで体験できます。
  6. プロジェクトの管理 : アップロードされたすべてのプロジェクトをマイプロジェクトページで閲覧・管理できます。

高度な機能

  • インテリジェントなジェスチャー同期:AIが提供するインテリジェントなジェスチャー同期により、ビデオコンテンツのプレゼンテーションを改善します。
  • 多言語サポート:プロジェクトのニーズに応じて、さまざまな言語と音声を選択できます。
  • カスタム開発: TANGOはオープンソースなので、ユーザーはニーズに合わせて開発することができます。

AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " TANGO: 音声、ディクテーションに基づく協調ジェスチャー動画生成ツール

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語