AIパーソナル・ラーニング
と実践的なガイダンス
資源推薦1

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

はじめに

DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。Showlabチームによって開発され、ECCV 2024に採択されたDragAnythingは、オブジェクトの動きを制御するために軌跡線を描くだけで、オブジェクトと対話するユーザーフレンドリーな方法を提供します。このプロジェクトは、前景、背景、カメラの動きを含む複数のオブジェクトの同時運動制御をサポートしています。DragAnythingは、特にオブジェクトの運動制御において、多くのメトリクスで既存の最先端手法を凌駕しています。

DragAnything: シリコン・ジェネレーションで画像中の固体物体の動きを制御する Video-1


 

機能一覧

  • エンティティ表現:あらゆるオブジェクトを表現するためにオープンフィールド埋め込みを使用する。
  • 軌跡制御:軌跡線を描くことで物体の動きを制御する。
  • マルチオブジェクト制御:前景、背景、カメラの同時モーション制御をサポート。
  • インタラクティブ・デモ:Gradioを使ったインタラクティブ・デモをサポート。
  • データセットのサポート: VIPSegとYoutube-VOSデータセットをサポートします。
  • 高い性能:FVD、FID、ユーザースタディに優れている。

 

ヘルプの使用

設置プロセス

  1. プロジェクトコードをクローンする:
   git clone https://github.com/showlab/DragAnything.git
cd DragAnything
  1. Conda環境を作成し、アクティベートする:
   conda create -n DragAnything python=3.8
condaはDragAnythingを起動する。
  1. 依存関係をインストールします:
   pip install -r requirements.txt
  1. データセットを準備する:
    • VIPSegとYoutube-VOSデータセットのダウンロード先 ./データ カタログ

使用方法

  1. インタラクティブなデモを行う:
   python gradio_run.py

ブラウザを開き、提供されたローカル・アドレスにアクセスしてインタラクティブ・デモを開始してください。

  1. オブジェクトの動きを制御する:
    • 入力画像に軌跡線を引き、コントロールしたいオブジェクトを選択します。
    • スクリプトを実行してビデオを生成する:
     python demo.py --input_image  --trajectory
    
    • 生成されたビデオは指定されたディレクトリに保存されます。
  2. 動きの軌道をカスタマイズする:
    • Co-Trackツールを使用して、独自のモーショントラックアノテーションファイルを処理します。
    • 処理したファイルを指定のディレクトリに置き、スクリプトを実行してビデオを生成する。

主な機能

  • 物理的表現ユーザーが手動でオブジェクトに注釈を付けることなく、オープンフィールド埋め込みによってあらゆるオブジェクトを表現します。
  • 軌道制御入力画像に軌跡を描くだけで、物体の動きを制御することができます。
  • マルチオブジェクト制御前景、背景、カメラなど複数のオブジェクトの動きを同時に制御できます。
  • インタラクティブ・プレゼンテーションGradioが提供するインタラクティブなインターフェースを通じて、ユーザーはモーションコントロールの効果をリアルタイムで見ることができます。
  • ハイパフォーマンスFVD、FID、ユーザースタディ、特に物体運動制御において優れたパフォーマンスを発揮。
コンテンツ2
無断転載を禁じます:チーフAIシェアリングサークル " DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語