Wan-Move - アリ・トンイのオープンソースAI動画生成フレームワーク、清華大学らと共同開発

堆友AI

ワンムーブとは?

Wan-Moveは、Ali Tongyi Labsと清華大学などが共同開発したオープンソースのAI動画生成フレームワークで、精密なモーション制御技術による高品質な動画合成に焦点を当てている。コア技術は「潜在的軌道誘導」であり、既存の画像-動画モデルに点レベルのモーション制御をシームレスに追加することができ、主流のオープンソースソリューション22.5%を超えるモーション制御精度で、5秒間の480P動画生成をサポートする。 このフレームワークは、基礎となるモデルアーキテクチャを変更する必要がなく、最初のフレームの特徴を後続のフレームにコピーすることでモーションインジェクションを実現し、シングルターゲット、マルチターゲット、複雑なシナリオ(例:マルチプレイヤーインタラクション、オブジェクトインタラクション)に適用可能である。シングルターゲット、マルチターゲット、複雑なシナリオ(多人数インタラクション、オブジェクトインタラクションなど)に適しており、MoveBenchベンチマークではFID 12.2、EPE 2.6というトップパフォーマンスを達成しています。ユーザーはComfyUIのプラグインやクラウドプラットフォームを通じてこのモデルを体験することができ、モデルはGitHubでオープンソース化されています。

Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

ワンムーブの機能的特徴

  • 単一ターゲット・モーション・コントロール映像内の個々のオブジェクトの正確なモーションコントロールが可能です。
  • 多目的モーションコントロールビデオ内の複数のオブジェクトの独立したモーションコントロールをサポートします。
  • 学術的および商業的アプローチとの比較既存のアカデミックな手法や市販のソリューションとの定性的な比較は、ウェブサイトでご覧いただけます。
  • カメラコントロールビデオのカメラの動きをコントロールできる。
  • ロコモーション・トランスファーあるビデオから別のビデオに動きを移すことができる。
  • 3Dローテーション3D回転エフェクト付きビデオの生成をサポート。

ワンムーブの強み

  • 高品質のモーションコントロールビデオシステムのラインナップに新たに加わった480pビデオシステムは、業務用システムに匹敵するモーション・コントロールで5秒間の480pの高画質ビデオを生成し、プロフェッショナルなビデオ制作の要求に応える。
  • 追加モジュール不要既存の画像-映像モデルのアーキテクチャを変更したり、モーションエンコーダを追加したりする必要がないため、使用への障壁が低くなり、開発コストが削減されます。
  • きめ細かなポイント・レベル・コントロールシーン内の各要素の正確なモーションコントロールをサポートし、複雑なシーンの多様なニーズに対応するためにリージョンレベルのモーションカスタマイズを可能にします。
  • 大規模トレーニングと最適化生成された映像のビジュアルとモーションの精度を、大規模なデータでトレーニングすることで確保し、全体的なパフォーマンスを向上させる。
  • ベンチマーキング・サポート大規模なサンプルと高品質の軌跡アノテーションによるMoveBenchベンチマークを提供し、異なる手法の有効性を簡単に評価・比較できるようにします。
  • オープンソースと使いやすさコード、モデルウェイト、ベンチマークはオープンソースであるため、ユーザーはすぐに開発に取り掛かることができ、優れたスケーラビリティとコミュニティサポートによって二次開発を行うことができる。

ワンムーブの公式サイトは?

  • プロジェクトのウェブサイト:: https://wan-move.github.io/
  • Githubリポジトリ:: https://github.com/ali-vilab/Wan-Move
  • HuggingFaceモデルライブラリ:: https://huggingface.co/Ruihang/Wan-Move-14B-480P
  • arXivテクニカルペーパー:: https://arxiv.org/pdf/2512.08765

ワンムーブの対象者

  • ビデオクリエーターワンムーブ:アニメーション、特殊効果、クリエイティブなビデオを作成する必要があるプロフェッショナルは、特定のモーションエフェクトを持つビデオコンテンツをすばやく生成できます。
  • 広告・マーケティング・スタッフ高品質なビデオ映像を効率的に作成する必要があるマーケティングチームに適しています。
  • ビデオエディター映像のポストプロダクションにおいて、モーションダンプやカメラモーションのコントロールなど、映像コンテンツを素早く調整・最適化し、作業効率を向上させるために使用される。
  • 教育者ダイナミックなプレゼンテーションを通じて、生徒の理解や学習を助ける教育用ビデオの作成に使用され、教育分野のコンテンツ制作に適しています。
  • ゲーム開発者ゲームの視覚効果やユーザー体験を向上させるために、キャラクターの動きやシーンの変化など、ゲーム内のアニメーション効果を生成するために使用されます。
  • 技術研究者ビデオ生成やモーションコントロール技術に興味のある研究者は、オープンソースコードやベンチマークを使用して研究開発することができます。
© 著作権表示

関連記事

コメントなし

コメントに参加するにはログインが必要です!
今すぐログイン
なし
コメントはありません