はじめに
ComfyUI-WanVideoWrapperは、開発者kijaiによって作成されたオープンソースのプラグインです。 ComfyUI プラットフォーム設計。これはWanVideoの ワン2.1 強力なビデオ生成と処理機能を提供します。ユーザーは、画像からビデオ(I2V)、テキストからビデオ(T2V)、ビデオからビデオ(V2V)への変換に使用することができます。このプラグインは、AI愛好家、ビデオ制作者、効率的なツールを必要とするユーザーに適している。プロジェクトはGitHubでホストされており、2025年3月現在、1300以上のスターと活発なコミュニティを獲得している。まだ "Work in Progress "と表示されており、機能は改善されている。
機能一覧
- イメージ・トゥ・ビデオ(I2V)カスタムフレームレートと解像度をサポートし、静止画を動画に変換します。
- テキストからビデオへ(T2V)調整可能な生成パラメータで、テキストの説明に基づいてビデオを生成します。
- ビデオ・ツー・ビデオ(V2V)既存のビデオを強化したり、スタイルを変えたりして、アクションの流れを維持する。
- Wan2.1 モデルのサポートWan2.1の使用 変圧器 およびVAEモデルと互換性があり、ComfyUIネイティブコーディングモジュールとも互換性があります。
- 長時間のビデオ生成ウィンドウ・サイズとオーバーラップの設定により、1000フレームを超える動画の生成をサポート。
- パフォーマンス最適化: torch.compileをサポートし、生成速度を向上。
ヘルプの使用
設置プロセス
ComfyUI-WanVideoWrapperを使用するには、まずComfyUIをインストールし、プラグインを追加する必要があります。以下はその詳しい手順です:
- ComfyUIのインストール
- GitHub(https://github.com/comfyanonymous/ComfyUI)からComfyUIのメインプログラムをダウンロードしてください。
- ローカルで解凍する。
C:♪ComfyUI
. - ある
ComfyUI_windows_portable
ファイル実行run_nvidia_gpu.bat
スタート(Windowsユーザー)。
- WanVideoWrapperプラグインをインストールする
- のComfyUIルートディレクトリに移動します。
カスタムノード
フォルダー - Gitコマンドを使ってプラグインをクローンする:
git clone https://github.com/kijai/ComfyUI-WanVideoWrapper.git
- プラグインディレクトリに移動する:
cd ComfyUI-WanVideoWrapper
- 依存関係をインストールします:
python_embeddedpython.exe -m pip install -r requirements.txt
- ポータブル版を使用する場合は
ComfyUI_windows_portable
フォルダで実行する:python_embeddedpython.exe -m pip install -r ComfyUI
- ポータブル版を使用する場合は
- のComfyUIルートディレクトリに移動します。
- Wan2.1モデルのダウンロード
- Hugging Faceモデルリポジトリ(https://huggingface.co/Kijai/WanVideo_comfy)をご覧ください。
- 必要書類をダウンロードしてください:
- テキストエンコーダ
ComfyUI/models/text_encoders
. - トランスフォーマーモデルは
ComfyUI/モデル/拡散モデル
. - VAEモデルの配置
ComfyUI/models/vae
.
- テキストエンコーダ
- オリジナルモデルは、ComfyUI独自のテキストエンコーダとCLIP Visionに置き換えることもできます。
- ComfyUIの起動
- インストールが完了したら、ComfyUIを再起動すると、プラグインノードが自動的にインターフェイスに読み込まれます。
主な機能
1.画像からビデオへ(I2V)
- 予備Wan2.1モデルとVAEがロードされていることを確認してください。
- 手続き:
- ComfyUIインターフェイスの追加
WanVideoModelLoader
ノードで、Wan2.1 I2Vモデルを選択する。 - 増加
ワンビデオVAELoader
ノードにVAEモデルをロードする。 - 支出
画像を読み込む
ノードに画像をアップロードします。 - 増加
ワンビデオサンプラー
ノードで、フレーム数(例:81フレーム)、解像度(例:512x512)を設定する。 - グラウト
VHS_VideoCombine
ノードで、フレームレート(例:16fps)と出力フォーマット(例:MP4)を設定します。 - Generate "をクリックすると、結果は以下の場所に保存される。
ComfyUI/出力
フォルダー
- ComfyUIインターフェイスの追加
- 銘記する公式テストによれば、512x512x81フレームは約16GBのビデオメモリを消費する。
2.テキストからビデオへ(T2V)
- 予備例:「夜の街並み」。
- 手続き:
- 増加
ロードワンビデオT5テキストエンコーダ
ノード(またはComfyUIネイティブのCLIPモデル)を使用します。 - 増加
ワンビデオテキストエンコード
ノードにテキストを入力する。 - グラウト
WanVideoModelLoader
歌で応えるワンビデオサンプラー
ノードで、フレーム数(256など)、解像度(720pなど)を設定する。 - 増加
ワンビデオデコード
ノードのデコード。 - 支出
VHS_VideoCombine
ノードはビデオを出力する。 - 生成時間はハードウェアによって異なります。
- 増加
- 注意を引く公式の例では、1.3BのT2Vモデルが5GBのRAMで10分間に1025フレームを生成しています(RTX 5090)。
3.ビデオ・ツー・ビデオ(V2V)
- 予備短いビデオ(MP4形式)を用意する。
- 手続き:
- 支出
VHS_LoadVideo
ノードはビデオをロードする。 - 増加
ワンビデオエンコード
ノードエンコードされたビデオ。 - グラウト
ワンビデオサンプラー
ノードでエンハンスメントのパラメーターを調整する。 - 増加
ワンビデオデコード
ノードのデコード。 - 支出
VHS_VideoCombine
ノードは結果を出力する。 - Generate "をクリックし、エンハンスメントを完了する。
- 支出
- 典型例14BのT2Vモデルを使ったV2Vの公式テストでは、より良い結果が得られている。
4.長編ビデオの作成
- 手続き:
- ある
ワンビデオサンプラー
ノードはフレーム数を設定する(例えば1025フレーム)。 - ウィンドウサイズ(例:81フレーム)とオーバーラップ値(例:16)を設定し、一貫した動きを確保する。
- その他の手順は、T2VやI2Vと同じである。
- ある
- ハードウェア要件ビデオメモリの多いGPU(24GBなど)を推奨します。
注目の機能
- Wan2.1コア対応このプラグインはWan2.1モデルに基づいており、効率的なビデオ生成機能を提供します。
- ComfyUIネイティブモジュールとの互換性ComfyUI独自のテキストエンコーダとCLIP Visionは、追加モデルなしで使用できます。
- 長時間のビデオ生成公式テストでは1025fpsの安定したパフォーマンス。
- パフォーマンス最適化: torch.compileのサポートにより、生成速度が大幅に向上。
一般的な問題
- 表示されないノード依存関係のインストールが完了したことを確認するか、ComfyUIを再起動してください。
- ビデオメモリ不足解像度を下げるか、フレームレートを下げるか、ハードウェアに応じて調整することを公式に推奨します。
- モデル・パス誤差モデルが正しいフォルダに入っていることを確認してください。