はじめに
HunyuanVideoGPは、DeepBeepMeepが開発したローエンドGPUユーザー向けの大規模ビデオ生成モデルです。このモデルはオリジナルのHunyuan Videoモデルの改良版で、メモリとグラフィックメモリの要件が大幅に削減されており、12GBから24GBまでのGPUでスムーズに実行できます。 HunyuanVideoGPは、コンパイルと高速ロード/アンロード技術によって生成速度を劇的に向上させ、さまざまなハードウェア構成に対応するさまざまなプロファイルを提供します。また、このモデルは、マルチキューイングとマルチ生成をサポートする様々な事前訓練されたLorasを統合しており、ユーザーは異なるモデルや定量化/非定量化モデルを簡単に切り替えることができます。このモデルは ピノキオ ワンクリック配備。
機能一覧
- ローエンドGPUの動作に対応(12GB~24GBのビデオメモリ)
- 必要なメモリとグラフィックメモリを大幅に削減
- 高速ロード/アンロード技術
- 異なるハードウェア構成に対応する複数のプロファイル
- 複数のプロンプトと複数の生成をサポート
- 事前に訓練された複数のロラスの統合
- Gradioのインターフェイスが改良され、プログレスバーやオプションが追加されました。
- 必要なモデルファイルの自動ダウンロード
- LinuxおよびWSLでのコンパイルをサポート
ヘルプの使用
設置プロセス
- Conda環境を準備する:
conda env create -f environment.yml
- 環境を活性化させる:
コンダ・アクティベート フンユアンビデオ
- pip の依存関係をインストールします:
python -m pip install -r requirements.txt
- オプション:フラッシュアテンションサポートをインストールする(Linuxでは簡単にインストールできるが、Windowsでは難しい):
# 具体的なインストール手順については、公式ドキュメントを参照してください。
使用プロセス
- Gradioサーバーを起動する:
バッシュ launch.sh
- ブラウザを開き、ローカルサーバーのアドレス(通常はhttp://localhost:7860)にアクセスし、Gradioのインターフェイスにアクセスします。
- Gradioのインターフェイスで、希望するプロファイルとモデルを選択し、プロンプトワードを入力し、生成ボタンをクリックします。
- 生成されたビデオはインターフェイス上に表示され、ユーザーがダウンロードしたり、さらに編集したりすることができる。
主な機能
- プロファイルの選択ハードウェア構成に基づいて適切なプロファイルを選択し、生成速度と品質を最適化します。
- プロンプトを入力プロンプトボックスに説明的なテキストを入力すると、モデルはプロンプトに従って対応するビデオコンテンツを生成します。
- 複数世代一度のプロンプトで複数のビデオの生成をサポートし、ユーザーは最も満足のいく結果を選択することができます。
- モデルの切り替えフンユアン、ファスト・フンユアンのモデル切り替えをサポートし、さまざまなニーズに対応。
- 定量的/非定量的モデリングユーザーは、生成速度と品質のバランスをとるために、定量的モデルか非定量的モデルかを選択することができます。