騰訊宏源動画モデルインターフェイスを使用したDifyの動画生成ワークフロー

2.1K 00

本論文では、Dify v0.12.1バージョンを使用し、主にDifyワークフローのHTTPノードを通じて、siliconflow tencent/HunyuanVideoインターフェイスを呼び出し、テキストを通じてビデオの具体的な実装を生成するために紹介します。その中で、DifyとHTTPサービスはSealos Cloudプラットフォームの上に配置されています。

フンユアンビデオテンセントが発表したオープンソースの動画生成ベースモデルで、130億以上のパラメータを持ち、現在最大のオープンソース動画生成モデルである。このモデルは、統一された画像と動画生成アーキテクチャを採用し、データの照合、画像と動画の共同モデルトレーニング、効率的なインフラストラクチャなどの主要技術を統合している。このモデルは、マルチモーダル・マクロ言語モデルをテキスト・エンコーダとして使用し、3D VAEによる空間・時間圧縮を実行し、キュー・ワードの書き換えを提供する。専門的な人間による評価結果によると、HunyuanVideoは、テキストアライメント、モーション品質、ビジュアル品質の面で、既存の最先端モデルを凌駕している。

I.フンユアン・ビデオ・インターフェイス

1.ヴィンセンティアン・ビデオを作成する

プロンプトを入力してビデオを生成し、インターフェイスはユーザーの現在の要求によって生成されたrequestIdを返し、ユーザーはステータスインターフェイスをポーリングして特定のビデオリンクを取得する必要があり、生成された結果は10分以内に有効であり、時間内にビデオリンクを取ってください。以下のように：

import requests
url = "https://api.siliconflow.cn/v1/video/submit"
payload = {
"model": "tencent/HunyuanVideo",
"prompt": "<string>",
"seed": 123
}
headers = {
"Authorization": "Bearer <token>",
"Content-Type": "application/json"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)

2.ビデオ生成リンクを取得する

以下のようなユーザー作成ビデオを入手する：

import requests
url = "https://api.siliconflow.cn/v1/video/status"
payload = {"requestId": "<string>"}
headers = {
"Authorization": "Bearer <token>",
"Content-Type": "application/json"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)

Hunyuanビデオインターフェイスのカプセル化

ビデオを生成するためのテキストはまだ比較的長いので、時間の設計では、通常のサプライヤーは、2つのインターフェイスを持つことになり、1つのインターフェイスは、この要求requestIdを取得することです、別のインターフェイスは、ビデオの生成モデルのステータスを決定するrequestIdに応じて、ビデオのURLの戻り値の前に、ビデオの生成が完了した！したがって、DifyワークフローのHTTPノードを直接使って、siliconflowの公式インターフェースを呼び出すことはできませんが、再度HunyuanVideoインターフェースをカプセル化する必要があります。具体的なHunyuanVideoインターフェイスのパッケージも非常に簡単です、Flaskサービスを開始することです、ビジネスロジックによると、パッケージ化する。

以下のようにrequirements.txtコマンドを生成する：

pip freeze > requirements.txt

以下のように、ミラーコマンドとしてパッケージングする：

docker build -t 1000sprites/hunyuanvideo:v1 .

特記事項：タグにdockerhubリポジトリのユーザー名（1000spritesは私自身に対応して記入する必要がある）がない場合、Dockerは画像をアップロードしてエラー:denied:リソースへの要求されたアクセスが拒否されたことを報告する。

生成された画像1000sprites/hunyuanvideo:v1を以下のようにパッケージ化する：

Push to Hubをクリックすると、以下のようにdockerhubのリポジトリにアップロードされます：

dockerhub リポジトリにアップロードされたイメージはデフォルトでは非公開なので、以下のように公開に設定する必要がある：

シーロス、HunyuanVideoサービスを展開

下図のように「アプリケーション管理」をクリックする：

特にミラー名はスペルを間違えないように。ミラーは以下のようにこのアドレスから引き出されるからだ：

アプリケーションのSTATUSがPendingからRunningに変わると、アプリケーションが正常に起動したことを示します。STATUSがRunningの場合、外部ネットワークアドレスに直接アクセスできます。問題が発生した場合は、以下のようにPodログを確認してください：

III.Difyビデオ生成ワークフロー

書誌

[1] 動画生成オンライン体験：https://cloud.siliconflow.cn/playground/text-to-video

[2] Pythonアプリのクイックインストール： https://sealos.run/docs/examples/programming-languages/Quick Pythonアプリのインストール

[3] https://hub.docker.com/

AIハンズオンチュートリアル

Leonardo AI: キャンバスエディタの使い方完全ガイド

AIハンズオンチュートリアル # レオナルドAI

1年前

03.4K

JavaScriptでOllama APIを使う

AIハンズオンチュートリアル

5ヶ月前

02K

Cursor無料トライアル詳細ガイド：登録、機能、更新のヒントとトリック

AIハンズオンチュートリアル

6ヶ月前

02.7K

Difyプラグインのインストールと使用

AIハンズオンチュートリアル

7ヶ月前

03.5K

コメントなし

コメントに参加するにはログインが必要です！

今すぐログイン

コメントはありません

騰訊宏源動画モデルインターフェイスを使用したDifyの動画生成ワークフロー

I.フンユアン・ビデオ・インターフェイス

1.ヴィンセンティアン・ビデオを作成する

2.ビデオ生成リンクを取得する

Hunyuanビデオインターフェイスのカプセル化

シーロス、HunyuanVideoサービスを展開

III.Difyビデオ生成ワークフロー

書誌

Windsurf: インターフェース自動化テストのコードを書くためのツール

インテリジェント・ドキュメンテーション: Dify Chatflowによる効率的な入札書類作成

関連記事

Leonardo AI: キャンバスエディタの使い方完全ガイド

JavaScriptでOllama APIを使う

Cursor無料トライアル詳細ガイド：登録、機能、更新のヒントとトリック

Difyプラグインのインストールと使用

コメントなし

最新コレクション

最新記事

騰訊宏源動画モデルインターフェイスを使用したDifyの動画生成ワークフロー

I.フンユアン・ビデオ・インターフェイス

1.ヴィンセンティアン・ビデオを作成する

2.ビデオ生成リンクを取得する

Hunyuanビデオインターフェイスのカプセル化

シーロス、HunyuanVideoサービスを展開

III.Difyビデオ生成ワークフロー

書誌

Windsurf: インターフェース自動化テストのコードを書くためのツール

インテリジェント・ドキュメンテーション: Dify Chatflowによる効率的な入札書類作成

関連記事

Leonardo AI: キャンバスエディタの使い方完全ガイド

JavaScriptでOllama APIを使う

Cursor無料トライアル詳細ガイド：登録、機能、更新のヒントとトリック

Difyプラグインのインストールと使用

コメントなし

厳選されたAIツール

最新コレクション

最新記事