本論文では、Dify v0.12.1バージョンを使用し、主にDifyワークフローのHTTPノードを通じて、siliconflow tencent/HunyuanVideoインターフェイスを呼び出し、テキストを通じてビデオの具体的な実装を生成するために紹介します。その中で、DifyとHTTPサービスはSealos Cloudプラットフォームの上に配置されています。
HunyuanVideo 是腾讯推出的开源视频生成基础模型,拥有超过 130 亿参数,是目前最大的开源视频生成模型。该模型采用统一的图像和视频生成架构,集成了数据整理、图像-视频联合模型训练和高效基础设施等关键技术。模型使用多模态大语言模型作为文本编码器,通过 3D VAE 进行空间-时间压缩,并提供提示词重写功能。根据专业人工评估结果,HunyuanVideo 在文本对齐、运动质量和视觉质量等方面的表现优于现有最先进的模型。
I.フンユアン・ビデオ・インターフェイス
1.ヴィンセンティアン・ビデオを作成する
プロンプトを入力してビデオを生成し、インターフェイスはユーザーの現在の要求によって生成されたrequestIdを返し、ユーザーはステータスインターフェイスをポーリングして特定のビデオリンクを取得する必要があり、生成された結果は10分以内に有効であり、時間内にビデオリンクを取ってください。以下のように:
インポートリクエスト
url = "https://api.siliconflow.cn/v1/video/submit"
ペイロード = {
"model": "tencent/HunyuanVideo"、
「prompt": "", "seed": 123
「シード": 123
}
ヘッダー = {
"Authorisation": "Bearer ", "Content-Type".
"Content-Type": "application/json".
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)
2.ビデオ生成リンクを取得する
以下のようなユーザー作成ビデオを入手する:
インポートリクエスト
url = "https://api.siliconflow.cn/v1/video/status"
payload = {"requestId": ""}。
ヘッダー = {
"Content-Type": "application/json"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)
Hunyuanビデオインターフェイスのカプセル化
ビデオを生成するためのテキストはまだ比較的長いので、時間の設計では、通常のサプライヤーは、2つのインターフェイスを持つことになり、1つのインターフェイスは、この要求requestIdを取得することです、別のインターフェイスは、ビデオの生成モデルのステータスを決定するrequestIdに応じて、ビデオのURLの戻り値の前に、ビデオの生成が完了した!したがって、DifyワークフローのHTTPノードを直接使って、siliconflowの公式インターフェースを呼び出すことはできませんが、再度HunyuanVideoインターフェースをカプセル化する必要があります。具体的なHunyuanVideoインターフェイスのパッケージも非常に簡単です、Flaskサービスを開始することです、ビジネスロジックによると、パッケージ化する。
以下のようにrequirements.txtコマンドを生成する:
pip freeze > requirements.txt
以下のように、ミラーコマンドとしてパッケージングする:
docker build -t 1000sprites/hunyuanvideo:v1 .
特記事項:タグにdockerhubリポジトリのユーザー名(1000spritesは私自身に対応して記入する必要がある)がない場合、Dockerは画像をアップロードしてエラー:denied:リソースへの要求されたアクセスが拒否されたことを報告する。
生成された画像1000sprites/hunyuanvideo:v1を以下のようにパッケージ化する:
Push to Hubをクリックすると、以下のようにdockerhubのリポジトリにアップロードされます:
dockerhub リポジトリにアップロードされたイメージはデフォルトでは非公開なので、以下のように公開に設定する必要がある:
シーロス、HunyuanVideoサービスを展開
下図のように「アプリケーション管理」をクリックする:
特にミラー名はスペルを間違えないように。ミラーは以下のようにこのアドレスから引き出されるからだ:
アプリケーションのSTATUSがPendingからRunningに変わると、アプリケーションが正常に起動したことを示します。STATUSがRunningの場合、外部ネットワークアドレスに直接アクセスできます。問題が発生した場合は、以下のようにPodログを確認してください:
III.Difyビデオ生成ワークフロー
書誌
[1] 動画生成オンライン体験:https://cloud.siliconflow.cn/playground/text-to-video
[2] Pythonアプリのクイックインストール: https://sealos.run/docs/examples/programming-languages/Quick Pythonアプリのインストール
[3] https://hub.docker.com/