AIパーソナル・ラーニング
と実践的なガイダンス

騰訊宏源動画モデルインターフェイスを使用したDifyの動画生成ワークフロー

本論文では、Dify v0.12.1バージョンを使用し、主にDifyワークフローのHTTPノードを通じて、siliconflow tencent/HunyuanVideoインターフェイスを呼び出し、テキストを通じてビデオの具体的な実装を生成するために紹介します。その中で、DifyとHTTPサービスはSealos Cloudプラットフォームの上に配置されています。

HunyuanVideo 是腾讯推出的开源视频生成基础模型,拥有超过 130 亿参数,是目前最大的开源视频生成模型。该模型采用统一的图像和视频生成架构,集成了数据整理、图像-视频联合模型训练和高效基础设施等关键技术。模型使用多模态大语言模型作为文本编码器,通过 3D VAE 进行空间-时间压缩,并提供提示词重写功能。根据专业人工评估结果,HunyuanVideo 在文本对齐、运动质量和视觉质量等方面的表现优于现有最先进的模型。


 

I.フンユアン・ビデオ・インターフェイス

1.ヴィンセンティアン・ビデオを作成する

プロンプトを入力してビデオを生成し、インターフェイスはユーザーの現在の要求によって生成されたrequestIdを返し、ユーザーはステータスインターフェイスをポーリングして特定のビデオリンクを取得する必要があり、生成された結果は10分以内に有効であり、時間内にビデオリンクを取ってください。以下のように:

インポートリクエスト
url = "https://api.siliconflow.cn/v1/video/submit"
ペイロード = {
"model": "tencent/HunyuanVideo"、
「prompt": "", "seed": 123
「シード": 123
}
ヘッダー = {
"Authorisation": "Bearer ", "Content-Type".
"Content-Type": "application/json".
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)

 

2.ビデオ生成リンクを取得する

以下のようなユーザー作成ビデオを入手する:

インポートリクエスト
url = "https://api.siliconflow.cn/v1/video/status"
payload = {"requestId": ""}。
ヘッダー = {

"Content-Type": "application/json"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)

 

Hunyuanビデオインターフェイスのカプセル化

ビデオを生成するためのテキストはまだ比較的長いので、時間の設計では、通常のサプライヤーは、2つのインターフェイスを持つことになり、1つのインターフェイスは、この要求requestIdを取得することです、別のインターフェイスは、ビデオの生成モデルのステータスを決定するrequestIdに応じて、ビデオのURLの戻り値の前に、ビデオの生成が完了した!したがって、DifyワークフローのHTTPノードを直接使って、siliconflowの公式インターフェースを呼び出すことはできませんが、再度HunyuanVideoインターフェースをカプセル化する必要があります。具体的なHunyuanVideoインターフェイスのパッケージも非常に簡単です、Flaskサービスを開始することです、ビジネスロジックによると、パッケージ化する。

 

blank

 

以下のようにrequirements.txtコマンドを生成する:

pip freeze > requirements.txt

以下のように、ミラーコマンドとしてパッケージングする:

docker build -t 1000sprites/hunyuanvideo:v1 .

特記事項:タグにdockerhubリポジトリのユーザー名(1000spritesは私自身に対応して記入する必要がある)がない場合、Dockerは画像をアップロードしてエラー:denied:リソースへの要求されたアクセスが拒否されたことを報告する。

blank

 

生成された画像1000sprites/hunyuanvideo:v1を以下のようにパッケージ化する:

blank

 

Push to Hubをクリックすると、以下のようにdockerhubのリポジトリにアップロードされます:

blank

 

dockerhub リポジトリにアップロードされたイメージはデフォルトでは非公開なので、以下のように公開に設定する必要がある:

blank

 

シーロス、HunyuanVideoサービスを展開

下図のように「アプリケーション管理」をクリックする:

blank

 

特にミラー名はスペルを間違えないように。ミラーは以下のようにこのアドレスから引き出されるからだ:

blank

 

アプリケーションのSTATUSがPendingからRunningに変わると、アプリケーションが正常に起動したことを示します。STATUSがRunningの場合、外部ネットワークアドレスに直接アクセスできます。問題が発生した場合は、以下のようにPodログを確認してください:

blank

 

III.Difyビデオ生成ワークフロー

blank

 

blank

 

書誌

[1] 動画生成オンライン体験:https://cloud.siliconflow.cn/playground/text-to-video

[2] Pythonアプリのクイックインストール: https://sealos.run/docs/examples/programming-languages/Quick Pythonアプリのインストール

[3] https://hub.docker.com/

AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " 騰訊宏源動画モデルインターフェイスを使用したDifyの動画生成ワークフロー

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語