Flux de production vidéo dans Dify à l'aide de l'interface du modèle HunyuanVideo de Tencent

Tutoriels pratiques sur l'IAMise à jour il y a 9 mois Cercle de partage de l'IA

10.1K 00

Cet article utilise la version 0.12.1 de Dify, qui introduit principalement le nœud HTTP dans le flux de travail de Dify, pour appeler l'interface siliconflow tencent/HunyuanVideo, à travers le texte pour générer la mise en œuvre spécifique de la vidéo. Les services Dify et HTTP sont déployés sur la plateforme Sealos Cloud.

HunyuanVidéo Il s'agit d'un modèle de base de génération vidéo à source ouverte lancé par Tencent, avec plus de 13 milliards de paramètres, qui est actuellement le plus grand modèle de génération vidéo à source ouverte. Le modèle adopte une architecture unifiée de génération d'images et de vidéos, intégrant des technologies clés telles que la collecte de données, la formation conjointe de modèles image-vidéo et une infrastructure efficace. Le modèle utilise un modèle de macrolangage multimodal comme encodeur de texte, effectue une compression spatio-temporelle via la VAE 3D et fournit une réécriture des mots repères. Selon les résultats de l'évaluation manuelle professionnelle, HunyuanVideo surpasse les modèles de pointe existants en termes d'alignement de texte, de qualité de mouvement et de qualité visuelle.

I. HunyuanInterface vidéo

1. créer une vidéo vincentienne

Générer une vidéo en saisissant une invite, l'interface renvoie le requestId généré par la demande actuelle de l'utilisateur, l'utilisateur doit interroger l'interface d'état pour obtenir le lien vidéo spécifique, le résultat généré est valable dans les 10 minutes, veuillez prendre le lien vidéo à temps. Comme le montre le schéma ci-dessous :

import requests
url = "https://api.siliconflow.cn/v1/video/submit"
payload = {
"model": "tencent/HunyuanVideo",
"prompt": "<string>",
"seed": 123
}
headers = {
"Authorization": "Bearer <token>",
"Content-Type": "application/json"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)

2) Obtenir le lien de génération de la vidéo

Obtenez la vidéo générée par l'utilisateur comme indiqué ci-dessous :

import requests
url = "https://api.siliconflow.cn/v1/video/status"
payload = {"requestId": "<string>"}
headers = {
"Authorization": "Bearer <token>",
"Content-Type": "application/json"
}
response = requests.request("POST", url, json=payload, headers=headers)
print(response.text)

Encapsulation de l'interface vidéo Hunyuan

Parce que le temps de génération du texte vidéo est encore relativement long, les fournisseurs ont généralement deux interfaces dans la conception du temps, une interface pour obtenir cette demande requestId, une autre interface selon requestId pour déterminer le modèle de génération vidéo Status, et ainsi de suite, la génération vidéo est terminée, avant le retour de l'URL de la vidéo. Par conséquent, vous ne pouvez pas utiliser directement le nœud HTTP dans le flux de travail Dify pour appeler l'interface officielle de Siliconflow, mais vous devez encapsuler à nouveau l'interface HunyuanVideo. Le paquetage spécifique de l'interface HunyuanVideo est également très simple : il suffit de lancer un service Flask, en fonction de la logique commerciale, pour le paquetage.

Générer la commande requirements.txt comme indiqué ci-dessous :

pip freeze > requirements.txt

Emballage en tant que commande miroir, comme indiqué ci-dessous :

docker build -t 1000sprites/hunyuanvideo:v1 .

Note spéciale : Si le tag n'a pas de nom d'utilisateur pour le dépôt dockerhub (1000sprites doit être rempli correspondant au mien), alors Docker télécharge l'image pour rapporter une erreur :denied : requested access to the resource is denied.

Empaquetez l'image générée 1000sprites/hunyuanvideo:v1 comme suit :

Cliquez sur Push to Hub pour télécharger vers le dépôt dockerhub comme indiqué ci-dessous :

Les images téléchargées sur le dépôt dockerhub étant privées par défaut, elles doivent être définies comme publiques, comme indiqué ci-dessous :

Déploiement du service vidéo Hunyuan par Sealos

Cliquez sur "Gestion des applications" comme indiqué ci-dessous :

Configurez-le comme il se doit, en particulier le nom du miroir ne doit pas être mal orthographié car il tirera des miroirs à partir de cette adresse, comme indiqué ci-dessous :

Cliquez sur "Gestion des applications" pour afficher l'état de l'application. Lorsque l'état de l'application passe de "En attente" à "En cours", cela signifie que l'application a été démarrée avec succès. Lorsque l'ÉTAT est en cours d'exécution, vous pouvez accéder directement à l'adresse réseau externe. Si vous rencontrez des problèmes, vérifiez les journaux Pod comme indiqué ci-dessous :

Flux de travail de la génération de vidéos Dify

bibliographie

[1] Génération de vidéos en ligne : https://cloud.siliconflow.cn/playground/text-to-video

[2] Installation rapide des applications Python : https://sealos.run/docs/examples/programming-languages/Quick installation des applications Python

[3] https://hub.docker.com/

Tutoriels pratiques sur l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Leonardo AI : comprendre la consommation de jetons pour les fonctions de génération d'images

Tutoriels pratiques sur l'IA # Leonardo AI

il y a 1 an

022.9K

Tutoriel AutoGen Studio

Tutoriels pratiques sur l'IA

Il y a 9 mois

010.7K

Guide de configuration de la nouvelle interface Web et du moteur de recherche domestique d'OpenManus

Tutoriels pratiques sur l'IA

il y a 5 mois

013.2K

Poe Tutoriel de création d'un bot

Tutoriels pratiques sur l'IA

Il y a 10 mois

010.8K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

Flux de production vidéo dans Dify à l'aide de l'interface du modèle HunyuanVideo de Tencent

I. HunyuanInterface vidéo

1. créer une vidéo vincentienne

2) Obtenir le lien de génération de la vidéo

Encapsulation de l'interface vidéo Hunyuan

Déploiement du service vidéo Hunyuan par Sealos

Flux de travail de la génération de vidéos Dify

bibliographie

Windsurf : un outil pour écrire du code pour les tests d'automatisation des interfaces

Documentation intelligente : création efficace de documents d'appel d'offres avec Dify Chatflow

Articles connexes

Leonardo AI : comprendre la consommation de jetons pour les fonctions de génération d'images

Tutoriel AutoGen Studio

Guide de configuration de la nouvelle interface Web et du moteur de recherche domestique d'OpenManus

Poe Tutoriel de création d'un bot

Pas de commentaires

Dernières collections

Derniers articles

Flux de production vidéo dans Dify à l'aide de l'interface du modèle HunyuanVideo de Tencent

I. HunyuanInterface vidéo

1. créer une vidéo vincentienne

2) Obtenir le lien de génération de la vidéo

Encapsulation de l'interface vidéo Hunyuan

Déploiement du service vidéo Hunyuan par Sealos

Flux de travail de la génération de vidéos Dify

bibliographie

Windsurf : un outil pour écrire du code pour les tests d'automatisation des interfaces

Documentation intelligente : création efficace de documents d'appel d'offres avec Dify Chatflow

Articles connexes

Leonardo AI : comprendre la consommation de jetons pour les fonctions de génération d'images

Tutoriel AutoGen Studio

Guide de configuration de la nouvelle interface Web et du moteur de recherche domestique d'OpenManus

Poe Tutoriel de création d'un bot

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles