SiliconCloud lance le modèle vidéo accéléré Mochi-1-Preview

SiliconCloud上线加速版视频模型Mochi-1-Preview

Récemment, le modèle de génération vidéo open source GenmoAI mochi 1 preview (10B), doté d'une action très fidèle et d'une puissante capacité de suivi des signaux, prend actuellement en charge la génération de vidéos en résolution 480p. Aujourd'hui, SiliconCloud, Silicon Flow, a mis en ligne la version d'accélération de l'inférence de mochi-1-preview (prix 2,8 ¥/vidéo), éliminant ainsi le seuil de déploiement pour les développeurs, qui n'ont plus qu'à appeler facilement l'API lorsqu'ils développent des applications, ce qui améliore l'expérience de l'utilisateur. La plateforme permet également aux développeurs de comparer et d'expérimenter librement des dizaines de grands modèles et de choisir les meilleures pratiques pour leurs applications d'IA générative. SiliconCloud上线加速版视频模型Mochi-1-Preview

 

Expérience en ligne
https://cloud.siliconflow.cn/playground/text-to-video/17885302647

Documentation de l'API
https://docs.siliconflow.cn/capabilities/video

SiliconCloud上线加速版视频模型Mochi-1-Preview

Mot clé : Une tomate qui parle avec un visage

 

SiliconCloud上线加速版视频模型Mochi-1-Preview

Mot clé : Une femme à la peau claire, portant une veste bleue et un chapeau noir avec un voile, regarde vers le bas et vers sa droite, puis se relève en parlant ; elle a les cheveux bruns coiffés en chignon. Une femme à la peau claire, portant une veste bleue et un chapeau noir avec un voile, regarde vers le bas et vers sa droite, puis se relève pendant qu'elle parle ; elle a les cheveux bruns coiffés en chignon, les sourcils bruns, et porte une chemise blanche sous sa veste ; la caméra reste immobile sur son visage pendant qu'elle parle ; l'arrière-plan est flou, mais on voit le visage de la femme en train de parler. l'arrière-plan est flou, mais montre des arbres et des personnes en vêtements d'époque ; la scène est filmée en prises de vue réelles.

 

SiliconCloud上线加速版视频模型Mochi-1-Preview

Mot de repère : Une rivière claire et turquoise coule dans un canyon rocheux, se jette dans une petite cascade et forme un bassin d'eau au fond du canyon. La rivière est le point central de la scène, son eau claire reflétant les arbres et les rochers environnants. Les parois du canyon sont abruptes et rocheuses, avec un peu de végétation. Les arbres sont principalement des pins, dont les aiguilles vertes contrastent avec les roches brunes et grises. Le ton général de la scène est celui de la paix et de la tranquillité. Le ton général de la scène est celui de la paix et de la tranquillité.

 

Découvrez à quoi ressemble mochi-1-preview sur SiliconCloud après l'accélération de l'inférence.

Caractéristiques et performances du modèle

Basé sur l'architecture Asymmetric Diffusion Transformer (AsymmDiT), mochi 1 est simple et modifiable. Comparé aux principaux modèles à source fermée, mochi 1 est très compétitif. Le suivi des repères et la qualité du mouvement sont deux des capacités les plus critiques des modèles de génération vidéo.

Conseils à suivreLa vidéo générée reflète fidèlement les instructions données, grâce à un alignement extrêmement élevé sur le texte des invites. L'utilisateur peut ainsi contrôler en détail les personnages, les paramètres et les actions.

SiliconCloud上线加速版视频模型Mochi-1-Preview

Qualité du mouvementmochi 1 génère jusqu'à 5,4 secondes de vidéo à une vitesse de 30 images par seconde, avec un haut degré de cohérence temporelle et des modèles de mouvements réalistes. mochi simule des phénomènes physiques tels que la dynamique des fluides, la simulation de cheveux et d'autres phénomènes physiques, et présente des mouvements humains cohérents et fluides.

SiliconCloud上线加速版视频模型Mochi-1-Preview

Token Factory SiliconCloud

Qwen 2.5 (7B) et plus de 20 autres modèles gratuits !

En tant que plateforme unique de services en nuage pour les grands modèles, SiliconCloud s'engage à fournir aux développeurs des API de modèles extrêmement rapides, abordables, complètes et fluides. Instruct, HunyuanVideo, Marco-o1, fish-speech-1.5, QwQ-32B-Preview, Qwen2.5-Coder-32B-Instruct, Qwen2-VL, InternVL2, Qwen2.5-7B/14B/32B/ 72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat, et des dizaines de grands modèles de langage, de modèles de génération d'images/vidéos, de modèles de parole, de modèles de code/mathématiques, et de modèles vectoriels et de réorganisation. SiliconCloud上线加速版视频模型Mochi-1-Preview

Parmi eux, Qwen2.5 (7B), Llama3.1 (8B) et d'autres grands modèles d'API sont gratuits, de sorte que les développeurs et les gestionnaires de produits n'ont pas à s'inquiéter du coût arithmétique de la phase de recherche et de développement et de la promotion à grande échelle, et qu'ils peuvent atteindre la "liberté des jetons".

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...