SiliconCloud lance le modèle vidéo accéléré Mochi-1-Preview

Nouvelles de l'IAPosté il y a 9 mois Cercle de partage de l'IA

12.4K 00

Récemment, le modèle de génération vidéo open source GenmoAI mochi 1 preview (10B), doté d'une action très fidèle et d'une puissante capacité de suivi des signaux, prend actuellement en charge la génération de vidéos en résolution 480p. Aujourd'hui, SiliconCloud, Silicon Flow, a mis en ligne la version d'accélération de l'inférence de mochi-1-preview (prix 2,8 ¥/vidéo), éliminant ainsi le seuil de déploiement pour les développeurs, qui n'ont plus qu'à appeler facilement l'API lorsqu'ils développent des applications, ce qui améliore l'expérience de l'utilisateur. La plateforme permet également aux développeurs de comparer et d'expérimenter librement des dizaines de grands modèles et de choisir les meilleures pratiques pour leurs applications d'IA générative. SiliconCloud上线加速版视频模型Mochi-1-Preview

Expérience en ligne
https://cloud.siliconflow.cn/playground/text-to-video/17885302647

Documentation de l'API
https://docs.siliconflow.cn/capabilities/video

Mot clé : Une tomate qui parle avec un visage

Mot clé : Une femme à la peau claire, portant une veste bleue et un chapeau noir avec un voile, regarde vers le bas et vers sa droite, puis se relève en parlant ; elle a les cheveux bruns coiffés en chignon. Une femme à la peau claire, portant une veste bleue et un chapeau noir avec un voile, regarde vers le bas et vers sa droite, puis se relève pendant qu'elle parle ; elle a les cheveux bruns coiffés en chignon, les sourcils bruns, et porte une chemise blanche sous sa veste ; la caméra reste immobile sur son visage pendant qu'elle parle ; l'arrière-plan est flou, mais on voit le visage de la femme en train de parler. l'arrière-plan est flou, mais montre des arbres et des personnes en vêtements d'époque ; la scène est filmée en prises de vue réelles.

Mot de repère : Une rivière claire et turquoise coule dans un canyon rocheux, se jette dans une petite cascade et forme un bassin d'eau au fond du canyon. La rivière est le point central de la scène, son eau claire reflétant les arbres et les rochers environnants. Les parois du canyon sont abruptes et rocheuses, avec un peu de végétation. Les arbres sont principalement des pins, dont les aiguilles vertes contrastent avec les roches brunes et grises. Le ton général de la scène est celui de la paix et de la tranquillité. Le ton général de la scène est celui de la paix et de la tranquillité.

Découvrez à quoi ressemble mochi-1-preview sur SiliconCloud après l'accélération de l'inférence.

Caractéristiques et performances du modèle

Basé sur l'architecture Asymmetric Diffusion Transformer (AsymmDiT), mochi 1 est simple et modifiable. Comparé aux principaux modèles à source fermée, mochi 1 est très compétitif. Le suivi des repères et la qualité du mouvement sont deux des capacités les plus critiques des modèles de génération vidéo.

Conseils à suivreLa vidéo générée reflète fidèlement les instructions données, grâce à un alignement extrêmement élevé sur le texte des invites. L'utilisateur peut ainsi contrôler en détail les personnages, les paramètres et les actions.

Qualité du mouvementmochi 1 génère jusqu'à 5,4 secondes de vidéo à une vitesse de 30 images par seconde, avec un haut degré de cohérence temporelle et des modèles de mouvements réalistes. mochi simule des phénomènes physiques tels que la dynamique des fluides, la simulation de cheveux et d'autres phénomènes physiques, et présente des mouvements humains cohérents et fluides.

Token Factory SiliconCloud

Qwen 2.5 (7B) et plus de 20 autres modèles gratuits !

En tant que plateforme unique de services en nuage pour les grands modèles, SiliconCloud s'engage à fournir aux développeurs des API de modèles extrêmement rapides, abordables, complètes et fluides. Instruct, HunyuanVideo, Marco-o1, fish-speech-1.5, QwQ-32B-Preview, Qwen2.5-Coder-32B-Instruct, Qwen2-VL, InternVL2, Qwen2.5-7B/14B/32B/ 72B, FLUX.1, InternLM2.5-20B-Chat, BCE, BGE, SenseVoice-Small, GLM-4-9B-Chat, et des dizaines de grands modèles de langage, de modèles de génération d'images/vidéos, de modèles de parole, de modèles de code/mathématiques, et de modèles vectoriels et de réorganisation. SiliconCloud上线加速版视频模型Mochi-1-Preview

Parmi eux, Qwen2.5 (7B), Llama3.1 (8B) et d'autres grands modèles d'API sont gratuits, de sorte que les développeurs et les gestionnaires de produits n'ont pas à s'inquiéter du coût arithmétique de la phase de recherche et de développement et de la promotion à grande échelle, et qu'ils peuvent atteindre la "liberté des jetons".

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

Luma Photon 图像生成模型：用自然语言描述迭代生成图像，兼顾画质与创意

Modèle de génération d'images Luma Photon : génération itérative d'images avec des descriptions en langage naturel, équilibrant la qualité de l'image et la créativité

Nouvelles de l'IA

Il y a 7 mois

015.1K

17 Meilleurs outils d'aide au codage de l'IA en 2024 que les programmeurs du monde entier utilisent

Nouvelles de l'IA

Il y a 9 mois

016.4K

voyage-3 et voyage-3-lite : une nouvelle génération de modèles d'intégration polyvalents, petits mais puissants

Nouvelles de l'IA

Il y a 10 mois

022.9K

Lancement de Qwen2.5-VL : prise en charge de la compréhension des vidéos longues, de la localisation visuelle, de la sortie structurée, paramétrage fin en Open Source

Nouvelles de l'IA

Il y a 8 mois

036.2K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

SiliconCloud lance le modèle vidéo accéléré Mochi-1-Preview

Caractéristiques et performances du modèle

Token Factory SiliconCloud

Qwen 2.5 (7B) et plus de 20 autres modèles gratuits !

Ce logiciel de conception d'IA est génial, tant que l'image d'un produit peut générer une image principale de commerce électronique professionnel, les produits pop-up qui ne vont pas bien.

Google lance la vidéo d'IA Veo2 et la cartographie d'IA Imagen3

Articles connexes

Modèle de génération d'images Luma Photon : génération itérative d'images avec des descriptions en langage naturel, équilibrant la qualité de l'image et la créativité

17 Meilleurs outils d'aide au codage de l'IA en 2024 que les programmeurs du monde entier utilisent

voyage-3 et voyage-3-lite : une nouvelle génération de modèles d'intégration polyvalents, petits mais puissants

Lancement de Qwen2.5-VL : prise en charge de la compréhension des vidéos longues, de la localisation visuelle, de la sortie structurée, paramétrage fin en Open Source

Pas de commentaires

Dernières collections

Derniers articles

SiliconCloud lance le modèle vidéo accéléré Mochi-1-Preview

Caractéristiques et performances du modèle

Token Factory SiliconCloud

Qwen 2.5 (7B) et plus de 20 autres modèles gratuits !

Ce logiciel de conception d'IA est génial, tant que l'image d'un produit peut générer une image principale de commerce électronique professionnel, les produits pop-up qui ne vont pas bien.

Google lance la vidéo d'IA Veo2 et la cartographie d'IA Imagen3

Articles connexes

Modèle de génération d'images Luma Photon : génération itérative d'images avec des descriptions en langage naturel, équilibrant la qualité de l'image et la créativité

17 Meilleurs outils d'aide au codage de l'IA en 2024 que les programmeurs du monde entier utilisent

voyage-3 et voyage-3-lite : une nouvelle génération de modèles d'intégration polyvalents, petits mais puissants

Lancement de Qwen2.5-VL : prise en charge de la compréhension des vidéos longues, de la localisation visuelle, de la sortie structurée, paramétrage fin en Open Source

Pas de commentaires

Outils d'IA sélectionnés

Dernières collections

Derniers articles