Smart Spectrum AI publie une famille de modèles GLM open source : la licence MIT, la plateforme Z.ai et le service d'inférence à grande vitesse sont dévoilés.

Wiseparation AI a récemment publié une nouvelle série de grands modèles de langage GLM, couvrant des échelles de paramètres de 32B et 9B, et les a mis à disposition sous la licence MIT entièrement ouverte. La nouvelle famille de modèles comprend la base, l'inférence et un modèle "contemplatif" innovant, qui ont tous été mis à disposition par l'intermédiaire du nouveau site Web de Wiseparation AI. Z.ai
La plateforme est ouverte à l'expérience gratuite et est simultanément en ligne sur sa plateforme de service MaaS. bigmodel.cn
.
Cette initiative montre que Smart Spectrum AI tente d'étendre sa portée et sa base d'utilisateurs sur le marché très concurrentiel de l'IA en combinant des services open source et des services commercialisés très performants.
Matrice de modélisation open source : des bases à l'exploration de pointe
Le cœur de ce projet open source est constitué par les modèles d'échelle de paramètres 9B et 32B, qui respectent tous l'accord de licence MIT. Cela signifie que les développeurs et les entreprises peuvent utiliser ces modèles à des fins commerciales et les distribuer librement et gratuitement, ce qui réduit considérablement le seuil d'utilisation et devrait promouvoir des applications plus larges et l'innovation communautaire.

Modèle de base : GLM-4-32B-0414
Avec 32 milliards de paramètres GLM-4-32B-0414
qui est censé rivaliser, en termes de performances, avec les principaux modèles nationaux et internationaux avec un nombre de paramètres beaucoup plus important. Le modèle a été pré-entraîné en utilisant 15T de données de haute qualité avec une inclusion spéciale de données synthétiques basées sur l'inférence. La phase de post-entraînement se concentre sur le renforcement des capacités de suivi des instructions, de génération de code et d'appel de fonctions grâce à des techniques telles que l'alignement des préférences humaines, l'échantillonnage par rejet et l'apprentissage par renforcement.
Smart Spectrum AI souligne que le modèle excelle dans des tâches telles que la génération de codes d'ingénierie, la génération d'artefacts (une manière interactive de générer des résultats), l'appel de fonctions et la rédaction de rapports, certaines mesures d'étalonnage se rapprochant de, voire dépassant, des tâches telles que GPT-4o
répondre en chantant DeepSeek-V3-0324
(paramètres 671B) et d'autres modèles.

Le modèle améliore les capacités de traitement du code, permettant la génération de code à fichier unique avec des structures plus complexes.Z.ai
Le mode dialogue de la plateforme dispose d'une fonction de prévisualisation intégrée qui permet de visualiser directement les résultats HTML et SVG générés, ce qui facilite l'évaluation et l'itération pour les utilisateurs.

Exemple : Concevoir une interface utilisateur pour une plateforme mobile d'apprentissage automatique qui inclut des tâches de formation, la gestion du stockage et des statistiques personnelles. L'interface utilisateur des statistiques personnelles doit afficher un graphique de l'utilisation des différentes ressources par l'utilisateur sur une période donnée. Utilisez Tailwind CSS pour embellir la page en regroupant ces 3 interfaces mobiles en une seule page HTML.

Exemple : Concevoir une planche à dessin qui permette de dessiner des fonctions personnalisées, d'ajouter et de supprimer des fonctions personnalisées et d'attribuer des couleurs aux fonctions.

Exemple : Démontrer un processus de formation LLM avec svg.
Modèle de raisonnement : GLM-Z1-32B-0414
sur la base de GLM-4-32B-0414
(math.) genreGLM-Z1-32B-0414
Le modèle d'inférence est profondément optimisé pour les tâches mathématiques, de code et de logique grâce à des stratégies de démarrage à froid et d'apprentissage par renforcement étendu. Les données officielles montrent que ses capacités mathématiques et de résolution de problèmes complexes ont été considérablement améliorées, et la performance de certaines tâches peut être comparée à celle des paramètres du 671B. DeepSeek-R1
Comparable. Les performances obtenues dans des tests de référence tels que AIME 24/25, LiveCodeBench, GPQA, etc. confirment son potentiel pour le raisonnement mathématique.

Option légère : GLM-Z1-9B-0414
Notamment, Smart Spectrum AI a également introduit un modèle de petite taille avec des paramètres de 9B GLM-Z1-9B-0414
. Malgré le petit nombre de paramètres, il est affirmé qu'il reste performant pour le raisonnement mathématique et les tâches à usage général, avec des performances au sommet des modèles open source de même taille. Il s'agit d'une option pour les scénarios dont les ressources sont limitées ou qui nécessitent un déploiement léger avec à la fois efficacité et efficience.

Frontier Quest : GLM-Z1-Rumination-32B-0414 Modélisation contemplative
GLM-Z1-Rumination-32B-0414
Il se présente comme une exploration de la forme future de l'AGI. Contrairement aux modèles de raisonnement traditionnels, le modèle "contemplatif" est conçu pour résoudre des problèmes ouverts complexes par le biais d'un plus grand nombre d'étapes de réflexion approfondie. Sa principale caractéristique est la capacité d'intégrer des outils de recherche pour traiter les informations pendant le processus de réflexion et d'utiliser des récompenses basées sur des règles pour guider l'apprentissage par renforcement. Le modèle prend en charge une boucle de recherche "demander-rechercher-analyser-compléter" et est conçu pour améliorer la rédaction de recherches et les tâches de récupération complexes. Il s'agit d'une exploration continue de l'architecture du modèle de Wisdom Spectrum AI et des limites de ses capacités.
La plateforme MaaS est mise en service en tandem : performance et stratégie de tarification convaincantes
En plus du modèle open source, les modèles de base et d'inférence ont également été intégrés dans la plateforme ouverte Smart Spectrum MaaS (bigmodel.cn
), qui fournit des services API.
Le modèle de base offre GLM-4-Air-250414
répondre en chantant GLM-4-Flash-250414
Deux versions, dont la dernière est entièrement gratuite, témoignent de l'intention d'inciter les utilisateurs à l'essayer.

Le modèle d'inférence est ensuite divisé en trois versions pour répondre à des besoins différents :
GLM-Z1-AirX
(Extreme Edition) : se présente comme l'un des modèles d'inférence commerciaux les plus rapides de Chine, avec une vitesse d'inférence en temps réel pouvant atteindre 200 tokens/seconde. Cette vitesse présente un avantage significatif dans les scénarios qui nécessitent une interaction en temps réel ou le traitement d'un grand nombre de demandes.GLM-Z1-Air
(version économique) : à un prix très compétitif, officiellement à seulementDeepSeek-R1
1/30e des scénarios d'appels fréquents et sensibles aux coûts.GLM-Z1-Flash
(version gratuite), ce qui réduit encore les obstacles à l'utilisation et favorise l'adoption par les développeurs.
Cette stratégie de tarification échelonnée, combinée à des options payantes très performantes et à des versions de lancement gratuites, est un moyen courant mais efficace pour les grands fournisseurs de modèles de se disputer des parts de marché.
Liste de prix du modèle correspondant :

Nouveau portail interactif : lancement de la plateforme Z.ai
Smart Spectrum AI a lancé un nouveau nom de domaine Z.ai
qui sert de portail d'expérience interactif pour son dernier modèle. Sélectionner .ai
Le nom de domaine lui-même est un signal de marque fort, il est concis et se rapporte directement à l'activité principale.
à l'heure actuelle Z.ai
La plateforme dispose de trois modèles open source en ligne que les utilisateurs peuvent expérimenter :
GLM-4-32B
(modèle de base) : génération de code d'expérience et fonctionnalités Artifacts.Z1-32B
(Modèles d'inférence) : vous avez une idée directe de la vitesse d'inférence, qui peut atteindre 200 tokens/seconde.Z1-Rumination-32B
(Contemplative Modelling) : exploration de ses capacités de recherche approfondie et de traitement des tâches complexes.

Dans l'ensemble, grâce à cette publication, Smart Spectrum AI a démontré sa capacité à développer des modèles, à mettre en place une stratégie open source et à commercialiser ses produits. Dans le domaine de plus en plus encombré des grands modèles d'IA, la combinaison d'une grande force technique, de protocoles open source flexibles et de solutions de commercialisation compétitives est la clé pour consolider sa position sur le marché et attirer les développeurs et les entreprises utilisatrices.
© déclaration de droits d'auteur
文章版权归 Cercle de partage de l'IA 所有,未经允许请勿转载。
Articles connexes
Pas de commentaires...