Wisdom Spectrum supporte 128K de contexte/4K de longueur de sortie grand modèle GLM-4-Flash full volume free open !

Depuis le 27 août, Wisdom Spectrum met gratuitement à la disposition du public l'API GLM-4-Flash. Lors d'un test de traduction anglais-chinois de 3 jours, GLM-4-Flash est comparé au flux de silicium fourni par GLM-4-9b et à l'API GLM-4-Flash. OpenRouter : interface unifiée pour l'intégration de plusieurs LLM, interface libre pour les grands modèles Il n'est ni moins efficace ni plus rapide que les nombreux modèles d'API gratuits proposés par le RIP.

 

GLM-4-9b a précédemment publié une API gratuite sur le site SILICONFLOW (Silicon Flow) : accélérer l'AGI pour l'humanité, en intégrant une interface libre pour les grands modèles. GLM-4-Flash et GLM-4-9b présentent des différences au niveau de la taille du modèle, du nombre de paramètres, des scénarios d'application, etc. Il s'agit également d'API gratuites, qui fournissent toutes deux des services gratuits.

On peut dire que le modèle GLM-4-Flash présente un grand avantage en termes de "vitesse" et de "performance".

Afin d'améliorer la vitesse d'inférence du modèle, GLM-4-Flash adopte un certain nombre de mesures d'optimisation telles que la quantification adaptative des poids, les techniques de traitement parallèle multiple, la stratégie de traitement par lots et l'échantillonnage spéculatif. Selon les résultats des tests de vitesse des modèles tiers, la vitesse d'inférence de GLM-4-Flash est stable autour de 72,14 jetons/s dans un cycle de test d'une semaine, ce qui est nettement meilleur que les autres modèles.

 

智谱支持128K上下文/4K输出长度大模型GLM-4-Flash全量免费开放!

 

En termes de performances, GLM-4-Flash utilise jusqu'à 10T de données multilingues de haute qualité dans la phase de pré-entraînement du modèle, ce qui permet au modèle de raisonner sur des dialogues à plusieurs tours, des recherches sur le web, des invocations d'outils et des textes longs (avec une prise en charge des longueurs de contexte allant jusqu'à 128K).Longueur de la sortie 4K), etc. Il prend en charge 26 langues, dont le chinois, l'anglais, le japonais, le coréen et l'allemand.
Sur la base de l'API GLM-4-Flash entièrement gratuite et ouverte, afin d'aider les utilisateurs à mieux appliquer le modèle à des scénarios d'application spécifiques, nous fournissons simultanément des fonctions de réglage fin du modèle pour répondre aux besoins des différents utilisateurs. Nous vous invitons à l'utiliser !

© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...