Smart Spectrum open platform, le premier modèle de vision multimodale GLM-4V-Flash gratuit en ligne, utilisation illimitée !

Suivre le modèle linguistique d'accès libre et gratuit en août 2024 Wisdom Spectrum supporte 128K de contexte/4K de longueur de sortie grand modèle GLM-4-Flash full volume free open ! Après le lancement de GLM-4V-Flash, nous maintenons le concept de technologie de pointe et de bénéfice pour le public, et nous lançons aujourd'hui le premier modèle multimodal gratuit - GLM-4V-Flash sur la plateforme ouverte bigmodel.cn, qui hérite des forces de la série 4V et fait des percées dans la précision du traitement de l'image, ce qui abaissera encore le seuil pour les développeurs d'exploiter l'application des grands modèles et ouvrira un nouveau chapitre. Le modèle hérite des avantages de la série 4V et fait des percées dans la précision du traitement de l'image, ce qui abaissera encore le seuil pour les développeurs afin d'explorer l'application des grands modèles et d'ouvrir un nouveau chapitre.
Nous espérons que d'autres développeurs rejoindront la plate-forme ouverte Bigmodel (bigmodel.cn) pour tirer parti du traitement d'images du GLM-4V-Flash, transformer les capacités du modèle en applications pratiques et améliorer l'efficacité du travail et l'expérience de l'utilisateur dans les domaines de l'extraction d'informations, de la création de contenu et de la reconnaissance d'images.
查看免费API: bigmodel.cn 说明文档:bigmodel.cn/dev/api/normal-model/glm-4v
Tutoriels
GLM-4V-Flash : Image url ou encodage base64. La taille de l'image à télécharger est inférieure à 5M par image, et le pixel ne dépasse pas 6000*6000. Les formats jpg, png, jpeg sont pris en charge. Note : GLM-4V-Flash ne supporte pas l'encodage base64, seul glm-4v-plus supporte l'entrée vidéo, limite de concurrence : 2.
Télécharger l'URL de l'image
from zhipuai import ZhipuAI client = ZhipuAI(api_key="") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "text", "text": "图里有什么" }, { "type": "image_url", "image_url": { "url" : "https://img1.baidu.com/it/u=1369931113,3388870256&fm=253&app=138&size=w931&n=0&f=JPEG&fmt=auto?sec=1703696400&t=f3028c7a1dca43a080aeb8239f09cc2f" } } ] } ] ) print(response.choices[0].message)
Télécharger l'image Base64
import base64 from zhipuai import ZhipuAI img_path = "/Users/YourCompluter/xxxx.jpeg" with open(img_path, 'rb') as img_file: img_base = base64.b64encode(img_file.read()).decode('utf-8') client = ZhipuAI(api_key="YOUR API KEY") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v-plus", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "image_url", "image_url": { "url": img_base } }, { "type": "text", "text": "请描述这个图片" } ] } ] ) print(response.choices[0].message)
Adresse de l'expérience :(Seules les images fixes peuvent être téléchargées, les images animées et les vidéos ne sont pas prises en charge).
https://glm4v.aisharenet.com/ (le boulon est si pratique pour vérifier rapidement les interactions des fonctions de l'API, le site web généré après avoir directement téléchargé la documentation de l'API)
© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...