继 2024 年 8 月免费开放语言模型 Wisdom Spectrum supports 128K context/4K output length large model GLM-4-Flash full volume free open! 后,我们秉持技术领先、普惠大众的理念,今日我们在智谱开放平台(bigmodel.cn)上线首款免费多模态模型——GLM-4V-Flash。该模型继承 4V 系列优势,并在图像处理精度上取得突破,将进一步降低开发者挖掘大模型应用的门槛,开启新篇章。
我们期待更多开发者加入智谱开放平台(bigmodel.cn),利用 GLM-4V-Flash 的图像处理优势,将模型能力转化为实际应用,提升信息提取、内容创作、图片识别等领域的工作效率与用户体验。
查看免费API: bigmodel.cn 说明文档:bigmodel.cn/dev/api/normal-model/glm-4v
Tutorials
GLM-4V-Flash:图片url或者base64编码。 图像大小上传限制为每张图像 5M以下,且像素不超过 6000*6000。 支持jpg、png、jpeg格式。 说明: GLM-4V-Flash 不支持base64编码,仅glm-4v-plus支持视频输入,并发数限制:2。
上传图片 URL
from zhipuai import ZhipuAI client = ZhipuAI(api_key="") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "text", "text": "图里有什么" }, { "type": "image_url", "image_url": { "url" : "https://img1.baidu.com/it/u=1369931113,3388870256&fm=253&app=138&size=w931&n=0&f=JPEG&fmt=auto?sec=1703696400&t=f3028c7a1dca43a080aeb8239f09cc2f" } } ] } ] ) print(response.choices[0].message)
上传图片 Base64
import base64 from zhipuai import ZhipuAI img_path = "/Users/YourCompluter/xxxx.jpeg" with open(img_path, 'rb') as img_file: img_base = base64.b64encode(img_file.read()).decode('utf-8') client = ZhipuAI(api_key="YOUR API KEY") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v-plus", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "image_url", "image_url": { "url": img_base } }, { "type": "text", "text": "请描述这个图片" } ] } ] ) print(response.choices[0].message)
体验地址:(仅允许上传静态图片,动图和视频不支持)
https://glm4v.aisharenet.com/ (bolt 在快速验证API功能交互时太方便了,直接上传API文档后生成的网站)