Plataforma abierta Smart Spectrum, el primer modelo gratuito de visión multimodal GLM-4V-Flash en línea, ¡uso ilimitado!

智谱开放平台,上线首款免费多模态视觉模型GLM-4V-Flash,不限量使用!

Siguiendo el modelo lingüístico de acceso libre y gratuito en agosto de 2024 Wisdom Spectrum admite 128K de contexto/4K de longitud de salida gran modelo GLM-4-Flash a todo volumen ¡abierto gratis! Tras el lanzamiento de GLM-4V-Flash, mantenemos el concepto de tecnología puntera y beneficio para el público, y hoy hemos lanzado el primer modelo multimodal gratuito, GLM-4V-Flash, en la plataforma abierta bigmodel.cn, que hereda las ventajas de la serie 4V y realiza grandes avances en la precisión del procesamiento de imágenes, lo que reducirá aún más el umbral para que los desarrolladores exploren la aplicación de los modelos de gran tamaño y abra un nuevo capítulo. El modelo hereda las ventajas de la serie 4V y realiza grandes avances en la precisión del procesamiento de imágenes, lo que reducirá aún más el umbral para que los desarrolladores exploren la aplicación de modelos de gran tamaño y abra un nuevo capítulo.

Esperamos que más desarrolladores se unan a la plataforma abierta Bigmodel (bigmodel.cn) para aprovechar las ventajas del procesamiento de imágenes de GLM-4V-Flash, transformar las capacidades del modelo en aplicaciones prácticas y mejorar la eficacia del trabajo y la experiencia del usuario en los campos de la extracción de información, la creación de contenidos y el reconocimiento de imágenes.

查看免费API: bigmodel.cn

说明文档:bigmodel.cn/dev/api/normal-model/glm-4v

 

Tutoriales

GLM-4V-Flash: url de imagen o codificación base64. El límite de carga de imágenes es inferior a 5M por imagen, y el píxel no es superior a 6000*6000. Soporta los formatos jpg, png, jpeg. Nota: GLM-4V-Flash no soporta codificación base64, sólo glm-4v-plus soporta entrada de vídeo, límite de concurrencia: 2.

 

Cargar URL de imagen

from zhipuai import ZhipuAI client = ZhipuAI(api_key="") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "text", "text": "图里有什么" }, { "type": "image_url", "image_url": { "url" : "https://img1.baidu.com/it/u=1369931113,3388870256&fm=253&app=138&size=w931&n=0&f=JPEG&fmt=auto?sec=1703696400&t=f3028c7a1dca43a080aeb8239f09cc2f" } } ] } ] ) print(response.choices[0].message)

 

Subir imagen Base64

import base64 from zhipuai import ZhipuAI img_path = "/Users/YourCompluter/xxxx.jpeg" with open(img_path, 'rb') as img_file: img_base = base64.b64encode(img_file.read()).decode('utf-8') client = ZhipuAI(api_key="YOUR API KEY") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v-plus", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "image_url", "image_url": { "url": img_base } }, { "type": "text", "text": "请描述这个图片" } ] } ] ) print(response.choices[0].message)

 

Dirección de la experiencia:(Sólo pueden cargarse imágenes fijas, no imágenes en movimiento ni vídeos)

https://glm4v.aisharenet.com/ (el perno es muy útil para verificar rápidamente las interacciones de las funciones de la API, el sitio web generado después de cargar directamente la documentación de la API)

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...