Plataforma abierta Smart Spectrum, el primer modelo gratuito de visión multimodal GLM-4V-Flash en línea, ¡uso ilimitado!

Siguiendo el modelo lingüístico de acceso libre y gratuito en agosto de 2024 Wisdom Spectrum admite 128K de contexto/4K de longitud de salida gran modelo GLM-4-Flash a todo volumen ¡abierto gratis! Tras el lanzamiento de GLM-4V-Flash, mantenemos el concepto de tecnología puntera y beneficio para el público, y hoy hemos lanzado el primer modelo multimodal gratuito, GLM-4V-Flash, en la plataforma abierta bigmodel.cn, que hereda las ventajas de la serie 4V y realiza grandes avances en la precisión del procesamiento de imágenes, lo que reducirá aún más el umbral para que los desarrolladores exploren la aplicación de los modelos de gran tamaño y abra un nuevo capítulo. El modelo hereda las ventajas de la serie 4V y realiza grandes avances en la precisión del procesamiento de imágenes, lo que reducirá aún más el umbral para que los desarrolladores exploren la aplicación de modelos de gran tamaño y abra un nuevo capítulo.
Esperamos que más desarrolladores se unan a la plataforma abierta Bigmodel (bigmodel.cn) para aprovechar las ventajas del procesamiento de imágenes de GLM-4V-Flash, transformar las capacidades del modelo en aplicaciones prácticas y mejorar la eficacia del trabajo y la experiencia del usuario en los campos de la extracción de información, la creación de contenidos y el reconocimiento de imágenes.
查看免费API: bigmodel.cn 说明文档:bigmodel.cn/dev/api/normal-model/glm-4v
Tutoriales
GLM-4V-Flash: url de imagen o codificación base64. El límite de carga de imágenes es inferior a 5M por imagen, y el píxel no es superior a 6000*6000. Soporta los formatos jpg, png, jpeg. Nota: GLM-4V-Flash no soporta codificación base64, sólo glm-4v-plus soporta entrada de vídeo, límite de concurrencia: 2.
Cargar URL de imagen
from zhipuai import ZhipuAI client = ZhipuAI(api_key="") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "text", "text": "图里有什么" }, { "type": "image_url", "image_url": { "url" : "https://img1.baidu.com/it/u=1369931113,3388870256&fm=253&app=138&size=w931&n=0&f=JPEG&fmt=auto?sec=1703696400&t=f3028c7a1dca43a080aeb8239f09cc2f" } } ] } ] ) print(response.choices[0].message)
Subir imagen Base64
import base64 from zhipuai import ZhipuAI img_path = "/Users/YourCompluter/xxxx.jpeg" with open(img_path, 'rb') as img_file: img_base = base64.b64encode(img_file.read()).decode('utf-8') client = ZhipuAI(api_key="YOUR API KEY") # 填写您自己的APIKey response = client.chat.completions.create( model="glm-4v-plus", # 填写需要调用的模型名称 messages=[ { "role": "user", "content": [ { "type": "image_url", "image_url": { "url": img_base } }, { "type": "text", "text": "请描述这个图片" } ] } ] ) print(response.choices[0].message)
Dirección de la experiencia:(Sólo pueden cargarse imágenes fijas, no imágenes en movimiento ni vídeos)
https://glm4v.aisharenet.com/ (el perno es muy útil para verificar rápidamente las interacciones de las funciones de la API, el sitio web generado después de cargar directamente la documentación de la API)
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...