Seguindo o modelo de linguagem de acesso livre e aberto em agosto de 2024 O Wisdom Spectrum suporta 128K de contexto/4K de comprimento de saída modelo grande GLM-4-Flash de volume total aberto! Após o lançamento do GLM-4V-Flash, defendemos o conceito de tecnologia de ponta e beneficiamos o público, e hoje lançamos o primeiro modelo multimodal gratuito - GLM-4V-Flash na plataforma aberta bigmodel.cn, que herda as vantagens da série 4V e faz avanços na precisão do processamento de imagens, o que reduzirá ainda mais o limite para que os desenvolvedores explorem a aplicação de modelos grandes e abram um novo capítulo. O modelo herda as vantagens da série 4V e faz avanços na precisão do processamento de imagens, o que reduzirá ainda mais o limite para os desenvolvedores explorarem a aplicação de modelos grandes e abrirá um novo capítulo.
Esperamos que mais desenvolvedores se juntem à Bigmodel Open Platform (bigmodel.cn) para aproveitar o processamento de imagens do GLM-4V-Flash, transformar os recursos do modelo em aplicações práticas e melhorar a eficiência do trabalho e a experiência do usuário nas áreas de extração de informações, criação de conteúdo e reconhecimento de imagens.
Exibir API gratuita: bigmodel.co.uk Documentação: bigmodel.cn/dev/api/normal-model/glm-4v
Tutoriais
GLM-4V-Flash: URL da imagem ou codificação base64. O limite de upload do tamanho da imagem é inferior a 5M por imagem e o pixel não é superior a 6000*6000. Suporta os formatos jpg, png e jpeg. Observação: o GLM-4V-Flash não é compatível com a codificação base64, apenas o glm-4v-plus é compatível com a entrada de vídeo, limite de simultaneidade: 2.
Carregar URL da imagem
from zhipuai import ZhipuAI client = ZhipuAI(api_key="") # Preencha sua própria APIKey response = client.chat.completions.create( model="glm-4v", # Preencha o Nome do modelo a ser chamado messages=[ { "role": "user", "content": [ { "type": "text", "text": "What's in the picture" }, { "type": "image_url", "image_url": { "url" : "https://img1. baidu.com/it/u=1369931113,3388870256&fm=253&app=138&size=w931&n=0&f=JPEG&fmt=auto?sec=1703696400&t= f3028c7a1dca43a080aeb8239f09cc2f" } } ] } ] ) print(response.choices[0].message)
Carregar imagem Base64
import base64 from zhipuai import ZhipuAI img_path = "/Users/YourCompluter/xxxx.jpeg" with open(img_path, 'rb') as img_file: img_base = base64. b64encode(img_file.read()).decode('utf-8') client = ZhipuAI(api_key="YOUR API KEY") # Preencha sua própria APIKey response = client.chat.completions. create( model="glm-4v-plus", # Preencha o nome do modelo que precisa ser chamado messages=[ { "role": "user", "content": [ { "type": "image_url", "image_url": { "url": img_base } }, { "type": "text", "text": "Please describe this image" } ] } ] ) print(response.choices[0].message)
Endereço de experiência:(Somente imagens estáticas podem ser carregadas, imagens em movimento e vídeos não são suportados)
https://glm4v.aisharenet.com/ (o parafuso é muito útil para verificar rapidamente as interações da função da API, o site gerado após o upload direto da documentação da API)