2024年8月のフリー・オープンアクセス言語モデルに続く Wisdom Spectrumは128Kコンテクスト/4K出力長の大型モデルGLM-4-Flashフルボリューム・フリーオープンをサポートします! GLM-4V-Flashの発売後、私たちは技術をリードし、公衆に利益をもたらすというコンセプトを堅持し、本日、bigmodel.cnオープンプラットフォームで初の無料マルチモーダルモデル-GLM-4V-Flashを発売しました。4Vシリーズの長所を継承し、画像処理精度のブレークスルーを実現し、開発者の敷居をさらに低くして、大型モデルの応用を開拓し、新しい章を開きます。GLM-4V-Flashは、4Vシリーズの長所を継承し、画像処理精度のブレークスルーを実現し、開発者の敷居をさらに下げ、大型モデルの応用を開拓し、新たな章を開きます。
より多くの開発者がBigmodelオープンプラットフォーム(bigmodel.cn)に参加し、GLM-4V-Flashの画像処理を活用し、モデルの能力を実用的なアプリケーションに変換し、情報抽出、コンテンツ作成、画像認識の分野における作業効率とユーザーエクスペリエンスを向上させることを期待しています。
無料APIを見る: bigmodel.co.uk ドキュメント: bigmodel.cn/dev/api/normal-model/glm-4v
チュートリアル
GLM-4V-Flash:画像のURLまたはbase64エンコーディング。 アップロード可能な画像サイズは1枚あたり5M以下、ピクセルは6000*6000以下。 jpg, png, jpeg形式をサポート。 注:GLM-4V-Flashはbase64エンコーディングに対応していません。glm-4v-plusのみビデオ入力に対応しています。
画像URLのアップロード
from zhipuai import ZhipuAI client = ZhipuAI(api_key="") # 自分のAPIKeyを記入 response = client.chat.completions.create( model="glm-4v", # 呼び出すモデル名を記入。呼び出されるモデル名 messages=[ { "role": "user", "content": [ { "type": "text", "text": "What's in the picture" }, { "type": "image_url", "image_url": { "url" : "https://img1.baidu.com/it/u=1369931113,3388870256&fm=253&app=138&size=w931&n=0&f=JPEG&fmt=auto?sec=1703696400&t=f3028c7a1dca43a080aeb8239f09cc2f" } } ] ) print(response.choices[0].message)
画像のアップロード Base64
import base64 from zhipuai import ZhipuAI img_path = "/Users/YourCompluter/xxxx.jpeg" with open(img_path, 'rb') as img_file: img_base = base64.b64encode(img_file.read()).decode('utf-8') client = ZhipuAI(api_key="YOUR API KEY") # 自分のAPIKeyを記入 response = client.chat.completions.create( model="glm-4v-plus", # 呼び出す必要のあるモデル名を記入 messages=[ { "role": "user", "content": [ { "type": "image_url", "image_url": { "url": img_base } }, {「type": "text", "text": "Please describe this image" } } ] ) print(response.choices[0].message)
住所(アップロードできるのは静止画のみで、動画には対応していません。)
https://glm4v.aisharenet.com/ (ボルトはAPI関数の相互作用を素早く検証するのにとても便利で、APIドキュメントを直接アップロードした後に生成されたウェブサイト)