8月27日より、ウィズダムスペクトラムはGLM-4-Flash APIを無料で公開しています。GLM-4-Flashは3日間の英語から中国語への翻訳テストを行い、GLM-4-9bが提供するシリコンフローと比較しています。 OpenRouter:複数のLLMを統合する統一インターフェース、無料の大規模モデルインターフェース RIPが提供する多くの無料モデルAPIに劣る効果や速度はない。
GLM-4-9bは以前、以下のAPIを無償で公開した。 SILICONFLOW(シリコンフロー):人類のAGIを加速する、無料の大規模モデルインターフェースを統合 GLM-4-FlashとGLM-4-9bは、モデルの大きさ、パラメータ数、アプリケーションのシナリオなどに違いがある。
GLM-4-Flashモデルは、「スピード」と「パフォーマンス」の両面で大きなアドバンテージを持っていると言える。
モデルの推論速度を向上させるために、GLM-4-Flashは適応的な重みの定量化、複数の並列処理技術、バッチ処理戦略、投機的サンプリングなどの最適化手段を採用している。GLM-4-Flashの推論速度は、1週間のテストサイクルで72.14 token/sと安定しており、他のモデルよりも大幅に優れています。
性能面では、GLM-4-Flashはモデルの事前学習段階で最大10Tの高品質な多言語データを使用し、多ラウンドの対話、ウェブ検索、ツール呼び出し、長文テキスト(最大128Kの文脈長をサポート。出力4K長中国語、英語、日本語、韓国語、ドイツ語を含む26カ国語に対応しています。
完全にフリーでオープンなGLM-4-Flash APIをベースに、ユーザーが特定のアプリケーションシナリオにモデルをより良く適用することをサポートするために、我々は同時に様々なユーザーのニーズを満たすためにモデルの微調整機能を提供します。是非ご利用ください!