中項MiniMax Speech 2.5 - MiniMaxの音声生成モデル
MiniMax Speech 2.5は、MiniMaxチームによって開発された高度な音声生成モデルです。音声合成の分野において、特に多言語の表現力、音色の再現精度、言語カバー率の点で大きな進歩を遂げています。このモデルは40の言語をサポートしています。
中項GPT-5 - 統合知能システムOpenAIが導入した最強の言語モデル
GPT-5はOpenAIがリリースした最新の言語モデルで、いくつかのアップグレードが施されています。リアルタイム・ルーターを内蔵した統合知能システムで、問題の複雑さに応じて効率的な思考モードと深い思考モードを自動的に切り替え、迅速な応答と正確な回答を可能にする。
dots.vlm1 - Small Red Book Hi Lab オープンソース マルチモーダルラージモデル
dots.vlm1は、Little Red Book hi labがオープンソース化した初のマルチモーダルビッグモデルです。ゼロからトレーニングされた12億パラメータの視覚コーダーNaViTとDeepSeek V3 Large Language Model (LLM)をベースに、強力な視覚認識とテキスト推論を備えています。
LangExtract - 構造化情報を抽出するためのGoogleのオープンソースPythonライブラリ
LangExtractは、大規模言語モデル(LLM)を使用して、構造化されていないテキストから構造化された情報を抽出するGoogleオープンソースのPythonライブラリです。ユーザー定義のコマンドと少ないサンプル数で、...からの臨床メモのような重要な詳細を効率的に識別し、整理することができます。
Qwen-Image - Tongyi Qianqian、Qwen-Imageのオープンソース基本モデルを発表
Qwen-Imageは、Alibaba Tongyi Qianqianチームによってリリースされたオープンソースの画像生成ベースモデルです。200億のパラメータを持ち、マルチモーダル理解、高解像度コーディング、拡散モデリングの3つのモジュールを組み込んだマルチモーダル拡散変換アーキテクチャ(MMDiT)を採用しています。
Gemini 2.5 Deep Think - GoogleのAI推論モデル
Gemini 2.5 Deep Thinkは、複雑なタスクを解決するために設計されたGoogleのAI推論モデルである。国際数学オリンピック(IMO)2025で金メダルを獲得したモデルの亜種であり、並列推論によって複雑なタスクを解くように設計されている。
MindLink - KunlunWeiのオープンソース推論ビッグモデル
MindLinkは崑崙ワールドワイドウェブによって起動されたオープンソースの推論の大規模なモデルです。適応推論機構を使用すると、タスクの複雑さに応じて柔軟に推論モードを切り替えることができ、単純なタスクが迅速に生成され、複雑なタスクの詳細な推論、アカウントに効率と精度を取る。計画駆動型の推論のパラダイムは、 "考える "タグを削除するには、減らす...
MirageLSD - Decart AI、初のリアルタイムAI動画生成モデルを発表
MirageLSDは、Decart AIチームによる世界初のリアルタイムストリーミング拡散AIビデオモデルであり、40ミリ秒という低レイテンシーと24フレーム/秒のスムーズな出力で、無制限のリアルタイムビデオ生成を可能にする。
k2 - 月のダークサイド キミの最新MoE建築ベースモデル
k2は、Moonshot AIが提供する優れたコードとエージェント機能を備えたMoEアーキテクチャのベースモデルで、1Tの総パラメータと32Bの起動パラメータを備えています。一般知識推論、プログラミング、数学、エージェントの主要カテゴリにおけるベンチマーク性能テストにおいて、k2モデルは...
Grok 4 - マスクのxAIの最新大型モデル
Grok 4はxAIの最新大型AIモデルであり、Grok 4は前モデルに比べ推論能力が10倍向上している。このモデルの優れた推論能力は、SATやGREなどの難関試験で満点に近いスコアを可能にし、多くのベンチマークテストで他の最先端モデルを凌駕している...