Intern-S1-mini - Shanghai AI Labによるオープンソースの軽量科学的マルチモーダルモデル
Intern-S1-miniは、上海人工知能研究所(SAL)が発表したパラメータスケール8Bの軽量科学用マルチモーダル・マクロモデルである。Intern-S1の強力な機能を継承し、汎用的な機能と特殊な科学的機能の両方を兼ね備えており、迅速な展開や二次開発に適している。性能面では、I...
ナノ・バナナ - GoogleのAI画像編集モデル
ナノ・バナナは、ジェミニ2.5フラッシュイメージのコードネームです。ジェミニは、Googleが提供するAI画像生成・編集モデルで、シンプルなテキストプロンプトに基づいて詳細で写実的な画像を生成し、既存の画像に高品質な修正を加えます。
Genie Envisioner - Jiyuanのオープンソース汎用ロボットプラットフォーム、Beihangなどと共同開発
Genie Envisioner(GE)は、Genie Roboticsチームがシンガポール国立大学、北京航空航天大学などと共同で開発したロボット操作のための統合プラットフォーム。まず想像し、それから行動する」ことで、ロボットがタスクをよりよく理解し、実行することを可能にする。
DINOv3 - Meta AIの次世代自己教師付き視覚ベースモデル
DINOv3は、Meta AIが開発した次世代の自己教師付き視覚ベースモデルであり、自己教師付き学習パラダイムを使用して、ラベル付けデータなしで画像の特徴を学習する。データ準備の改善とGramアンカリングの導入により、特徴量の劣化問題を解決し、汎化能力を向上させている。
マトリックスゲーム2.0 - KunlunWeiによって開発されたインタラクティブな世界モデル
Matrix-Game 2.0は、Kunlun SkyWork AIがリリースした自社開発のインタラクティブワールドモデルです。Matrix-Game 2.0は、業界初のオープンソース、リアルタイム、長シーケンスの汎用シナリオ用インタラクティブ生成モデルであり、複数のシナリオを25FPSで動作させることができる。
Baichuan-M2 - Baichuan Intelligence、オープンソースのヘルスケア強化ビッグモデルを発表
Baichuan-M2は、Baichuan Intelligenceが発表したオープンソースの医療用拡張マクロモデルです。医療分野で高いパフォーマンスを発揮し、特にHealthBenchのレビューでは60.1というスコアで、OpenAIのgpt-oss120bや他の多くのオープンソースモデルを上回り、世界的な...
Qwen-Flash - Tongyi Chien-quanによる高性能、低コストの言語モデル
Qwen-Flashは、アリババ「同義千問」シリーズに導入された高性能・低価格の言語モデルで、高速レスポンスとシンプルなタスクの効率的な処理のために設計されています。高度なMoE(Mixture-of-Experts)アーキテクチャに基づき、スパースエキスパートネットワークによって実現されています。
SkyReels-A3 - 崑崙王維の音声駆動型デジタル人間創造ツール
SkyReels-A3は、崑崙ワールドワイドグループが開発した音声駆動型デジタルヒューマンクリエーションツールです。SkyReels-A3は、音声駆動型デジタル人体作成ツールで、簡単な入力(例:肖像画像と音声)で高品質の動的ビデオコンテンツを生成したり、静止画を「生き生きと」させたり、既存のビデオのセリフを新しいリップシンクに置き換えてキャラクターが自動的に合わせることができます...
MiniMax Speech 2.5 - MiniMaxの音声生成モデル
MiniMax Speech 2.5は、MiniMaxチームによって開発された高度な音声生成モデルです。音声合成の分野において、特に多言語の表現力、音色の再現精度、言語カバー率の点で大きな進歩を遂げています。このモデルは40の言語をサポートしています。
GPT-5 - 統合知能システムOpenAIが導入した最強の言語モデル
GPT-5はOpenAIがリリースした最新の言語モデルで、いくつかのアップグレードが施されています。リアルタイム・ルーターを内蔵した統合知能システムで、問題の複雑さに応じて効率的な思考モードと深い思考モードを自動的に切り替え、迅速な応答と正確な回答を可能にする。