クロード・ソネット4.5 - Anthropicの最強AIプログラミングモデル
クロード・ソネット4.5は、プログラミング、コンピュータ操作、複雑なタスクの自動化のために設計されたAnthropic社の人工知能モデルです。コード生成、長時間のタスク処理、推論、数学的計算を得意とし、初期計画から...
Qwen3-TTS-Flash - Ali Tongyiによる音声合成モデル
Qwen3-TTS-FlashはAli Tongyiによって導入された先進的な音声合成モデルで、北京語、英語、方言などをカバーする17の声調と10の言語をサポートする。
Qwen3-Omni - Ali Tongyiが紹介するオムニモーダルAIモデル
Qwen3-Omniは、Ali Tongyiチームによって導入された完全なモーダルAIモデルであり、テキスト、画像、オーディオ、ビデオなどの複数のデータタイプを扱うことができ、低レイテンシと高い制御性で119言語のテキストインタラクションをサポートしています。
DeepSeek-V3.1-Terminus - DeepSeekが導入したAIモデルの最新バージョン
DeepSeek-V3.1-Terminusは、DeepSeekチームの人工知能言語モデルであるDeepSeek-V3.1のアップグレード版です。このモデルは、言語の一貫性、コード生成、検索機能の面で最適化され、より正確に...
Granite-Docling-258M - IBM オープンソース視覚言語モデル
Granite-Docling-258Mは、効率的な文書変換のために設計された、IBMによる超コンパクトなオープンソースの視覚言語モデルです。このモデルは、レイアウト、表、数式、その他の要素をそのままに、文書を機械可読形式に変換します。
Ling-V2 - Ant-BellingオープンソースのMoEアーキテクチャ言語モデルシリーズ
Ling-V2は、Ant-Bellingチームによって導入されたMoEアーキテクチャに基づく大規模言語モデルファミリーである。 最初のバージョンであるLing-mini-2.0は、総パラメータが160億であり、入力トークンあたり14億のパラメータしか起動しない。
Xiaomi-MiMo-Audio-シャオミ・オープンソース初のネイティブ・エンド・トゥ・エンド・スピーチ・ビッグモデル
Xiaomi-MiMo-Audioは、多言語対話、音声継続、サンプル数の少ない汎化、音声理解などの強力な機能を備えた、Xiaomiのオープンソースの70億パラメータのエンドツーエンド音声マクロモデルであり、音声インテリジェンスと音声理解のベンチマークでSOTAレベルに達することができ、Google Gemi...を上回っています。
WebWeaver - アリ・トンイ、新しいデュアル・インテリジェンス・ボディ・フレームワークをオープンソースで公開
WebWeaverはアリババ同業チームが導入した新しい二重知能体フレームワークで、主にオープンディープリサーチで使用され、人間の研究プロセスをシミュレートすることができる。
MCP Registry - GitHubが提供する公式MCPサーバー管理プラットフォーム。
MCPレジストリは、開発者がMCPサーバーをより簡単に発見し、インストールできるようにするGitHubの集中型プラットフォームです。MCPレジストリを使えば、開発者は必要なAIツールを一箇所ですぐに見つけることができ、大幅に簡素化されます。
Tongyi DeepResearch - アリ・トンイ オープンソース・ディープリサーチ インテリジェンス機関
Tongyi DeepResearch(同義ディープリサーチ)は、アリババが立ち上げたオープンソースのインテリジェントボディで、深い情報検索と複雑なタスクの推論のために設計され、300億のパラメータを持ち、ReActモードと深度モードを含む複数の推論モードをサポートする...