Step-GUI - ステップスターオープンソースAIエージェントシリーズモデル
Step-GUIはStep-StarのオープンソースAIエージェントシリーズで、クラウドモデルStep-GUI、GUIエージェントのための最初のMCPプロトコル、携帯電話の展開をサポートする業界初のオープンソースエンドサイドモデルStep-GUI Edgeを含みます。
A2UI - エージェント駆動型ユーザー・インタラクション・インターフェースのためのGoogleのオープンソース宣言型プロトコル
A2UI(Agent-to-User Interface)は、Googleがオープンソースで提供するエージェント駆動型インターフェース・プロトコルであり、AIエージェント向けに複雑な対話型インターフェースを生成する際の課題に対処する。AIエージェントがユーザーインターフェースの構造を記述できるようにする宣言的なJSONフォーマットを通じて、クライアントアプリケーションは、AIエージェントがユーザーインターフェースの構造を記述できるようにします。
SAM Audio - オープンソースのマルチモーダル音声セグメンテーションモデル(Metaより
SAMオーディオは、複雑なオーディオミックスから任意のターゲット音を正確に分離する、Meta社のオープンソースのマルチモーダルオーディオセグメンテーションモデルです。テキスト、ビジュアル、時間次元のキューを組み合わせることで、オーディオ編集、ノイズ除去、音抽出、...といったタスクのための柔軟で効率的なオーディオ処理を可能にします。
Mixed World Model 1.5 - Tencent Mixedオープンソースリアルタイム世界モデル生成フレームワーク
ハイブリッド世界モデル1.5(Tencent HY WorldPlay)は、Tencentがリリースした業界初のオープンソースリアルタイム世界モデルフレームワークであり、データ、トレーニング、ストリーミング推論の展開のフルチェーンをカバーする。コアとなるのはWorldPlay自己回帰拡散モデルで、Next-F...
Molmo 2 - Ai2オープンソース・マルチモーダル動画像理解モデルファミリー
Molmo 2は、Allen Institute for AI (Ai2)によって公開されたオープンソースのマルチモーダルモデルで、ビデオやマルチイメージの理解を向上させる。Molmo 2 (8B)、Molmo 2 (4B)、Molmo 2-O...の3種類があります。
LongCat-Video-Avatar - Meituanオープンソースアバタービデオ生成モデル
LongCat-Video-Avatarは、Meituanによってオープンソース化されたLongCat-Videoをベースに構築された先進的な音声駆動型ビデオ生成モデルであり、自然なダイナミクスと一貫したアイデンティティを持つ、超リアルでリップシンクされたロングビデオの生成に焦点を当てている。
MiMo-V2-Flash - シャオミが公開したオープンソースMoEアーキテクチャの大型モデル
MiMo-V2-FlashはXiaomiが発表したオープンソースのMoEアーキテクチャの大型モデルで、総パラメータは3,090億、アクティブパラメータは150億であり、効率的な推論とインテリジェントボディの応用に焦点を当てている。ハイブリッドアテンションアーキテクチャと多言語メタ予測技術を採用し、推論速度は150トークン/秒である。
Nemotron 3 - NVIDIAがリリースしたオープンソースのAIモデルファミリー
Nemotron 3は、NVIDIAがNano、Super、UltraサイズでリリースしたオープンソースのAIモデルファミリーです。Nemotron 3は、潜在MoEアーキテクチャを採用し、推論効率を大幅に向上させ、運用コストを削減している。そのうちの1つ...
Wan-Move - アリ・トンイのオープンソースAI動画生成フレームワーク、清華大学らと共同開発
Wan-Moveは、Ali Tongyi Labsと清華大学などが共同開発したオープンソースのAI動画生成フレームワークで、精密なモーションコントロール技術による高品質な動画合成に焦点を当てている。核心技術は「潜在的軌道誘導」で、既存の画像-動画モデルに点レベルのモーション制御をシームレスに追加することができる。
PaCoRe - StepStarのオープンソース並列協調AI推論フレームワーク
PaCoRe (Parallel Coordinated Reasoning)は、StepFunのオープンソースの革新的な並列協調推論フレームワークで、超並列思考メカニズムを通じて、複数の視点から同時に問題解決策を探索し、従来の...








