FG-CLIP 2 - 360 オープンソース・クロスモーダルグラフィックス視覚言語モデル
FG-CLIP 2は、360人工知能研究所が発表した世界有数のグラフィカル・クロスモーダル視覚言語モデル(VL-M)であり、29の権威あるベンチマークでGoogleやMetaの類似モデルを上回り、現在最も強力なVL-Mとなっている。
Micro Opinion BettaFish - オープンソースマルチインテリジェンス意見分析システム
BettaFishは、オープンソースのマルチインテリジェンス・オピニオン分析システムです。マルチ・インテリジェント・ボディ・アーキテクチャを採用し、クエリ、メディア、インサイト、レポート、その他のエージェントが連携して、検索、抽出、レポートのクローズドループを実現します。このシステムは、AI主導の完全な...
Ouro - ByteHopper Seedチームがオープンソース化した新しい循環言語モデル
Ouroは、ByteDance Seedチームによって開発された新しいタイプのループ言語モデル(LLM)であり、パラメータ共有型のリカレント計算構造によって、事前学習段階で推論機能を直接構築するという革新的なコアを持つ。このモデルは、24層を基本ブロックとし、...
ChronoEdit - NVIDIAとトロント大学がオープンソース化したAI画像編集フレームワーク
NVIDIAとトロント大学が共同開発したオープンソースのAI画像編集フレームワーク「ChronoEdit」は、画像編集タスクを動画生成タスクとして再定義し、編集結果の時間的・物理的整合性を保証する。14Bのパラメータを持つ事前に訓練された動画生成モデルを...
LongCat-Flash-Omni - 明潭オープンソースのための完全モード大規模言語モデル
LongCat-Flash-Omniは、MeituanのLongCatチームによってリリースされたオープンソースの完全モーダルビッグ言語モデルです。5,600億のパラメータスケール(270億のアクティブ化されたパラメータ)を持ち、多数のパラメータを維持しながら、ミリ秒レベルのリアルタイムの音声と映像のインタラクション機能を実現している。
Petri - AnthropicのオープンソースAIセキュリティ監査フレームワーク
Petriは、Anthropic社によって開発されたオープンソースのAIセキュリティ監査フレームワークであり、AIモデルのセキュリティと振る舞いの整合性を体系的に評価する。実世界のシナリオをシミュレートすることで、自動監査人が対象モデルと複数回の対話を行い、その後、判定エージェントがモデルの...
キミ・リニア - 月の裏側でオープンソース化された新しいハイブリッド・リニア・アテンション・アーキテクチャ
キミ・リニアは、ダークサイド・オブ・ザ・ムーンがオープンソース化した新しいハイブリッド・リニア・アテンション・アーキテクチャで、キミ・デルタ・アテンション(KDA)を中核とし、従来のアテンション・モデルをよりきめ細かいゲーティング・メカニズムによって最適化し、ハードウェア効率とメモリ制御能力を大幅に向上させている。
FIBO - 世界初のオープンソースでネイティブにサポートされたJSONテキストから画像モデルを生成
FIBOは、Bria AIによって開発された、ネイティブJSONをサポートする世界初のオープンソーステキスト生成画像モデルです。8Bのパラメータを持つDiT(Diffusion Transformer)アーキテクチャに基づき、フローマッチング学習法を採用しています。
SoulX-Podcast - Soul AI Labのオープンソース会話音声合成モデル
SoulX-Podcastは、高品質のポッドキャストコンテンツを生成するために設計された、Soul AI Labのオープンソースの先進的な複数話者会話音声合成モデルです。SoulX-Podcastは複数ラウンドのダイアログを生成する機能を持ち、実際のポッドキャスティングシナリオでスムーズなダイアログをシミュレートできます。
GigaBrain-0 - 世界モデル生成データによって駆動されるオープンソースの具現化ベースモデル
GigaBrain-0は、実機汎化を実現するために世界のモデル生成データを使用する中国初のエンドツーエンドのVLA(Vision-Language-Action)具現化ベースモデルであり、GigaVisionと湖北ヒューマノイドロボティクスイノベーションセンターが共同でオープンソースとして公開しています。ハイブリッドTransformerアーキテクチャを採用し、...









