AIシェアリングサークル

AIは世界を変えようとしている!
FG-CLIP 2 - 360开源的图文跨模态视觉语言模型

FG-CLIP 2 - 360 オープンソース・クロスモーダルグラフィックス視覚言語モデル

FG-CLIP 2は、360人工知能研究所が発表した世界有数のグラフィカル・クロスモーダル視覚言語モデル(VL-M)であり、29の権威あるベンチマークでGoogleやMetaの類似モデルを上回り、現在最も強力なVL-Mとなっている。
5ヶ月前
027.8K
微舆BettaFish - 开源的多智能体舆情分析系统

Micro Opinion BettaFish - オープンソースマルチインテリジェンス意見分析システム

BettaFishは、オープンソースのマルチインテリジェンス・オピニオン分析システムです。マルチ・インテリジェント・ボディ・アーキテクチャを採用し、クエリ、メディア、インサイト、レポート、その他のエージェントが連携して、検索、抽出、レポートのクローズドループを実現します。このシステムは、AI主導の完全な...
5ヶ月前
060.9K
Ouro - 字节跳动Seed团队开源的新型循环语言模型

Ouro - ByteHopper Seedチームがオープンソース化した新しい循環言語モデル

Ouroは、ByteDance Seedチームによって開発された新しいタイプのループ言語モデル(LLM)であり、パラメータ共有型のリカレント計算構造によって、事前学習段階で推論機能を直接構築するという革新的なコアを持つ。このモデルは、24層を基本ブロックとし、...
5ヶ月前
036.5K
ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

ChronoEdit - NVIDIAとトロント大学がオープンソース化したAI画像編集フレームワーク

NVIDIAとトロント大学が共同開発したオープンソースのAI画像編集フレームワーク「ChronoEdit」は、画像編集タスクを動画生成タスクとして再定義し、編集結果の時間的・物理的整合性を保証する。14Bのパラメータを持つ事前に訓練された動画生成モデルを...
5ヶ月前
031.9K
LongCat-Flash-Omni - 美团开源的全模态大语言模型

LongCat-Flash-Omni - 明潭オープンソースのための完全モード大規模言語モデル

LongCat-Flash-Omniは、MeituanのLongCatチームによってリリースされたオープンソースの完全モーダルビッグ言語モデルです。5,600億のパラメータスケール(270億のアクティブ化されたパラメータ)を持ち、多数のパラメータを維持しながら、ミリ秒レベルのリアルタイムの音声と映像のインタラクション機能を実現している。
5ヶ月前
030K
Petri - Anthropic开源的 AI 安全审计框架

Petri - AnthropicのオープンソースAIセキュリティ監査フレームワーク

Petriは、Anthropic社によって開発されたオープンソースのAIセキュリティ監査フレームワークであり、AIモデルのセキュリティと振る舞いの整合性を体系的に評価する。実世界のシナリオをシミュレートすることで、自動監査人が対象モデルと複数回の対話を行い、その後、判定エージェントがモデルの...
5ヶ月前
026.4K
Kimi Linear - 月之暗面开源的新型混合线性注意力架构

キミ・リニア - 月の裏側でオープンソース化された新しいハイブリッド・リニア・アテンション・アーキテクチャ

キミ・リニアは、ダークサイド・オブ・ザ・ムーンがオープンソース化した新しいハイブリッド・リニア・アテンション・アーキテクチャで、キミ・デルタ・アテンション(KDA)を中核とし、従来のアテンション・モデルをよりきめ細かいゲーティング・メカニズムによって最適化し、ハードウェア効率とメモリ制御能力を大幅に向上させている。
5ヶ月前
038.5K
FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO - 世界初のオープンソースでネイティブにサポートされたJSONテキストから画像モデルを生成

FIBOは、Bria AIによって開発された、ネイティブJSONをサポートする世界初のオープンソーステキスト生成画像モデルです。8Bのパラメータを持つDiT(Diffusion Transformer)アーキテクチャに基づき、フローマッチング学習法を採用しています。
5ヶ月前
030.8K
SoulX-Podcast - Soul AI Lab开源的对话式语音合成模型

SoulX-Podcast - Soul AI Labのオープンソース会話音声合成モデル

SoulX-Podcastは、高品質のポッドキャストコンテンツを生成するために設計された、Soul AI Labのオープンソースの先進的な複数話者会話音声合成モデルです。SoulX-Podcastは複数ラウンドのダイアログを生成する機能を持ち、実際のポッドキャスティングシナリオでスムーズなダイアログをシミュレートできます。
5ヶ月前
039.6K
GigaBrain-0 - 开源的具身基础模型,由世界模型生成数据驱动

GigaBrain-0 - 世界モデル生成データによって駆動されるオープンソースの具現化ベースモデル

GigaBrain-0は、実機汎化を実現するために世界のモデル生成データを使用する中国初のエンドツーエンドのVLA(Vision-Language-Action)具現化ベースモデルであり、GigaVisionと湖北ヒューマノイドロボティクスイノベーションセンターが共同でオープンソースとして公開しています。ハイブリッドTransformerアーキテクチャを採用し、...
5ヶ月前
027.1K