AIシェアリングサークル

AIは世界を変えようとしている!
Ouro - 字节跳动Seed团队开源的新型循环语言模型

Ouro - ByteHopper Seedチームがオープンソース化した新しい循環言語モデル

Ouroは、ByteDance Seedチームによって開発された新しいタイプのループ言語モデル(LLM)であり、パラメータ共有型のリカレント計算構造によって、事前学習段階で推論機能を直接構築するという革新的なコアを持つ。このモデルは、24層を基本ブロックとし、...
7ヶ月前
038.4K
ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

ChronoEdit - NVIDIAとトロント大学がオープンソース化したAI画像編集フレームワーク

NVIDIAとトロント大学が共同開発したオープンソースのAI画像編集フレームワーク「ChronoEdit」は、画像編集タスクを動画生成タスクとして再定義し、編集結果の時間的・物理的整合性を保証する。14Bのパラメータを持つ事前に訓練された動画生成モデルを...
7ヶ月前
033.4K
LongCat-Flash-Omni - 美团开源的全模态大语言模型

LongCat-Flash-Omni - 明潭オープンソースのための完全モード大規模言語モデル

LongCat-Flash-Omniは、MeituanのLongCatチームによってリリースされたオープンソースの完全モーダルビッグ言語モデルです。5,600億のパラメータスケール(270億のアクティブ化されたパラメータ)を持ち、多数のパラメータを維持しながら、ミリ秒レベルのリアルタイムの音声と映像のインタラクション機能を実現している。
7ヶ月前
031.8K
Petri - Anthropic开源的 AI 安全审计框架

Petri - AnthropicのオープンソースAIセキュリティ監査フレームワーク

Petriは、Anthropic社によって開発されたオープンソースのAIセキュリティ監査フレームワークであり、AIモデルのセキュリティと振る舞いの整合性を体系的に評価する。実世界のシナリオをシミュレートすることで、自動監査人が対象モデルと複数回の対話を行い、その後、判定エージェントがモデルの...
7ヶ月前
027.9K
Kimi Linear - 月之暗面开源的新型混合线性注意力架构

キミ・リニア - 月の裏側でオープンソース化された新しいハイブリッド・リニア・アテンション・アーキテクチャ

キミ・リニアは、ダークサイド・オブ・ザ・ムーンがオープンソース化した新しいハイブリッド・リニア・アテンション・アーキテクチャで、キミ・デルタ・アテンション(KDA)を中核とし、従来のアテンション・モデルをよりきめ細かいゲーティング・メカニズムによって最適化し、ハードウェア効率とメモリ制御能力を大幅に向上させている。
7ヶ月前
041K
FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO - 世界初のオープンソースでネイティブにサポートされたJSONテキストから画像モデルを生成

FIBOは、Bria AIによって開発された、ネイティブJSONをサポートする世界初のオープンソーステキスト生成画像モデルです。8Bのパラメータを持つDiT(Diffusion Transformer)アーキテクチャに基づき、フローマッチング学習法を採用しています。
7ヶ月前
032.8K
SoulX-Podcast - Soul AI Lab开源的对话式语音合成模型

SoulX-Podcast - Soul AI Labのオープンソース会話音声合成モデル

SoulX-Podcastは、高品質のポッドキャストコンテンツを生成するために設計された、Soul AI Labのオープンソースの先進的な複数話者会話音声合成モデルです。SoulX-Podcastは複数ラウンドのダイアログを生成する機能を持ち、実際のポッドキャスティングシナリオでスムーズなダイアログをシミュレートできます。
7ヶ月前
042.2K
GigaBrain-0 - 开源的具身基础模型,由世界模型生成数据驱动

GigaBrain-0 - 世界モデル生成データによって駆動されるオープンソースの具現化ベースモデル

GigaBrain-0は、実機汎化を実現するために世界のモデル生成データを使用する中国初のエンドツーエンドのVLA(Vision-Language-Action)具現化ベースモデルであり、GigaVisionと湖北ヒューマノイドロボティクスイノベーションセンターが共同でオープンソースとして公開しています。ハイブリッドTransformerアーキテクチャを採用し、...
7ヶ月前
030.1K
Ming-flash-omni-Preview - 蚂蚁集团开源的全模态大模型

Ming-flash-omni-Preview - Antグループのオープンソースフルモーダルマクロモデル

Ming-flash-omni-Previewは、Ant Group inclusionAIによって公開されたオープンソースのフルモーダル・マクロモデルです。Ling 2.0のスパースMoEアーキテクチャに基づき、パラメータ規模は数千億、総パラメータは103B、アクティブ度は9Bです。
7ヶ月前
034.3K
OmniVinci - NVIDIA开源的全模态大语言模型

オムニヴィンチ - NVIDIAのオープンソース全方位大規模言語モデル

OmniVinciは、NVIDIAによって開発されたオープンソースのフルモーダル大規模言語モデルであり、アーキテクチャの革新とデータの最適化を通じて、マルチモーダルモデルにおけるモーダルの断片化の問題を解決します。視覚と音声のエンベッディングのアライメントは、時間的に埋め込まれたグループキャプチャを利用するOmniAlignNetによって強化されます...
7ヶ月前
033.9K