AIシェアリングサークル

AIは世界を変えようとしている！

TalkCody - 複雑なタスクをサポートするフリーでオープンソースのAIプログラミングデスクトップアシスタント

TalkCodyはフリーでオープンソースのAIプログラミングアシスタントデスクトップアプリケーションで、Rust + Tauri 2で構築され、Windows、macOS、Linuxの3つのプラットフォームをサポートし、ネイティブパフォーマンス、高速起動、低リソース使用の利点を備えています。50以上のメインストリームA...

最新のAIリソース

8ヶ月前

043.3K

MemMachine - MemVergeによるオープンソースAIメモリシステム

MemMachineは、MemVerge社によって開発されたオープンソースのAIメモリシステムで、AIモデルや知能のために設計され、人間の脳のように相互作用データを保存して呼び出すことができ、AIの「無状態記憶喪失」の問題を解決する。レイヤー構造（短期記憶、長期記憶、ユーザー画像...）を採用している。

最新のAIリソース

8ヶ月前

043.2K

PartCrafter - NU United Bytes オープンソース単体3D生成モデル

PartCrafterは、北京大学、ByteDance、カーネギーメロン大学が共同で提案した先進的な3D生成モデルです。単一のRGB画像から、複数の意味的に明示的で幾何学的に多様な3Dメッシュパーツを一度に生成することができる。このモデルは、組み合わせ可能なポテンシャル空間を通してモデル化され...

最新のAIリソース

8ヶ月前

040.9K

GigaWorld-0 - GigaVision オープンソース世界モデリングフレームワーク

GigaWorld-0は、国内のEmbodied IntelligenceスタートアップGigaAIのオープンソース世界モデルフレームワークであり、主にEmbodied Intelligence (Embodied AI)分野のデータボトルネック問題を解決するために使用される。高品質で多様かつ物理的にリアルな学習データを効率的に生成し、プッシュ...

最新のAIリソース

8ヶ月前

038K

Mistral 3 - Mistral AI、マルチモーダル大型モデルの最新シリーズをオープンソースでリリース

Mistral 3は、Mistral AIがオープンソースとしてリリースした最新のマルチモーダル大型モデルシリーズで、フラッグシップモデルのMistral Large 3（総パラメータ675B）と、Ministralシリーズの軽量版（3B/8B/14B）があり、いずれも画像理解に対応している。

最新のAIリソース

8ヶ月前

038.6K

Vidi2 - ByteHopのオープンソース・マルチモーダルビデオ理解と大規模モデルの生成

Vidi2は、ByteDanceによってオープンソース化された第2世代のマルチモーダルビデオ理解・生成ビッグモデルであり、ビデオコンテンツの理解、分析、作成に焦点を当てている。テキスト、ビデオ、オーディオモダリティの共同入力をサポートし、画像コンテンツ、音声情報、自然言語コマンドを同時に理解することで、クロスモーダルなインタラクションを実現し、...

最新のAIリソース

8ヶ月前

040.8K

Alpamayo-R1 - NVIDIAのオープンソース推論機能付き視覚言語アクションモデル

Alpamayo-R1は、NVIDIAが開発した推論機能付きVLA（Vision-Language-Action）モデルであり、複雑なシナリオにおける自律走行の意思決定能力を強化するために設計されている。因果連鎖の推論メカニズムを導入することで、シナリオの因果関係（例えば、「前...

最新のAIリソース

8ヶ月前

047.3K

Ovis-Image - Ali AIDC-AIチームによるオープンソース・ベンチャーグラフモデル

Ovis-Imageは、Alibaba International Digital Commerce GroupのAIDC-AIチームによってオープンソース化された70億パラメータのテキスト生成グラフモデルで、高品質のテキストレンダリングに焦点を当てています。Ovis-U1アーキテクチャに基づき、高度なビジュアルデコーダーと双方向トークン精製機能を継承しています。

最新のAIリソース

8ヶ月前

034.8K

Wujie-Emu3.5 - 知恵源研究所オープンソース・マルチモーダル世界ビッグモデル

Wujie-Emu3.5は、北京Zhiyuan人工知能研究所のオープンソースのマルチモーダル世界マクロモデルであり、340億の参照とネイティブの世界モデリング機能を備えています。10兆個のマルチモーダル・トークン（790年分のビデオデータを含む）によって訓練され、物理法則をシミュレートし、グラフィック生成、視覚誘導を実現することができる。

最新のAIリソース

8ヶ月前

040.2K

GELab-Zero - StepsチームによるオープンソースのエンドサイドマルチモーダルGUIエージェントモデル

GELab-Zeroは、Step Leapチームによるオープンソースのエンドサイド・マルチモーダルGUIエージェントモデルで、Qwen3-VL-4B-Instructをベースに4Bパラメータで構築されています。UI要素を認識し、クリックやスライドなどの操作を実行することができ、アプリケーション間のタスク処理をサポートしています。

最新のAIリソース

8ヶ月前

051K