AIシェアリングサークル

AIは世界を変えようとしている!
Step-GUI - 阶跃星辰开源的AI Agent系列模型

Step-GUI - ステップスターオープンソースAIエージェントシリーズモデル

Step-GUIはStep-StarのオープンソースAIエージェントシリーズで、クラウドモデルStep-GUI、GUIエージェントのための最初のMCPプロトコル、携帯電話の展開をサポートする業界初のオープンソースエンドサイドモデルStep-GUI Edgeを含みます。
5ヶ月前
040.9K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - エージェント駆動型ユーザー・インタラクション・インターフェースのためのGoogleのオープンソース宣言型プロトコル

A2UI(Agent-to-User Interface)は、Googleがオープンソースで提供するエージェント駆動型インターフェース・プロトコルであり、AIエージェント向けに複雑な対話型インターフェースを生成する際の課題に対処する。AIエージェントがユーザーインターフェースの構造を記述できるようにする宣言的なJSONフォーマットを通じて、クライアントアプリケーションは、AIエージェントがユーザーインターフェースの構造を記述できるようにします。
5ヶ月前
046.9K
SAM Audio - Meta推出的开源多模态音频分割模型

SAM Audio - オープンソースのマルチモーダル音声セグメンテーションモデル(Metaより

SAMオーディオは、複雑なオーディオミックスから任意のターゲット音を正確に分離する、Meta社のオープンソースのマルチモーダルオーディオセグメンテーションモデルです。テキスト、ビジュアル、時間次元のキューを組み合わせることで、オーディオ編集、ノイズ除去、音抽出、...といったタスクのための柔軟で効率的なオーディオ処理を可能にします。
5ヶ月前
035.8K
混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

Mixed World Model 1.5 - Tencent Mixedオープンソースリアルタイム世界モデル生成フレームワーク

ハイブリッド世界モデル1.5(Tencent HY WorldPlay)は、Tencentがリリースした業界初のオープンソースリアルタイム世界モデルフレームワークであり、データ、トレーニング、ストリーミング推論の展開のフルチェーンをカバーする。コアとなるのはWorldPlay自己回帰拡散モデルで、Next-F...
5ヶ月前
036.7K
Molmo 2 - Ai2开源的多模态视频图像理解模型系列

Molmo 2 - Ai2オープンソース・マルチモーダル動画像理解モデルファミリー

Molmo 2は、Allen Institute for AI (Ai2)によって公開されたオープンソースのマルチモーダルモデルで、ビデオやマルチイメージの理解を向上させる。Molmo 2 (8B)、Molmo 2 (4B)、Molmo 2-O...の3種類があります。
5ヶ月前
041.2K
LongCat-Video-Avatar - 美团开源的虚拟人视频生成模型

LongCat-Video-Avatar - Meituanオープンソースアバタービデオ生成モデル

LongCat-Video-Avatarは、Meituanによってオープンソース化されたLongCat-Videoをベースに構築された先進的な音声駆動型ビデオ生成モデルであり、自然なダイナミクスと一貫したアイデンティティを持つ、超リアルでリップシンクされたロングビデオの生成に焦点を当てている。
5ヶ月前
042.4K
MiMo-V2-Flash - 小米发布的开源MoE架构大模型

MiMo-V2-Flash - シャオミが公開したオープンソースMoEアーキテクチャの大型モデル

MiMo-V2-FlashはXiaomiが発表したオープンソースのMoEアーキテクチャの大型モデルで、総パラメータは3,090億、アクティブパラメータは150億であり、効率的な推論とインテリジェントボディの応用に焦点を当てている。ハイブリッドアテンションアーキテクチャと多言語メタ予測技術を採用し、推論速度は150トークン/秒である。
5ヶ月前
037.7K
Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 - NVIDIAがリリースしたオープンソースのAIモデルファミリー

Nemotron 3は、NVIDIAがNano、Super、UltraサイズでリリースしたオープンソースのAIモデルファミリーです。Nemotron 3は、潜在MoEアーキテクチャを採用し、推論効率を大幅に向上させ、運用コストを削減している。そのうちの1つ...
5ヶ月前
035.5K
Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

Wan-Move - アリ・トンイのオープンソースAI動画生成フレームワーク、清華大学らと共同開発

Wan-Moveは、Ali Tongyi Labsと清華大学などが共同開発したオープンソースのAI動画生成フレームワークで、精密なモーションコントロール技術による高品質な動画合成に焦点を当てている。核心技術は「潜在的軌道誘導」で、既存の画像-動画モデルに点レベルのモーション制御をシームレスに追加することができる。
5ヶ月前
035.5K
PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe - StepStarのオープンソース並列協調AI推論フレームワーク

PaCoRe (Parallel Coordinated Reasoning)は、StepFunのオープンソースの革新的な並列協調推論フレームワークで、超並列思考メカニズムを通じて、複数の視点から同時に問題解決策を探索し、従来の...
5ヶ月前
038.6K