UnifoLM-WMA-0 - Yushu Technology オープンソースワールドモデルアクションアーキテクチャ
UnifoLM-WMA-0は、Yu Shu Technologyによる複数のクラスのロボットオントロジーにまたがるオープンソースのワールドモデル-アクションアーキテクチャであり、一般的なロボット学習のために設計されている。ワールドモデルとアクションアーキテクチャから構成され、ワールドモデルはロボットと環境の相互作用の物理法則を理解し、アクションアーキテクチャは特定の...
InfiniteTalk - Mission Vision AI用オープンソース音声駆動ビデオ生成ツール
InfiniteTalkは、MeiGen-AIチームによって開発された音声駆動型の動画生成ツールで、入力された音声に基づいて長さ無制限のトーキング動画を生成する。主な特長は、正確なリップシンク技術で、音声とキャラクターの口の形を完全に一致させ、自然で滑らかな動画を生成します。
ROMA - 並列処理のための複雑なタスクの自動分解のためのオープンソースメタエージェントフレームワーク
ROMA (Recursive-Open-Meta-Agent) は Sentient AGI によって開発されたオープンソースのメタエージェントフレームワークで、再帰的なタスク分解と並列処理によって複雑な問題を効率的に解決します。Python 3.12+、Docker、...をサポートしています。
Lumina-DiMOO - 上海AIラボとHuawei Riseがオープンソース化したマルチモーダル大型モデル
Lumina-DiMOOは、上海人工知能研究所(SAL)が世界人工知能会議2025でファーウェイ・ライズと共同で発表した、マルチモーダル生成・理解のための新世代統一モデルである。Rise AI基本ハードウェア・ソフトウェアプラットフォームとMindSpeed MMマルチモーダル大規模モデルスイートをベースとし、...
Hyprnote - オープンソースのローカルファーストAI会議メモツール
Hyprnoteは、ユーザーのプライバシーを保護し、会議の効率を向上させるために専門家のために設計された、オープンソースのローカルファーストAI会議メモツールです。ローカルファースト」の原則を採用し、データの保存と処理はすべてユーザーのローカルデバイス上で行われるため、データの安全性が確保され、オフラインでの操作もサポートされます。
MobileLLM-R1 - メタ・オープンソース特殊効率推論モデルシリーズ
MobileLLM-R1は、数学的推論、プログラミング推論、科学的推論のために設計されたMetaのオープンソースの効率的推論モデルシリーズです。ベースモデルとファイナルモデルがあり、それぞれ1億4千万、3億6千万、9億5千万のパラメータがあります。このモデルは一般的なチャットモデルではなく、教師ありファインチューニング(SFT...
ERNIE-4.5-21B-A3B-Thinking - Baiduオープンソース推論思考モデル
ERNIE-4.5-21B-A3B-Thinkingは、推論タスクに特化したBaiduのオープンソース大規模言語モデルです。Mixed Expert (MoE) アーキテクチャを採用し、総参照数は210億、各トークンは30億のパラメータを起動し、128K長のコンテキストウィンドウをサポートします。
MobiAgent - 上海交通大学オープンソースモバイルインテリジェントボディフルスタック構築フレームワーク
MobiAgentは、上海交通大学IPADS研究室が開発したオープンソースのモバイルインテリジェントボディツールチェーンで、ユーザーが独自のモバイルインテリジェントアシスタントを構築することを支援する。ユーザーの操作軌跡を記録し、高品質なデータを生成することで、自然言語コマンドを理解できる知的体を育成する。コア機能には、効率的な...
ZipVoice - シャオミのオープンソース音声合成モデル群
ZipVoiceはXiaomiがリリースしたFlow Matchingアーキテクチャに基づく一連の音声合成(TTS)モデルで、ZipVoice(ゼロサンプル単一話者音声合成モデル)とZipVoice-Dialog(ゼロサンプル対話音声合成モデル)がある。
PP-OCRv5 - 百度の次世代テキスト認識用オープンソースAIモデル
PP-OCRv5は、百度がリリースした最新世代のテキスト認識AIモデルである。軽量設計とわずか0.07Bの参照数で、CPUやエッジデバイスでの効率的な動作に適しており、1秒間に370文字以上を処理できる。このモデルは、簡体字中国語、繁体字中国語、英語、日本語、ピンインをサポートしている。









