Lucy Edit - オープンソースのAIビデオ編集ツール、自然言語記述編集
Lucy Editは、Decart AIが開発したオープンソースのAI動画編集ツールです。複雑な微調整やマスクの使用を必要とせず、「キャラクターをシロクマに変える」「シーンを2Dアニメ風にする」といった簡単な自然言語による記述で動画を編集できる。
LongCat-フラッシュ思考 - Meituanオープンソースのための効率的な推論モデル
LongCat-Flash-Thinkingは、LongCat-Flash-Chatのスピードはそのままに、よりパワフルでプロフェッショナルになった、Mission LongCatのLongCatチームによってリリースされた効率的な推論モデルです。このモデルは、論理、数学、コード、知性に基づいています。
クロノス - 清華とマイクロソフトが共同でオープンソースの財務Kチャートベースモデルを開発
クロノスは、清華大学とマイクロソフト・リサーチ・アジアが共同でオープンソース化した、金融市場初の基本的なK線チャートモデルです。株式、暗号通貨、その他の資産の始値、高値、安値、終値、出来高などのK線データを分析することで、将来の値動きを予測することができる。
Wan2.2-Animate - 同義万象のアクション生成モデル オープンソース
Wan2.2-Animateは、Tongyi Wanxiangのオープンソースのアクション生成モデルで、アクションの模倣とロールプレイングの2つのモードをサポートしています。ユーザーはキャラクター画像と参照ビデオを入力するだけで、モデルはビデオキャラクターの動きと表情を画像キャラクターに移行し、画像キャラクターにダイナミックな表情を与えることができます。
InternVLA-A1 - 上海AIラボ、具現化された大型モデルの運用能力をオープンソースで統合
InternVLA-A1は、上海人工知能研究所によってオープンソース化された体現操作の大型モデルである。統合を理解し、想像し、実行する能力を持ち、タスクを正確に完了することができる。このモデルは、実際の操作データとシミュレーションされた操作データを融合し、大規模なバーチャルとリアルのハイブリッドシーン資産を通じて、大規模なマルチモーダルの構築を自動化する。
VoxCPM - Facing Intelligenceと清華オープンソースのエンドツーエンドTTSモデル
VoxCPMはエンド・ツー・エンドの拡散自己回帰アーキテクチャを採用し、テキストから直接連続音声表現を生成することで、従来の離散的な曖昧性解消の限界を打ち破っている。階層的言語モデリングと有限状態量子化を通して...
InternVLA-N1 - 上海AIラボ オープンソース エンドツーエンド デュアルシステムナビゲーション 大型モデル
InternVLA-N1は、上海人工知能研究所によってオープンソース化されたエンドツーエンドのデュアルシステム・ナビゲーション・マクロモデルである。デュアルシステムアーキテクチャを用い、システム2が言語コマンドの理解と長距離経路の計画を担当し、システム1が高周波応答と機敏な障害物回避に重点を置いている。このモデルの学習は、大規模なデジタルデータ処理による合成データに基づいて行われる。
VLAC - 上海AIラボのオープンソース大型報酬体現モデル
VLACは、上海人工知能研究所のオープンソースの具現化報酬マクロモデルです。InternVLマルチモーダル・マクロモデルに基づき、インターネットのビデオデータとロボットの操作データを統合し、実世界におけるロボットの強化学習にプロセス報酬とタスク完了の推定を提供します。
InternVLA-M1 - 上海AIラボのオープンソース・エンベディッド・デュアルシステム・オペレーション "ブレイン"
InternVLA-M1は、上海人工知能研究所のオープンソースの具現化されたオペレーティング「脳」であり、命令追従を指向する2システムオペレーションの大型モデルである。思考-行動-学習」をカバーする完全な閉ループを構築し、高レベルの空間推論とタスク計画を担当する。このモデルは2段階の訓練方針を採用している。
PromptEnhancer - TencentハイブリッドオープンソースAIプロンプト単語拡張ツール
PromptEnhancerは、TencentのMixed Metaチームによるオープンソースのプロンプト語強化ツールで、テキストから画像への変換(Text-to-Image、T2I)モデルの生成を改善します。推論の連鎖(Chain-of-Thought, CoT)アプローチにより、...









