CWM - メタFAIRオープンソースコード世界言語モデル
CWM(Code World Model)は、Meta FAIRチームによって公開された320億パラメータのオープンソースの世界言語モデルで、コード生成と推論のために設計された。コードの実行過程をシミュレートし、変数の状態変化を予測し、推論を進めることができる「ワールドモデル」の概念を導入している。
Neovate Code - Antオープンソースのインテリジェントプログラミングアシスタント
Neovate Codeは、アントグループのアリペイ・エクスペリエンス・テクノロジー部が開発したオープンソースのインテリジェント・プログラミング・アシスタントで、人工知能技術によって開発効率を向上させる。会話型の開発機能により、開発者は自然言語で要件を記述することができ、Neovate Codeはそれを理解し、対応する世代を生成することができます...
Audio2Face - NVIDIAのオープンソースAI 3Dフェイシャル・アニメーション生成モデル
Audio2Faceは、音声入力をリアルな3Dフェイシャル・アニメーションに変換できるNVIDIAのオープンソースAIツールです。音声に含まれる音素やイントネーションなどの音声特徴を分析することで、正確な唇の同期と微妙な感情表現を生成し、バーチャル・キャラクターに生き生きとした人間の表情を与えます。
Qwen3-VL - AliCloud Tongyi Qianqian オープンソース・マルチモーダル視覚言語マクロモデル
Qwen3-VLは、AliCloud Tongyi Qianqianチームによるオープンソースのマルチモーダル視覚言語ラージモデルで、2,350億の参照と約471GBのモデルファイルを持っています。命令バージョンと思考バージョンを含み、強化されたMRopeインターリーブレイアウト、DeepStackなどの技術を採用し、視覚変換を効果的に使用することができます...
Qwen3Guard - Ali Qwenオープンソースセキュリティモデル
Qwen3Guardは、Qwen3の基本モデルに基づき、セキュリティ検出のために設計された、きめ細かいセキュリティ保護モデルです。Qwen3Guardは、2つのプロ...
Lucy Edit - オープンソースのAIビデオ編集ツール、自然言語記述編集
Lucy Editは、Decart AIが開発したオープンソースのAI動画編集ツールです。複雑な微調整やマスクの使用を必要とせず、「キャラクターをシロクマに変える」「シーンを2Dアニメ風にする」といった簡単な自然言語による記述で動画を編集できる。
LongCat-フラッシュ思考 - Meituanオープンソースのための効率的な推論モデル
LongCat-Flash-Thinkingは、LongCat-Flash-Chatのスピードはそのままに、よりパワフルでプロフェッショナルになった、Mission LongCatのLongCatチームによってリリースされた効率的な推論モデルです。このモデルは、論理、数学、コード、知性に基づいています。
クロノス - 清華とマイクロソフトが共同でオープンソースの財務Kチャートベースモデルを開発
クロノスは、清華大学とマイクロソフト・リサーチ・アジアが共同でオープンソース化した、金融市場初の基本的なK線チャートモデルです。株式、暗号通貨、その他の資産の始値、高値、安値、終値、出来高などのK線データを分析することで、将来の値動きを予測することができる。
Wan2.2-Animate - 同義万象のアクション生成モデル オープンソース
Wan2.2-Animateは、Tongyi Wanxiangのオープンソースのアクション生成モデルで、アクションの模倣とロールプレイングの2つのモードをサポートしています。ユーザーはキャラクター画像と参照ビデオを入力するだけで、モデルはビデオキャラクターの動きと表情を画像キャラクターに移行し、画像キャラクターにダイナミックな表情を与えることができます。
InternVLA-A1 - 上海AIラボ、具現化された大型モデルの運用能力をオープンソースで統合
InternVLA-A1は、上海人工知能研究所によってオープンソース化された体現操作の大型モデルである。統合を理解し、想像し、実行する能力を持ち、タスクを正確に完了することができる。このモデルは、実際の操作データとシミュレーションされた操作データを融合し、大規模なバーチャルとリアルのハイブリッドシーン資産を通じて、大規模なマルチモーダルの構築を自動化する。