LongCat-Video-Avatar - Meituanオープンソースアバタービデオ生成モデル
LongCat-Video-Avatarは、Meituanによってオープンソース化されたLongCat-Videoをベースに構築された先進的な音声駆動型ビデオ生成モデルであり、自然なダイナミクスと一貫したアイデンティティを持つ、超リアルでリップシンクされたロングビデオの生成に焦点を当てている。
MiMo-V2-Flash - シャオミが公開したオープンソースMoEアーキテクチャの大型モデル
MiMo-V2-FlashはXiaomiが発表したオープンソースのMoEアーキテクチャの大型モデルで、総パラメータは3,090億、アクティブパラメータは150億であり、効率的な推論とインテリジェントボディの応用に焦点を当てている。ハイブリッドアテンションアーキテクチャと多言語メタ予測技術を採用し、推論速度は150トークン/秒である。
Nemotron 3 - NVIDIAがリリースしたオープンソースのAIモデルファミリー
Nemotron 3は、NVIDIAがNano、Super、UltraサイズでリリースしたオープンソースのAIモデルファミリーです。Nemotron 3は、潜在MoEアーキテクチャを採用し、推論効率を大幅に向上させ、運用コストを削減している。そのうちの1つ...
Wan-Move - アリ・トンイのオープンソースAI動画生成フレームワーク、清華大学らと共同開発
Wan-Moveは、Ali Tongyi Labsと清華大学などが共同開発したオープンソースのAI動画生成フレームワークで、精密なモーションコントロール技術による高品質な動画合成に焦点を当てている。核心技術は「潜在的軌道誘導」で、既存の画像-動画モデルに点レベルのモーション制御をシームレスに追加することができる。
PaCoRe - StepStarのオープンソース並列協調AI推論フレームワーク
PaCoRe (Parallel Coordinated Reasoning)は、StepFunのオープンソースの革新的な並列協調推論フレームワークで、超並列思考メカニズムを通じて、複数の視点から同時に問題解決策を探索し、従来の...
Banana Slides - Nano Banana Proモデルに基づいたオープンソースのAI PPT生成ツール
Banana Slidesは、Nano Banana Pro AIモデルに基づいたオープンソースのインテリジェントなPPTジェネレーターです。ユーザーがトピックを一文で説明することができ(例えば「生態系への人間の影響」)、それを自己...
Kaleido - 清華大学等と共同でSmart Spectrum AIがオープンソース化した多被写体リファレンスビデオ生成モデル
Kaleidoは、合肥工業大学、清華大学、Smart Spectrum AIが共同開発したオープンソースの多被写体参照映像生成モデルである。複数の参照画像を通して被写体一貫性のある動画を生成し、多被写体一貫性と背景デカップリングにおける既存モデルの欠陥を解決します。
Paper2Slides - 香港大学のオープンソース学術論文をスライドに変換するAIツール
Paper2Slidesは、香港大学のData Intelligence LaboratoryによるオープンソースのAIツールで、学術論文をワンクリックでプロフェッショナルなスライドやポスターに変換する。RAG (Retrieval Augmented Generation)技術を使用し、ネットワーク情報に依存するのではなく、ドキュメントの内容を直接解析することで、生成されるPPTが元のPPTと高い整合性を持つようにします。
RealVideo - Wisdom Spectrum AIのオープンソース・リアルタイム・ストリーミング映像生成システム
RealVideoは、Smart Spectrum AIが提供するオープンソースのリアルタイム・ストリーミング・ビデオ生成システムで、2~3秒で自然で滑らかなビデオ応答を素早く生成することができる。ユーザーは写真をアップロードしてテキストを入力するだけで、対応する音声と動画を生成し、AIキャラクターとのリアルタイム対話を可能にする。
OpenScreen - Mac と Windows 用のオープンソースのフリーのスクリーン録画ツール。
OpenScreenは、Screen Studioに代わる使いやすく機能的なオープンソースの無料画面録画ツールです。MacとWindowsの両方をサポートし、完全にフリーで、MITプロトコルに従っています。








