Banana Slides - Nano Banana Proモデルに基づいたオープンソースのAI PPT生成ツール
Banana Slidesは、Nano Banana Pro AIモデルに基づいたオープンソースのインテリジェントなPPTジェネレーターです。ユーザーがトピックを一文で説明することができ(例えば「生態系への人間の影響」)、それを自己...
Kaleido - 清華大学等と共同でSmart Spectrum AIがオープンソース化した多被写体リファレンスビデオ生成モデル
Kaleidoは、合肥工業大学、清華大学、Smart Spectrum AIが共同開発したオープンソースの多被写体参照映像生成モデルである。複数の参照画像を通して被写体一貫性のある動画を生成し、多被写体一貫性と背景デカップリングにおける既存モデルの欠陥を解決します。
Paper2Slides - 香港大学のオープンソース学術論文をスライドに変換するAIツール
Paper2Slidesは、香港大学のData Intelligence LaboratoryによるオープンソースのAIツールで、学術論文をワンクリックでプロフェッショナルなスライドやポスターに変換する。RAG (Retrieval Augmented Generation)技術を使用し、ネットワーク情報に依存するのではなく、ドキュメントの内容を直接解析することで、生成されるPPTが元のPPTと高い整合性を持つようにします。
RealVideo - Wisdom Spectrum AIのオープンソース・リアルタイム・ストリーミング映像生成システム
RealVideoは、Smart Spectrum AIが提供するオープンソースのリアルタイム・ストリーミング・ビデオ生成システムで、2~3秒で自然で滑らかなビデオ応答を素早く生成することができる。ユーザーは写真をアップロードしてテキストを入力するだけで、対応する音声と動画を生成し、AIキャラクターとのリアルタイム対話を可能にする。
OpenScreen - Mac と Windows 用のオープンソースのフリーのスクリーン録画ツール。
OpenScreenは、Screen Studioに代わる使いやすく機能的なオープンソースの無料画面録画ツールです。MacとWindowsの両方をサポートし、完全にフリーで、MITプロトコルに従っています。
SCAIL - Wisdom spectrumとTsinghuaのオープンソース映画・テレビキャラクタアニメーション生成フレームワーク
SCAIL(Studio-Grade Character Animation via In-Context Learning)は、Smart Spectrumが清華大学のLiu Yongjin教授のグループと共同で提案した、映画・テレビ用のキャラクターアニメーション生成フレームワークです。このフレームワークを通して...
DeepSearchQA - GoogleのオープンソースAI研究エージェントのテストベンチマーク
DeepSearchQAはGoogleのオープンソースAI研究エージェントテストベンチマークであり、複雑なマルチステップクエリタスクにおける知能のパフォーマンスを評価するために設計されている。17のドメインをカバーする900の手作業で設計された「因果連鎖」タスクで構成され、AIは人間の研究者のように行動し、多段階のクエリを実行する必要があります。
Claude-Mem - クロスセッション永続メモリをサポートするオープンソースクロードコードメモリプラグイン
Claude-MemはClaude Codeのオープンソースプラグインであり、セッション間のAIによる記憶喪失の問題に対処する。ツールによるオブザベーションの使用を自動的にキャプチャし、セマンティックサマリーを生成し、後続のセッションで関連するコンテキストを注入することで、Claudeを支援します...
KoalaQA - Q&Aプラットフォームの迅速な構築を支援するオープンソースのAIアフターサービスシステム
KoalaQAはChaitinチームによって開発されたオープンソースのインテリジェントなアフターサービスシステムです。AIモデルに基づいて、AIカスタマーサービス、AI検索、ナレッジベース管理機能を提供し、企業がインテリジェントQ&Aプラットフォームを迅速に構築できるよう支援します。このシステムは、24時間365日のリアルタイム応答をサポートしています。
VoxCPM 1.5 - Faceted Intelligenceオープンソースエンドツーエンド音声合成モデリング
VoxCPM 1.5は、Facade Intelligence社がリリースしたオープンソースの音声生成モデルで、スプリッターを必要としないテキスト音声合成(TTS)技術をベースに、いくつかの革新的な改良が加えられています。エンド・ツー・エンドの拡散自己回帰アーキテクチャを採用し、テキストから直接連続音声波形を生成することで、従来のセグメンテーション手法の制限を回避...









