AIシェアリングサークル

AIは世界を変えようとしている！

GLM-ASR - Wisdom Spectrum AIオープンソース高性能音声認識モデルシリーズ

GLM-ASRは、Smart Spectrum AIがオープンソース化した高性能音声認識モデル群で、クラウドベースのモデルGLM-ASR-2512とオープンソースのエンドサイドモデルGLM-ASR-Nano-2512があります。GLM-ASR-2512は、世界をリードするクラウドベースの音声認識モデルで、複数の...

最新のAIリソース

8ヶ月前

054K

OpenAutoGLM - Smart Spectrum AIのオープンソース携帯電話AIエージェントモデル

OpenAutoGLMは、マルチモーダル知覚によって携帯電話画面の内容を理解し、ユーザーが指定したタスクを完了するための操作フローを自動的に生成することができる、「携帯電話使用」の機能を備えたオープンソースの知的身体モデルです。ユーザは、「美団を開いて近くの鍋を検索する」といった自然言語でニーズを記述するだけでよい。

最新のAIリソース

8ヶ月前

046.2K

SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

SurfSense - オープンソースのAI研究・知識管理ツール、NotebookLMの最強ピント

SurfSenseはオープンソースのAIリサーチ・ナレッジマネジメントツールです。高度なカスタマイズが可能で、検索エンジン、Slack、Jira、Notion、YouTube、GitHub、その他多くの外部データソースに接続し、情報の統合を促進することができる。ユーザーは様々なデータをアップロードできる。

最新のAIリソース

8ヶ月前

044.9K

GLM-4.6V - Wisdom Spectrum AI オープンソース多言語ラージ言語モデルシリーズ

GLM-4.6Vは、Smart Spectrum AIによってオープンソース化されたマルチモーダル大規模言語モデルのシリーズです。このシリーズには2つのバージョンがあります：GLM-4.6V (106B-A12B)は、クラウドおよび高性能クラスタシナリオ用の基本バージョンで、Mixed Expert (MoE)アーキテクチャ、合計約1060億参照、および活性化...

最新のAIリソース

8ヶ月前

041.1K

InkSight - GoogleのオープンソースAI手書き文字認識ツール

InkSightはGoogleのオープンソースAI手書き認識ツールで、紙の手書きメモを編集可能なデジタルインクファイル（SVG形式など）に変換します。従来のOCRとは異なり、テキストコンテンツを認識し、手書きスタイル、段落構造、フォーカスマークを復元することができます。

最新のAIリソース

8ヶ月前

040K

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab オープンソース実験的アニメリテラートグラフィカルモデル

NewBie-image-Exp0.1は、NewBieAI-Labチームによってオープンソース化された最初の実験的なアニメテキスト生まれのグラフィックモデルです。このモデルは、デュアルテキストエンコーダー（GEMMA3-4B...

最新のAIリソース

8ヶ月前

041.5K

LongCat-Image - LongCat チーム、アメリカングループのオープンソース画像生成・編集モデル

LongCat-Imageは、MeituanのLongCatチームによってリリースされたオープンソースの画像生成・編集モデルです。ハイブリッドバックボーンアーキテクチャ(MM-DiT+Single-DiT)と視覚言語モデル(VLM)条件付きエンコーダを組み合わせることで、テキスト生成画像と複数ラウンドの画像編集を実現している。

最新のAIリソース

8ヶ月前

037.7K

VibeVoice-Realtime - マイクロソフトのオープンソース軽量リアルタイム音声合成モデル

VibeVoice-Realtimeは、低遅延とリアルタイムインタラクションのために設計されたマイクロソフトのオープンソースの軽量リアルタイム音声合成（TTS）モデルです。ストリーミングテキスト入力をサポートし、最初のテキストトークンから音声入力することができます。

最新のAIリソース

8ヶ月前

037.6K

Flowra - Magic HitchとWooli WULIチームがオープンソース化したAIワークフロー開発ツール

Flowraは、ModelScope共同ウーマイルWULIチームのオープンソースグラフ実行エンジンとノードパッケージ開発ツールであり、FlowBenchのコアコンポーネントです。有向非循環グラフ（DAG）組織ワークフローを通じ、インテリジェントなキャッシュ、並列スケジューリング、分散サポート...

最新のAIリソース

8ヶ月前

037.7K

RoboCOIN - Wisdom Sourceが複数の大学と共同でオープンソース化した双腕ロボットの実ロボットデータセット

RoboCOINは、北京紫源人工知能研究院が多くの企業や大学と共同でオープンソース化した世界初の大規模双腕ロボット実機データセットで、15種類のロボットプラットフォーム、18万件の実動作軌跡、421種類のタスクシナリオが含まれている。最大の特徴は、階層的アノテーションシステムを採用し、タスクを分解...

最新のAIリソース

8ヶ月前

039.1K