AIシェアリングサークル

AIは世界を変えようとしている!
OpenAgents - 开源免费的构建AI Agent网络开放协作项目

OpenAgents - AIエージェントネットワーク構築のためのオープンソース・フリー・オープンコラボレーションプロジェクト

OpenAgentsは、AIエージェントのネットワークを構築し、エージェント間のオープンなコラボレーションを促進するオープンソースプロジェクトです。AIエージェントがシームレスに接続し、コラボレーションできるように、基本的なネットワークインフラが提供されています。ユーザーは、独自のエージェントネットワークを迅速に開始し、モジュラーアーキテクチャによって機能を拡張し、...
6ヶ月前
030.7K
Androidify - 谷歌开源如何在Android上构建AI应用的免费资源

Androidify - Google、Android上でAIアプリを構築する方法に関するリソースを無償でオープンソース化

AndroidifyはGoogleのオープンソースプロジェクトであり、開発者がAndroid上でAI主導のアプリケーションを構築する方法を学ぶことを支援する。このプロジェクトでは、Jetpack Compose、Gemini API(via Fire...
6ヶ月前
032K
Ling-1T - 蚂蚁集团开源的万亿参数通用语言模型

Ling-1T - アント・グループのオープンソース万能言語モデル。

Ling-1Tは、アント・グループによってオープンソース化された1兆パラメータユニバーサル言語モデルで、Bering社の大型モデルLing2.0シリーズのフラッグシップ製品に属します。このモデルは、非常に効率的なMoEアーキテクチャを採用し、128Kのコンテキストウィンドウをサポートし、コード生成、数学的推論、論理テストを含む7つのベンチマークでGPTを上回っています。
6ヶ月前
056.6K
聆音EchoCare - 香港科学院开源的超声基座大模型

エコーケア - 香港科学院オープンソース超音波ベース大型モデル

EchoCareは、中国科学院香港創新研究院(CAS)の人工知能・ロボットイノベーションセンター(CAIR)によって開発された超音波ベースの大規模モデルであり、多施設、多地域、多民族、50人以上の個人をカバーする世界最大の超音波画像データセット(450万枚以上)で学習される。
6ヶ月前
033.1K
Code2Video - Show Lab开源的AI教学视频生成框架

Code2Video - Show Lab オープンソースAI教育ビデオ生成フレームワーク

Code2Videoは、コードスニペットを自動的に高品質のビデオコンテンツ(MP4形式)に変換する革新的なオープンソースプロジェクトです。このプロジェクトは、ユニークなコード中心のパラダイムを通して、carbon-now-cliツールを使ってコードを美しい画像に生成します。
6ヶ月前
037.9K
SceneGen - 上海交大开源的单图像生成3D场景框架

SceneGen - 上海交通大学オープンソース3Dシーン生成フレームワーク

SceneGenは、上海交通大学の1枚の画像から3Dシーンを生成するオープンソースの手法であり、1枚のシーン画像とターゲットリソースマスクから、リソースの幾何学的構造、テクスチャ、相対的な空間位置を含む、複数の3Dリソースを含む完全なシーンを効率的に生成する。
6ヶ月前
029.2K
Ming-UniAudio - 蚂蚁开源的统一音频多模态生成模型

Ming-UniAudio - Antオープンソースユニファイドオーディオマルチモーダル生成モデル

Ming-UniAudioは、テキスト、オーディオ、イメージ、ビデオの混合入出力をサポートする、Ant Groupのオープンソース統一オーディオマルチモーダル生成モデルです。マルチスケールトランスフォーマーと混合エキスパート(MoE)アーキテクチャを使用し、モダリティを意識したルーティングメカニズムにより、クロスモーダルな入出力を効率的に処理します。
6ヶ月前
035.6K
AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio - フリーのAIマンガ作成ツール!

AIMangaStudioは、プロット生成、サブシーンデザイン、キャラクター設定などの機能を含む完全なマンガ制作パイプラインをクリエイターに提供し、脚本からマンガページまでの制作プロセスを簡素化できる無料のAIマンガ制作ツールです。プロット、セリフ、キャラクター設定など、マンガ原稿の自然言語生成をサポート。
6ヶ月前
042.4K
FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - Little Red Bookのオープンソース全二重音声対話システム

FireRedChatは、リアルタイムの双方向対話機能と制御された中断をサポートするXiaohongshuのためのオープンソースの全二重音声対話システムです。トランスクリプションコントロールモジュール、インタラクションモジュール、ダイアログマネージャーなどのモジュール設計により、カスケードやセミカスケードアーキテクチャをサポートし、柔軟な展開を実現します。
6ヶ月前
042.6K
Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing - Ali オープンソース文書解析モデル

Logics-Parsingは、Qwen2.5-VL-7Bをベースとした、オープンソースのAliのエンドツーエンドの文書解析モデルです。 強化学習を通じて、文書のレイアウト解析と読み順推論を最適化し、PDF画像を構造化されたHTML出力に変換することができます。
6ヶ月前
041.1K