AIシェアリングサークル

AIは世界を変えようとしている!
Frappe Builder - 开源的AI低代码网站构建工具,拖拽组件快速搭建

Frappe Builder - オープンソースのAIローコードウェブサイトビルダー。

Frappe Builderは、Frappeによって開発されたオープンソースのローコードウェブサイトビルダーです。中心的な機能は、ウェブサイトを素早く構築するためのドラッグ&ドロップコンポーネントをサポートするFigmaライクなビジュアルエディタを提供することです。Frappeのエコロジー(Frappeverse)の一部です。
6ヶ月前
033.3K
DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR - DeepSeek-OCRモデルに基づくオープンソース・レプリカ・プロジェクト

DeepOCRは、DeepSeek-OCRのコアアーキテクチャを実装したオープンソースの複製プロジェクトであり、光圧縮技術によってテキスト情報を効率的に処理する。コアはDeepEncoderで、SAM-base(高解像度画像の処理)、16×畳み込み圧縮器...で構成されている。
6ヶ月前
029.4K
NocoBase - 免费开源的AI无代码开发平台,可视化构建应用

NocoBase - アプリケーションを視覚的に構築するためのフリーでオープンソースのAIノーコード開発プラットフォーム

NocoBaseは、AI駆動のオープンソースのノーコード開発プラットフォームに基づいており、ビジネスシステムの迅速な構築をサポートし、プログラミングは、アプリケーション開発の構成を介して完了することができます。このプロジェクトは、Apache-2.0プロトコルを使用し、プライベートな展開と柔軟なスケーラビリティを提供し、企業管理、コラボレーションプラットフォームやその他の分野に適しています。
6ヶ月前
030K
UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

UniWorld V2 - RabbitShow Intelligenceと北京大学が発表した新世代の画像編集モデル

UniWorld V2は、RabbitZhan Intelligenceと北京大学のUniWorldチームが共同で発表した新世代の画像編集モデルです。画像編集の分野、特に中国語の理解や複雑なコマンドの実行において大きな優位性を持っている。このモデルは、芸術的な中国語フォントを正確にレンダリングすることができ、細かい...
6ヶ月前
031.9K
SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume - アリババのオープンソースAI履歴書解析・最適化ツール

SmartResumeは、PDF、画像、Office文書から基本情報、学歴、職歴などの構造化された情報を効率的に抽出する、アリババのオープンソースのインテリジェントな履歴書解析・最適化ツールです。OCRテクノロジーとPDFメタデータを統合することで、履歴書や職務経歴書の基本情報や学歴、職歴などの構造化された情報を効率的に抽出します。
7ヶ月前
032.9K
Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX - Step-Star初のオープンソースLLMレベルオーディオ編集ラージモデル

Step-Audio-EditXは、Step-Starチームによって開発されたオープンソースのオーディオ編集マクロモデルで、人工知能技術によるオーディオコンテンツのきめ細かな操作に焦点を当てています。このモデルは、オーディオのムード、話し方(小心者、老人アクセントなど)、パラ言語的要素(笑い、ため息など)を動的に調整することができます。
7ヶ月前
033.5K
Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video - 北京大学がオープンソース化したビデオ推論モデル United Bytes

Open-o3 Videoは、北京大学とByteDanceが共同開発したオープンソースのビデオ推論モデルであり、時間的・空間的証拠によるビデオ推論の強化に焦点を当てている。重要な証拠にタイムスタンプとバウンディングボックスを明示的にラベル付けすることで、モデルが動画コンテンツをより良く理解し解釈するのに役立つ。
7ヶ月前
029.6K
Handy - 开源免费的本地AI语音转文字工具

Handy - オープンソースの無料ネイティブAI音声テキスト変換ツール

Handyは、RustとReactによって開発された、Windows、MacOS、Linuxシステムをサポートするオープンソースで無料のローカル音声テキスト変換ツールです。クラウドにアップロードすることなくローカルで音声データを処理することで、プライバシーとセキュリティを保証し、高速な書き起こしやテキスト入力に適しています。
7ヶ月前
063.2K
FG-CLIP 2 - 360开源的图文跨模态视觉语言模型

FG-CLIP 2 - 360 オープンソース・クロスモーダルグラフィックス視覚言語モデル

FG-CLIP 2は、360人工知能研究所が発表した世界有数のグラフィカル・クロスモーダル視覚言語モデル(VL-M)であり、29の権威あるベンチマークでGoogleやMetaの類似モデルを上回り、現在最も強力なVL-Mとなっている。
7ヶ月前
029.5K
微舆BettaFish - 开源的多智能体舆情分析系统

Micro Opinion BettaFish - オープンソースマルチインテリジェンス意見分析システム

BettaFishは、オープンソースのマルチインテリジェンス・オピニオン分析システムです。マルチ・インテリジェント・ボディ・アーキテクチャを採用し、クエリ、メディア、インサイト、レポート、その他のエージェントが連携して、検索、抽出、レポートのクローズドループを実現します。このシステムは、AI主導の完全な...
7ヶ月前
063.4K