AIオープンソースプロジェクト

合計1020記事
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: AIエージェントのためのオープンソースワークフロービルダー

包括的な紹介 Sim Studioは、軽量で直感的なビジュアルインターフェースを通じて、大規模言語モデル(LLM)ワークフローの迅速な設計、テスト、およびデプロイを支援することに重点を置いた、オープンソースのAIエージェントワークフロー構築プラットフォームです。ドラッグ&ドロップで複雑なワークフローを作成できます。
8ヶ月前
068K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: 複数のデータベースでスマートテーブルを作成、オープンソースのAirtable代替ツール

一般的な紹介 NocoDBは、強力で使いやすいオンラインデータベース管理ツールを提供するために設計されたオープンソースのAirtableの代替です。NocoDB を使えば、ユーザーはコードを書くことなく、簡単にデータベースからデータを作成、読み込み、更新、削除することができます。このプラットフォームは、...
1年前
067.9K
Vexa:实时会议转录与智能知识提取工具

Vexa:リアルタイム会議記録・インテリジェント知識抽出ツール

包括的な紹介 Vexaはオープンソースのリアルタイム会議記録および知識管理プラットフォームで、効率的な会議記録とインテリジェントな知識抽出サービスを企業や個人に提供するように設計されています。API駆動の会議ロボットにより、Google MeetやZoomなどのプラットフォームに自動的に参加します。
9ヶ月前
067.7K
Eino:字节跳动开源的Golang大模型应用开发框架

Eino: ByteDanceのオープンソースGolangビッグモデル・アプリケーション開発フレームワーク

概論 EinoはCloudWeGoチームによるGolangベースのオープンソース・フレームワークで、大規模モデル(LLM)アプリケーションの究極の開発ツールとなるように設計されている。LangChainやLlamaIndexなどのオープンソースフレームワークを利用しています。
10ヶ月前
067K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS:自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成(TTS)システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。
9ヶ月前
066.8K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter:wechat公開番号記事一括エクスポートツールのワンクリックデプロイメント

包括的な紹介 wechat-article-exporterは、ユーザーがWeChatの公開番号の記事を一括エクスポートするために設計されたオープンソースのツールです。このツールは、環境を構築することなく、記事に埋め込まれたオーディオとビデオのエクスポートをサポートし、100%は、記事のスタイルを復元することができ、プライベート部分をサポートしています...
1年前
066.8K
OpenAI.fm:展示OpenAI语音API的交互式演示工具

OpenAI.fm:OpenAIの音声APIを紹介するインタラクティブなデモツール

概論 openai-fmはGitHubでホストされているオープンソースプロジェクトで、OpenAIのText-to-Speech (TTS) APIの機能をデモンストレーションすることを目的としています。このプロジェクトは、インタラクティブなウェブアプリケーションを通して動作します...
9ヶ月前
066.8K
OpenManus:MetaGPT推出的开源版Manus

OpenManus: MetaGPTによるManusのオープンソース版

一般的な紹介 OpenManusは、ユーザーが簡単な設定でローカルにインテリジェンスを実行し、様々な創造的なアイデアを実現できるように設計されたオープンソースプロジェクトです。MetaGPTコミュニティメンバーの@mannaandpoem、@XiangJinyu、@Mos...によって開発されました。
10ヶ月前
066.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: 自然言語でコンピュータを制御するDesktop Intelligentsiaアプリケーション

概論 UI-TARS Desktopは、ByteDance社が開発したUI-TARS(Visual Language Model)に基づいたグラフィカルインターフェースエージェントアプリケーションです。UI-TARSデスクトップは、ByteDance社が開発したUI-TARS(Visual Language Model)をベースとしたグラフィカルインターフェースエージェントアプリケーションです。
12ヶ月前
066.6K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: オープンソースの無料コミックスダウンローダー、PDF, EPUB, CBR, CBZ形式のコミックスをダウンロード可能

一般的な紹介 Comics Downloaderは、ユーザーが様々なウェブサイトからコミックやコミックをダウンロードできるように設計されたオープンソースツールです。このツールは、PDF、EPUB、CBR、CBZを含む様々なファイル形式をサポートしており、ユーザーは自分のニーズに合わせて選択することができます。
1年前
066.6K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展

Plate: 豊富なプラグイン拡張機能をサポートしたAI駆動型リッチテキストエディタ

概要 PlateはReactとTypeScriptで構築されたAI搭載のリッチテキストエディタで、高度にカスタマイズ可能で拡張性の高い編集体験を提供するように設計されています。Slate.jsをコアに利用し、モダンなUIと組み合わせている。
1年前
066.5K
WeChatFerry:功能全面的微信机器人开发框架

WeChatFerry:WeChatロボット開発のための完全機能フレームワーク

包括的な紹介 WeChatFerryは、オープンソースのWeChatロボットの基礎となるフレームワークであり、GitHub上の開発者lich0821によって作成され、維持されています。このプロジェクトは、WeChat Hook技術を通じて、一連の強力なSDKを提供し、開発者がWeChat ...
10ヶ月前
066.3K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: ChatGPTインターフェイスを模倣したAI対話オープンソースプロジェクト

概要 LibreChat は、カスタマイズオプションが豊富で、複数のAIプロバイダー、サービス、統合をサポートする、無料のオープンソースAIチャットプラットフォームです。使い慣れたインターフェースと革新的な機能を備え、複数のAIモデル、プラグイン、多言語をサポートすることで、すべてのAI会話を一つの場所に集約します。バイ...
1年前
066.2K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...
1年前
066K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: 深い文書理解に基づくオープンソースのRAGエンジンで、効率的な検索強化生成ワークフローを提供します。

包括的な紹介 RAGFlowは、深い文書理解技術に基づいたオープンソースのRAG(Retrieval Augmented Generation)エンジンです。RAGFlowは、あらゆる規模の企業向けに効率的なRAGワークフローを提供し、実際の文書に基づいた複雑な形式のデータを提供できる大規模言語モデル(LLM)を組み込んでいます。
12ヶ月前
065.7K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse:LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

概要 LangfuseはオープンソースのLLM(大規模言語モデル)エンジニアリングプラットフォームです。LLMアプリケーションのトレース、デバッグ、最適化を支援し、呼び出しの観察、キューワードの管理、実験の実行、結果の評価を行うツールを提供します。このプラットフォームは、Langfuseチームによって開発されています。
10ヶ月前
065.6K
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP:マイクロソフトのブラウザ自動化MCPサービス

一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールである。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御できるようにする。
10ヶ月前
065.4K
Nanobrowser:浏览器中实现任务自动化的多智能插件

ナノブラウザ:ブラウザのタスク自動化のためのマルチインテリジェンス・プラグイン

概要 NanobrowserはオープンソースのChrome拡張機能で、AI主導のマルチエージェントシステムによってウェブタスクを自動化するように設計されています。OpenAI Operatorに代わる無償の拡張機能で、ユーザーはLLMを提供するだけです。
10ヶ月前
065.1K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: テキストと画像からSVGベクターグラフィックスを生成するオープンソースプロジェクト

概論 OmniSVGは、マルチモーダルモデルによる高品質なベクターグラフィックス(SVG)の生成に特化したオープンソースプロジェクトである。事前に訓練された視覚言語モデルを使用して、テキスト記述や画像入力からのSVG生成をサポートし、単純なアイコンから複雑なアニメキャラクターまで幅広いシナリオをカバーします。アイテム ...
9ヶ月前
064.9K
RF-DETR:实时视觉对象检测开源模型

RF-DETR:リアルタイム視覚物体検出のためのオープンソースモデル

包括的な紹介 RF-DETRはRoboflowチームによって開発されたオープンソースの物体検出モデルです。RF-DETRはTransformerアーキテクチャをベースにしており、リアルタイム性を特徴としています。このモデルはMicrosoft COCOデータセット上で初めて60APs以上のリアルタイム性を達成した。
10ヶ月前
064.7K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: GeminiモデルAPIはOpenAIフォーマットと互換性があり、リージョン制限を解除し、マルチAPIキーポーリングをサポートする。

包括的な紹介 Gemini Balanceは、FastAPIフレームワークに基づいて開発されたOpenAI APIプロキシサービスで、効率的なマルチAPI Key管理と最適化機能を提供することを目的としている。このプロジェクトはGeminiモデルコールをサポートしており、主な機能にはマルチAPI...
9ヶ月前
064.6K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: テンセントのオープンソース高解像度3Dモデル生成ツール

概論 Hunyuan3D-2はTencentによって開発されたオープンソースプロジェクトで、テキストや画像から高解像度の3Dモデルを生成する。形状生成モデル(Hunyuan3D-DiT)とテクスチャ生成モデル(Hunyuan3D...)の2つのコアコンポーネントで構成されています。
10ヶ月前
064.2K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker:デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

概論 Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出す。このシステムは、Whisper、Linly、Micros...といった様々な技術を統合しています。
11ヶ月前
064.2K
Prompt Optimizer:优化主流AI模型提示词的开源工具

プロンプト・オプティマイザー:主流AIモデルのプロンプト語を最適化するオープンソースツール

概論 Prompt Optimizerは、GitHubのlinshenkxによって開発された、プロンプト単語の最適化に焦点を当てたオープンソースツールです。インテリジェントなアルゴリズムによってAIモデルのプロンプトワードを最適化し、生成されるコンテンツの品質を向上させます。
11ヶ月前
063.5K
Meeting:本地实时转录和生成会议纪要的开源客户端

ミーティング:オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes(別名Meetily)は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...
10ヶ月前
063.5K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

概論 RealtimeSTTは、高度な音声アクティビティ検出とウェイクワードアクティベーションを備えた、効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。
12ヶ月前
063.4K
Ragas:评估RAG召回QA准确率与答案相关性

ラガス:RAGリコールQA精度と回答の相関性を評価する

包括的な紹介 Ragasは、RAG(Retrieval Augmented Generation)システムの評価と最適化のために特別に設計されたツールです。Ragasは、クエリ、検索コンテキスト、生成された回答間の関係を分析することで、包括的な評価メトリクスのセットを提供します。これらのメトリクスには、忠実度、回答の関連性、コンテキストの関連性、...
12ヶ月前
063.3K
OpenSPG:开源知识图谱引擎

OpenSPG: オープンソース知識グラフエンジン

包括的な紹介 OpenSPGは、SPG (Semantic Augmented Programmable Graph)フレームワークに基づいて、Ant GroupがOpenKGと共同で開発したオープンソースの知識グラフエンジンです。このエンジンは、ドメイン知識グラフの構築と管理をサポートするために、 明示的な意味表現、論理ルール定義、運用フレームワークなどの機能を提供するように設計されています...
1年前
063.3K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得ることを支援するために特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語をサポートします。
1年前
063.2K
Reader API:网页内容提取工具,HTML转换为Markdown格式

Reader API: ウェブコンテンツ抽出ツール、HTMLからMarkdownへの変換

一般的な紹介 Jina AIのReaderプロジェクトは、https://r.jina.ai/转换成适合大型语言模型(Large Languag...)という接頭辞を付加することで、任意のURLを受け取るオープンソースツール(Readerオープンソースアドレス)です。
1年前
063.2K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI:リージョン制限を回避し、OpenAI互換APIに変換する逆世代Geminiアドレス

一般的な紹介 Gemini OpenAI API Agentは、無料でサーバーのメンテナンスが不要なOpenAI準拠のエンドポイントです。ユーザは、Vercel、Netlify、Cloudflareなどのプラットフォームに、個人で簡単にデプロイすることができます。プロジェクト ...
1年前
063.1K
Agno:构建具备记忆、知识和工具的多模态智能体框架

アグノ:記憶、知識、ツールを備えたマルチモーダルインテリジェンス構築のためのフレームワーク

一般的な紹介 Agnoは、agno-agiチームによって開発され、GitHubでホストされているオープンソースのPythonライブラリで、開発者が記憶、知識、ツールを備えたAIインテリジェンスを簡単に構築できるようにすることに専念しています。マルチモーダルなテキスト、画像、音声、動画をサポートしています。
10ヶ月前
063K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk:完全なデジタルヒューマンビデオ生成フレームワーク|ポートレートからビデオへ|ポーズからビデオへ|リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。
1年前
062.8K
Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

包括的な紹介 Smolagentsは、HuggingFaceによって開発された軽量インテリジェントエージェントライブラリで、AIエージェントシステムの開発プロセスを簡素化することに重点を置いています。このプロジェクトは、約1000行のコアコードしかないシンプルな設計思想で知られていますが、強力な機能統合機能を提供しています。このライブラリの最も ...
1年前
062.4K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: Android用リアルタイム音声翻訳アプリ!

一般的な紹介 RTranslatorは、Androidデバイスのために設計された事実上オープンソース、無料のオフラインリアルタイム翻訳アプリです。ユーザーはBluetoothヘッドセットを接続することで、携帯電話をポケットに入れたまま、まるで自分の国の言葉を話しているかのように他の人と会話をすることができます。
1年前
062.3K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: AIインテリジェンスがウェブをブラウズするためのオープンソースフレームワーク。

概要 ブラウザユースWeb UIは、AIエージェントにグラフィカルインターフェースツールとしてブラウザインタラクション機能を提供することに焦点を当てた革新的なオープンソースプロジェクトです。このプロジェクトは、ブラウザユースコアフレームワークの上に構築されており、Gradio ...
7ヶ月前
062.2K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI:LLMなしで構造化データを抽出するオープンソースの非同期ウェブクローラツール

包括的な紹介 Crawl4AIは、大規模言語モデル(LLM)と人工知能(AI)アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマットを提供します。
1年前
062.1K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。
1年前
062.1K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。
11ヶ月前
061.9K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB:スマートなカスタマーサービスと社内ナレッジベースのための、すぐに使えるAIナレッジベースQ&Aシステム

包括的な紹介 MaxKB (Max Knowledge Base) は、大規模言語モデルとRAG (Retrieval Augmented Generation) に基づいたオープンソースの知識ベースQ&Aシステムです。このシステムは、インテリジェントな顧客サービス、企業の内部知識ベース、学術研究および教育やその他のシナリオで広く使用されています。
12ヶ月前
061.8K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: 長期記憶に基づくマルチホップ知識検索フレームワーク

概論 HippoRAGはオハイオ州立大学のOSU-NLPグループによって開発されたオープンソースのフレームワークで、人間の長期記憶メカニズムにヒントを得ている。検索拡張生成(RAG)、ナレッジグラフ、パーソナライズドPageRankのテクニックを組み合わせ、大規模な言語モデル...
10ヶ月前
061.8K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing:インテリジェントビデオ多言語AI吹替/翻訳ツール

包括的な紹介 Linly-Dubbingはインテリジェントな多言語AIダビングと翻訳ツールで、高度なAI技術を統合することにより、ユーザーに高品質の多言語ビデオダビングと字幕翻訳サービスを提供するように設計されています。このツールは、特に国際教育、グローバルコンテンツのローカリゼーションやその他のシナリオに適しており、...
12ヶ月前
061.8K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js:AIでブラウザ自動テストを推進するオープンソース・プラグイン

概論 Midscene.jsはAIを搭載したブラウザ自動化ツールで、自然言語コマンドによってウェブページを制御し、アサーションを実行し、データを抽出します。Chrome拡張機能、JavaScript SDK、YAMLスクリプトをサポートし、UI測定を簡素化します。
12ヶ月前
061.7K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: AI生成PPT、プレゼンテーション生成

総合紹介 AiPPTは人工知能技術に基づいたPPT生成ツールで、プロフェッショナルなプレゼンテーションを素早く作成できるように設計されています。テーマを入力したり、ファイルをアップロードしたり、URLを提供したりすることで、内容が豊富で美しくデザインされたスライドを自動的に生成します。
11ヶ月前
061.5K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: VSCodeに統合されたネイティブなセルフホストAIプログラミングアシスタント

一般的な紹介 TabbyはTabbyMLチームによって開発されたオープンソースのAIプログラミングアシスタントで、ユーザーはローカルまたはサーバー上に自分でデプロイすることができます。コードの自動補完やスマートQ&Aなど、GitHub Copilotのような機能を提供していますが、最大の特徴は...
9ヶ月前
061.2K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion:シャオミのオープンソースのエンド・ツー・エンドの自動運転推論・計画フレームワーク

包括的な紹介 OrionはXiaomi Labsによって開発されたオープンソースプロジェクトで、エンドツーエンド(E2E)自律走行技術に焦点を当てています。Orionは、視覚言語モデリング(VLM)と生成プランナーによって、従来の自律走行手法の複雑なシナリオにおける因果推論が不十分であるという問題を解決する。
9ヶ月前
061K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: ダイナミックな知識グラフの構築とクエリーツール(時間を考慮したロングメモリプログラム)

一般的な紹介 Graphitiは、getzep社によって開発された、動的で時間を意識した知識グラフの構築とクエリのためのツールです。エンティティ間の複雑で発展的な関係を表現し、時系列、全文、セマンティック、グラフアルゴリズムなど様々な手法でクエリすることができる。
11ヶ月前
061K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat:大規模モデルに基づいて構築されたインテリジェント対話ロボット。

総合的な紹介 ChatGPT-on-WeChatプロジェクトは、大きなモデルベースのインテリジェント対話ロボットであり、個人WeChat、WeChatパブリック番号、企業WeChatアプリケーション、Flybook、Nailなどのマルチプラットフォームへのアクセスをサポートしています。ユーザーはGPT3.5、GPT-4、Claude、Man...
1年前
060.9K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt:ユニバーサルビデオダウンローダー、YouTube、Vimeo、Twitter、Reddit、SoundCloudなど!

Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するために設計されたオープンソースのメディアダウンローダーです。Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するように設計されたオープンソースのメディアダウンローダです。
1年前
060.8K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow:Rooコード拡張に基づくメモリ拡張システム

包括的な紹介 RooFlowはオープンソースのAI支援プログラミングツールであり、プロジェクトのロギングを通じて開発中のコード、決定、タスクの進捗を保存するコア機能を備えています。Roo Codeエクステンションをベースに、アーキテクチャ、コーディング、テスト、デバッグ、Q&Aの5つのモードを統合しています。これらのモードは相互に...
9ヶ月前
060.7K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: ワンクリックで翻訳とダビングができる動画用多言語グローバル化ツール

包括的な紹介 KrillinAIは、ユーザーがビデオを翻訳し、自動的にそれらをダビングするために人工知能を使用することに焦点を当てたオープンソースのビデオ処理ツールです。ビデオのダウンロードから始まり、様々なプラットフォームに適応した完成品の生成まで、全てのプロセスは数クリックで完了します。開発者はGitHubで公開されている。
7ヶ月前
060.6K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1:民生用GPUで高画質ビデオを生成する

概要 Wan2.1は、Wan-Videoチームによって開発され、GitHubでオープンソース化されたビデオ生成ツール群で、人工知能技術によってビデオ作成の限界を押し広げることに焦点を当てています。Wan2.1は、高度な拡散変換アーキテクチャに基づいており、独自の時間変化する自己...
11ヶ月前
060.5K
Qlib:微软开发的AI量化投资研究工具

Qlib:マイクロソフトが開発したAI定量投資調査ツール

Qlibはマイクロソフトが開発したオープンソースのプラットフォームであり、AI技術を活用してクオンツ投資のリサーチを支援することに主眼を置いている。Qlibは、最も基本的なデータ処理からスタートし、ユーザーが投資アイデアを探求し、使える戦略に変えることをサポートする。このプラットフォームはシンプルで使いやすく、機械学習を使って投資リサーチを改善したい人に適している。
10ヶ月前
060.4K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: ローカルAI環境を素早く構築するためのオープンソーステンプレート

包括的な紹介 n8nセルフホストAIスターターキットは、包括的なローカルAIとローコード開発環境を素早く初期化するために設計されたオープンソースのDocker Composeテンプレートです。n8nチームによって作られたこのスイートは、セルフホスト型のn8nプラットフォームと、互換性のある様々なAI...
11ヶ月前
060.2K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent:モバイル機器操作アシスタントのためのマルチエージェント・コラボレーション

一般的な紹介 MobileAgentは、マルチエージェントコラボレーションと強化された視覚認識モジュールにより、モバイルデバイス操作の効率と自動化を改善するために設計された強力なモバイルデバイス操作アシスタントです。X-PLUGチームによって開発され、Androidと...
12ヶ月前
060K
Moffee:将Markdown转为PPT幻灯片

Moffee:マークダウンをPPTスライドショーに変換する

一般的な紹介 Moffeeは、Markdownファイルを素早く、簡単かつ効率的にプロフェッショナルなスライドショーに変換するオープンソースツールです。ユーザはMarkdownコンテンツを書くだけで、Moffeeはレイアウト、ページ分割、スタイルを自動的に処理し、手作業でタイプセットする必要がなくなります。
10ヶ月前
060K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。
11ヶ月前
060K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote:動画からMarkdownノートを自動生成するAIツール

包括的な紹介 BiliNoteは、オープンソースのAIビデオノートツールです。BiliNoteとYouTubeのビデオリンクからコンテンツを抽出し、Markdown形式で明確に構造化されたノートを自動的に生成します。ネイティブの音声トランスクリプションと様々な大規模モデル(例: ...
9ヶ月前
059.9K
E2B:安全云沙箱中的AI代码运行平台

E2B: 安全なクラウドサンドボックスでAIコードを実行するプラットフォーム

概要 E2Bは、AIが生成したコードを安全なクラウドサンドボックスで実行するために設計されたオープンソースプラットフォームです。幅広いプログラミング言語とフレームワークをサポートし、コード実行のセキュリティと信頼性を確保するために隔離された仮想環境を提供します。E2Bは、データ分割を含む様々なAIアプリケーションシナリオに適しています。
1年前
059.9K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix:大規模モデル検索用にコードベースをテキストファイルにパッケージ化

概論 Repomix(以前はRepopackとして知られていた)は、コードベース全体を単一のAIフレンドリーなファイルにパッケージ化するために設計されたオープンソースツールです。このツールにより、開発者は自分のコードベースを大規模な言語モデル(ClaudeやChat...
12ヶ月前
059.7K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee:知識グラフベースのRAG構築のためのオープンソースフレームワーク、コアプロンプト学習

概要 CogneeはAIアプリケーションとAIエージェントのために設計された信頼性の高いデータレイヤーソリューションです。LLM(大規模言語モデル)コンテキストのロードと構築を行い、ナレッジグラフとベクトルストアを通じて正確で解釈可能なAIソリューションを作成するように設計されています。このフレームワークは、コスト削減、解釈可能な...
12ヶ月前
059.7K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: PPTプレゼンテーション、ドキュメントからPPTへの自動生成と評価

概要 PPTAgentは、ドキュメントからプレゼンテーションを自動生成する革新的なシステムです。このシステムは、プレゼンテーションの作成における人間のアプローチを取り入れ、コンテンツの品質と視覚的なインパクトを確保するための2段階のプロセスを採用しています。さらに、PPTAgentはPPTEvalを導入しています。
12ヶ月前
059.7K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: AIチャットと描画のためのSpringBootベースのバックエンドフレームワーク

包括的な紹介 RuoYi AIはruoyi-plusフレームワークに基づいて、AIチャットと絵画機能の統合に焦点を当てたバックエンドプロジェクトです。Java17とSpringBoot 3.X技術スタックを使用し、完全にオープンソースで無料です。
11ヶ月前
059.6K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: RMBG 2.0 用に最適化された、画像やビデオの背景を一括除去するオープンソースプログラム。

概論 RMBG-2-Studioは、BRIA-RMBG-2.0モデルに基づいて開発された、背景の除去および置換を行う拡張アプリケーションです。このアプリケーションは、電子商取引、ゲーム、...を含む様々なタイプの画像に対して、効率的で正確な画像背景処理機能をユーザーに提供するように設計されています。
1年前
059.6K
Onyx:连接企业知识库的智能AI聊天平台

Onyx:企業の知識ベースをつなぐインテリジェントなAIチャットプラットフォーム

一般的な紹介 Onyx(旧称Danswer)は、onyx-dot-appチームによって開発されたオープンソースのAIチャットプラットフォームで、ドキュメント、アプリケーション、従業員データの統合と管理を支援します。あらゆる大規模言語モデル(LLM: Large Language Model)の接続をサポートし、豊富なチャット機能を提供します。
10ヶ月前
059.3K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AIヘッジファンド:複雑なヘッジファンド取引の意思決定に複数の知性を利用するオープンソースの自動取引システム

一般的な紹介 AIヘッジファンドは、マルチ・エージェント・システムを利用して取引の意思決定を行う人工知能ヘッジファンドである。このシステムは、マーケット・データ・エージェント、クオンツ・エージェント、リスク管理エージェント、ポートフォリオ管理エージェントなど、複数の専門エージェントと連携し、複雑な取引を実現する。
12ヶ月前
059.1K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense:コンピュータビジョンプロジェクトの効率を高める、無料で使える画像注釈ツール

概要 Make Senseは、コンピュータ・ビジョン・プロジェクト用のデータセットを素早く準備できるように設計された、無料のオンライン画像注釈ツールです。複雑なインストールは不要で、ブラウザからアクセスするだけで使用でき、複数のオペレーティングシステムをサポートし、小規模なディープラーニングプロジェクトに最適です。ユーザーは...
11ヶ月前
059.1K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: 実験的音声合成モデル、純粋な言語モデリングアプローチで実装されたTTS

包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成(TTS)モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルは、LLaMaアーキテクチャに基づいています。
11ヶ月前
058.9K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio:マルチエージェントシステムAutoGenの使いやすいインターフェイス版

概要 AutoGen Studio 2.0は、マルチエージェント・ソリューションの作成と管理のプロセスを簡素化するために設計されたAutoGenによるユーザー・インターフェースです。このプラットフォームでは、直感的なインターフェースを通じて、エージェントとそのワークフローを宣言的に定義および変更することができます...
12ヶ月前
058.7K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

ディープライブカム:オープンソースのリアルタイムAI顔交換ツール、リアルタイムでライブ顔交換するための写真

概要 Deep Live Camは、1枚の写真からリアルタイムで顔を置き換え、フェイクビデオを生成できるように設計されたオープンソースの人工知能ツールです。高度なディープラーニングアルゴリズムを使用することで、ライブストリーミングやビデオ通話中にリアルタイムで顔を入れ替えることができ、ユーザーのプライバシーを保護し、楽しさを追加します。
1年前
058.5K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: オープンソースツールの音声ポッドキャストを生成するローカルPDF

概要 Local-NotebookLMはオープンソースプロジェクトで、ローカルで動作するインテリジェントな文書処理とコンテンツ生成ツールを提供することを目的としています。Google NotebookLMにインスパイアされ、ユーザーがPDFやその他のドキュメントを様々な...
10ヶ月前
058.5K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: Dify APIをベースとしたデスクトップインテリジェントダイアログクライアントで、エンタープライズグレードのAIダイアログ機能を提供します。

包括的な紹介 Dify-WebUIは、Dify APIに基づいた最新のデスクトップインテリジェント対話アプリケーションで、企業に強力なAI対話機能を提供するように設計されています。このアプリケーションは、企業の個々のニーズを満たすために、様々なプリセットテーマカラーをサポートし、ナレッジベース管理機能をサポートします。
1年前
058.3K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換

概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。
1年前
058.2K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

概要 LiteAvatarはHumanAIGCチーム(Aliの一部)によって開発されたオープンソースツールで、音声によって駆動される2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム(fps)で動作し、特に...
11ヶ月前
058.1K
Abogen:将多种文本格式转换为有声读物的工具

Abogen:複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...
8ヶ月前
058K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS:画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。
1年前
057.9K
Motia:用代码快速构建智能体的开发框架

Motia: コードでインテリジェンスを迅速に構築するための開発フレームワーク

一般的な紹介 Motiaは、GitHubでホストされ、MotiaDevチームによって開発された、ソフトウェアエンジニアのためのオープンソースのAIエージェントフレームワークです。開発者は使い慣れたプログラミング言語(例:Python、TypeScript、Rub...
10ヶ月前
057.7K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot:テキスト記述生成のためのAIアシスタント ComfyUIワークフロー

包括的な紹介 ComfyUI-Copilotは、ComfyUIフレームワークのために設計されたAI駆動のカスタムノードで、自然言語対話を通じてAIアルゴリズムのデバッグとデプロイの効率を向上させることを目的としています。AIDC-AIチーム(Alibaba)によって開発され、GitHu...
11ヶ月前
057.7K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock:AI対応株式分析ツール、自分で選んだ株価のリアルタイム監視とAIに基づく詳細分析

総合紹介 go-stockはWailsとNaiveUIで構築されたAI対応株式分析ツールです。このツールは株価のリアルタイム監視が可能で、コストと損益表示、上下アラームプッシュ機能を提供します。すべてのデータはローカルに保存され、ユーザ...
11ヶ月前
057.7K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror:収益性の高いGrokミラーサイトのワンクリック展開

包括的な紹介 Grok-Mirrorは、操作可能なGrokミラーステーションの構築に基づいた、サーバーレスで迅速なデプロイが可能なGrok3国内ミラーステーションです。Docker経由でワンクリックでローカルのGrokキオスクをデプロイすることができます。GrokはxAIの人工知能です。
10ヶ月前
057.6K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン

概要 Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使うと、ユーザーはどのウェブページでもサイドバーを開き、ローカルで動作しているAIモデルと対話することができます。
9ヶ月前
057.6K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer:プロフェッショナル4コマ漫画イラスト作成ツール、画像生成、漫画ページ編集

概要 SP-MangaEditerは、マンガ制作者のために設計された独立したマンガ編集プラットフォームです。画像生成、レイヤー編集、画像調整、フィルター適用など様々な機能をサポートし、高品質なマンガイラストを簡単に作成することができます。ユーザーは簡単に操作することができます...
1年前
057.6K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive:教師なしライブ録画、自動スライス、B局用アップロードツール

総合紹介 biliveはB局ライブ録画のために設計されたツールで、非常に高速なライブ録画、自動スライシング、ポップアップレンダリング、字幕生成を提供します。このツールは、超低構成マシンに対応し、7x24時間の無人録画をサポートし、自動的にポップアップと字幕を識別してレンダリングし、自動的にスライスして...
11ヶ月前
057.4K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス

概論 CAD-MCPはオープンソースプロジェクトであり、ユーザが自然言語コマンドによってCADソフトウェアを制御し、描画操作を行うことを可能にします。自然言語処理とCAD自動化技術を組み合わせ、ユーザーが手動でCADインターフェイスを操作する必要がなく、簡単なテキストコマンドを入力するだけで、CADソフトウェアを操作することができます。
8ヶ月前
057.3K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: 自律実行型マルチインテリジェントの構築、完全機能のオープンソースAIインテリジェントボディ開発フレームワーク

包括的な紹介 Elizaは先進的なマルチインテリジェントボディ(マルチエージェント)開発フレームワークで、自律的なインテリジェントボディ(自律エージェント)の構築と展開プロセスを簡素化することに取り組んでいます。異なる役割設定を持つ複数のインテリジェントボディの配置をサポートし、インテリジェントな...
1年前
057.2K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI:カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築

一般的な紹介 FlowiseAIは、開発者がカスタムLLM(大規模言語モデル)アプリケーションとAIエージェントを構築するために設計されたオープンソースのローコードツールです。ドラッグ&ドロップのシンプルなインターフェースで、ユーザーはLLMアプリケーションを素早く作成し、繰り返し実行することができます。
12ヶ月前
057K
小红书AI运营助手:自动生成和发布小红书文章

XiaohongshuのAI操作アシスタント:自動的にXiaohongshuの記事を生成し、公開します。

総合紹介 Xiaohongshu AI Operation Assistant(xhsaipublisher)は、Xiaohongshuプラットフォームで記事を公開するために設計された自動化ツールです。このプロジェクトは、グラフィカル・ユーザー・インターフェースと自動化スクリプトを組み合わせ、ビッグモデル技術を使ってコンテンツを生成し、ブラウザ経由で自動的にログインして公開します...
1年前
057K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

透かし除去:オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

概論 透かし除去は、機械学習とディープラーニングの技術を画像修復、特に画像から透かしを除去するために使用するオープンソースプロジェクトです。このプロジェクトはChimzuruoke Okaforによって開発され、Con...
11ヶ月前
057K
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API

DDG-Chat:ワンクリックでChat2APIバックエンドをデプロイ、DuckDuckGoをAPIへ

一般的な紹介 DDG-Chat は、ワンクリックで複数のプラットフォームにデプロイできる ChatGPT API バックエンドを提供することを目的としたオープンソースプロジェクトです。このプロジェクトは、GPT-4o mini、Claude 3 Haiku、Llam...を含む複数のモデルをサポートしています。
1年前
057K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル(LLM)が音声を生成します。
8ヶ月前
056.8K