AIオープンソースプロジェクト

合計1020記事
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
7ヶ月前
048.6K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw:手描き風バーチャルホワイトボードツール|AIによるテキスト生成フローチャート|Excalidrawチュートリアル

Excalidraw 概要 Excalidrawは、手描き風の図を簡単に描くことができるオープンソースの仮想ホワイトボード描画ツールです。Excalidrawを使って、手描き風の美しいイラストやワイヤーフレーム図など、お気に入りの図を作成することができます。
1年前
048.5K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI:LLMなしで構造化データを抽出するオープンソースの非同期ウェブクローラツール

包括的な紹介 Crawl4AIは、大規模言語モデル(LLM)と人工知能(AI)アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマットを提供します。
1年前
048.4K
WeChatFerry:功能全面的微信机器人开发框架

WeChatFerry:WeChatロボット開発のための完全機能フレームワーク

包括的な紹介 WeChatFerryは、オープンソースのWeChatロボットの基礎となるフレームワークであり、GitHub上の開発者lich0821によって作成され、維持されています。このプロジェクトは、WeChat Hook技術を通じて、一連の強力なSDKを提供し、開発者がWeChat ...
9ヶ月前
048.3K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: 複数のデータベースでスマートテーブルを作成、オープンソースのAirtable代替ツール

一般的な紹介 NocoDBは、強力で使いやすいオンラインデータベース管理ツールを提供するために設計されたオープンソースのAirtableの代替です。NocoDB を使えば、ユーザーはコードを書くことなく、簡単にデータベースからデータを作成、読み込み、更新、削除することができます。このプラットフォームは、...
1年前
048.2K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...
11ヶ月前
048.1K
OpenSPG:开源知识图谱引擎

OpenSPG: オープンソース知識グラフエンジン

包括的な紹介 OpenSPGは、SPG (Semantic Augmented Programmable Graph)フレームワークに基づいて、Ant GroupがOpenKGと共同で開発したオープンソースの知識グラフエンジンです。このエンジンは、ドメイン知識グラフの構築と管理をサポートするために、 明示的な意味表現、論理ルール定義、運用フレームワークなどの機能を提供するように設計されています...
1年前
048K
Suna:集成浏览器操作与数据分析的智能代理

Suna: ブラウザ操作とデータ分析を統合するインテリジェント・エージェント

一般的な紹介 SunaはKortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を使用して、ユーザーを支援します。
7ヶ月前
047.9K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得ることを支援するために特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語をサポートします。
11ヶ月前
047.8K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing:インテリジェントビデオ多言語AI吹替/翻訳ツール

包括的な紹介 Linly-Dubbingはインテリジェントな多言語AIダビングと翻訳ツールで、高度なAI技術を統合することにより、ユーザーに高品質の多言語ビデオダビングと字幕翻訳サービスを提供するように設計されています。このツールは、特に国際教育、グローバルコンテンツのローカリゼーションやその他のシナリオに適しており、...
10ヶ月前
047.7K
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP:マイクロソフトのブラウザ自動化MCPサービス

一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールである。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御できるようにする。
8ヶ月前
047.7K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: オープンソースの無料コミックスダウンローダー、PDF, EPUB, CBR, CBZ形式のコミックスをダウンロード可能

一般的な紹介 Comics Downloaderは、ユーザーが様々なウェブサイトからコミックやコミックをダウンロードできるように設計されたオープンソースツールです。このツールは、PDF、EPUB、CBR、CBZを含む様々なファイル形式をサポートしており、ユーザーは自分のニーズに合わせて選択することができます。
11ヶ月前
047.6K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB:スマートなカスタマーサービスと社内ナレッジベースのための、すぐに使えるAIナレッジベースQ&Aシステム

包括的な紹介 MaxKB (Max Knowledge Base) は、大規模言語モデルとRAG (Retrieval Augmented Generation) に基づいたオープンソースの知識ベースQ&Aシステムです。このシステムは、インテリジェントな顧客サービス、企業の内部知識ベース、学術研究および教育やその他のシナリオで広く使用されています。
10ヶ月前
047.5K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk:完全なデジタルヒューマンビデオ生成フレームワーク|ポートレートからビデオへ|ポーズからビデオへ|リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。
12ヶ月前
047.3K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse:LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

概要 LangfuseはオープンソースのLLM(大規模言語モデル)エンジニアリングプラットフォームです。LLMアプリケーションのトレース、デバッグ、最適化を支援し、呼び出しの観察、キューワードの管理、実験の実行、結果の評価を行うツールを提供します。このプラットフォームは、Langfuseチームによって開発されています。
8ヶ月前
047.2K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: 深い文書理解に基づくオープンソースのRAGエンジンで、効率的な検索強化生成ワークフローを提供します。

包括的な紹介 RAGFlowは、深い文書理解技術に基づいたオープンソースのRAG(Retrieval Augmented Generation)エンジンです。RAGFlowは、あらゆる規模の企業向けに効率的なRAGワークフローを提供し、実際の文書に基づいた複雑な形式のデータを提供できる大規模言語モデル(LLM)を組み込んでいます。
10ヶ月前
047.1K
E2B:安全云沙箱中的AI代码运行平台

E2B: 安全なクラウドサンドボックスでAIコードを実行するプラットフォーム

概要 E2Bは、AIが生成したコードを安全なクラウドサンドボックスで実行するために設計されたオープンソースプラットフォームです。幅広いプログラミング言語とフレームワークをサポートし、コード実行のセキュリティと信頼性を確保するために隔離された仮想環境を提供します。E2Bは、データ分割を含む様々なAIアプリケーションシナリオに適しています。
11ヶ月前
047.1K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本

Cursor Reset: Cursorバージョン0.45.x以上のデバイス識別子をリセットするスクリプト。

概要 Cursor Reset は、Cursor IDE でデバイス識別子をリセットするための PowerShell スクリプト・ツールで、Cursor バージョン 0.45.x をサポートしています。このツールは、ユーザーが Cursor IDE のデバイス識別子をリセットできるように設計されています。
10ヶ月前
047.1K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: ジェネレーティブAIアプリケーション開発プラットフォーム、ビジュアルオーケストレーション、プライベートデプロイメントサポート

包括的な紹介 DifyはオープンソースのジェネレーティブAIアプリケーション開発プラットフォームで、開発者が大規模言語モデル(LLM)に基づくネイティブAIアプリケーションを迅速に構築・運用できるように設計されています。このプラットフォームは、エージェントの構築からAIワークフローのオーケストレーション、RAG検索...
10ヶ月前
046.9K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter:wechat公開番号記事一括エクスポートツールのワンクリックデプロイメント

包括的な紹介 wechat-article-exporterは、ユーザーがWeChatの公開番号の記事を一括エクスポートするために設計されたオープンソースのツールです。このツールは、環境を構築することなく、記事に埋め込まれたオーディオとビデオのエクスポートをサポートし、100%は、記事のスタイルを復元することができ、プライベート部分をサポートしています...
1年前
046.9K
Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

包括的な紹介 Smolagentsは、HuggingFaceによって開発された軽量インテリジェントエージェントライブラリで、AIエージェントシステムの開発プロセスを簡素化することに重点を置いています。このプロジェクトは、約1000行のコアコードしかないシンプルな設計思想で知られていますが、強力な機能統合機能を提供しています。このライブラリの最も ...
11ヶ月前
046.8K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent:モバイル機器操作アシスタントのためのマルチエージェント・コラボレーション

一般的な紹介 MobileAgentは、マルチエージェントコラボレーションと強化された視覚認識モジュールにより、モバイルデバイス操作の効率と自動化を改善するために設計された強力なモバイルデバイス操作アシスタントです。X-PLUGチームによって開発され、Androidと...
10ヶ月前
046.8K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

概論 RealtimeSTTは、高度な音声アクティビティ検出とウェイクワードアクティベーションを備えた、効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。
10ヶ月前
046.8K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: 長期記憶に基づくマルチホップ知識検索フレームワーク

概論 HippoRAGはオハイオ州立大学のOSU-NLPグループによって開発されたオープンソースのフレームワークで、人間の長期記憶メカニズムにヒントを得ている。検索拡張生成(RAG)、ナレッジグラフ、パーソナライズドPageRankのテクニックを組み合わせ、大規模な言語モデル...
9ヶ月前
046.7K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow:Rooコード拡張に基づくメモリ拡張システム

包括的な紹介 RooFlowはオープンソースのAI支援プログラミングツールであり、プロジェクトのロギングを通じて開発中のコード、決定、タスクの進捗を保存するコア機能を備えています。Roo Codeエクステンションをベースに、アーキテクチャ、コーディング、テスト、デバッグ、Q&Aの5つのモードを統合しています。これらのモードは相互に...
7ヶ月前
046.6K
OpenManus:MetaGPT推出的开源版Manus

OpenManus: MetaGPTによるManusのオープンソース版

一般的な紹介 OpenManusは、ユーザーが簡単な設定でローカルにインテリジェンスを実行し、様々な創造的なアイデアを実現できるように設計されたオープンソースプロジェクトです。MetaGPTコミュニティメンバーの@mannaandpoem、@XiangJinyu、@Mos...によって開発されました。
9ヶ月前
046.6K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: AIインテリジェンスがウェブをブラウズするためのオープンソースフレームワーク。

概要 ブラウザユースWeb UIは、AIエージェントにグラフィカルインターフェースツールとしてブラウザインタラクション機能を提供することに焦点を当てた革新的なオープンソースプロジェクトです。このプロジェクトは、ブラウザユースコアフレームワークの上に構築されており、Gradio ...
6ヶ月前
046.3K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1:民生用GPUで高画質ビデオを生成する

概要 Wan2.1は、Wan-Videoチームによって開発され、GitHubでオープンソース化されたビデオ生成ツール群で、人工知能技術によってビデオ作成の限界を押し広げることに焦点を当てています。Wan2.1は、高度な拡散変換アーキテクチャに基づいており、独自の時間変化する自己...
9ヶ月前
046.1K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台

WeChat動画番号ダウンローダー:WeChat動画番号の動画を素早くダウンロード、複数のフォーマットとプラットフォームをサポートする

総合紹介 WeChat動画番号ダウンローダーはオープンソースプロジェクトで、ユーザーがWeChat動画番号から動画コンテンツを素早くダウンロードできるように設計されています。このツールは、様々なビデオフォーマットとプラットフォームをサポートしており、ユーザーはWindowsとmacOSシステム上で簡単に使用することができます。このプロジェクトはltaooによって開発され、...
11ヶ月前
046K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: テキストと画像からSVGベクターグラフィックスを生成するオープンソースプロジェクト

概論 OmniSVGは、マルチモーダルモデルによる高品質なベクターグラフィックス(SVG)の生成に特化したオープンソースプロジェクトである。事前に訓練された視覚言語モデルを使用して、テキスト記述や画像入力からのSVG生成をサポートし、単純なアイコンから複雑なアニメキャラクターまで幅広いシナリオをカバーします。アイテム ...
8ヶ月前
045.9K
RF-DETR:实时视觉对象检测开源模型

RF-DETR:リアルタイム視覚物体検出のためのオープンソースモデル

包括的な紹介 RF-DETRはRoboflowチームによって開発されたオープンソースの物体検出モデルです。RF-DETRはTransformerアーキテクチャをベースにしており、リアルタイム性を特徴としています。このモデルはMicrosoft COCOデータセット上で初めて60APs以上のリアルタイム性を達成した。
8ヶ月前
045.9K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive:教師なしライブ録画、自動スライス、B局用アップロードツール

総合紹介 biliveはB局ライブ録画のために設計されたツールで、非常に高速なライブ録画、自動スライシング、ポップアップレンダリング、字幕生成を提供します。このツールは、超低構成マシンに対応し、7x24時間の無人録画をサポートし、自動的にポップアップと字幕を識別してレンダリングし、自動的にスライスして...
10ヶ月前
045.9K
A2A:谷歌发布AI智能间通信的开放协议

A2A:グーグル、AIインテリジェンス間の通信のためのオープンプロトコルを公開

概要 A2A (Agent2Agent)は、異なるフレームワークやベンダーによって開発されたAIインテリジェンスが相互に通信し、コラボレーションすることを可能にするためにGoogleによって開発されたオープンソースプロトコルである。このプロトコルは、インテリジェンスが互いの能力を発見し、タスクを共有し、作業を完了するための標準化された一連の方法を提供する。
8ヶ月前
045.9K
Meeting:本地实时转录和生成会议纪要的开源客户端

ミーティング:オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes(別名Meetily)は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...
9ヶ月前
045.8K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。
1年前
045.8K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: ダイナミックな知識グラフの構築とクエリーツール(時間を考慮したロングメモリプログラム)

一般的な紹介 Graphitiは、getzep社によって開発された、動的で時間を意識した知識グラフの構築とクエリのためのツールです。エンティティ間の複雑で発展的な関係を表現し、時系列、全文、セマンティック、グラフアルゴリズムなど様々な手法でクエリすることができる。
9ヶ月前
045.7K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: ローカルAI環境を素早く構築するためのオープンソーステンプレート

包括的な紹介 n8nセルフホストAIスターターキットは、包括的なローカルAIとローコード開発環境を素早く初期化するために設計されたオープンソースのDocker Composeテンプレートです。n8nチームによって作られたこのスイートは、セルフホスト型のn8nプラットフォームと、互換性のある様々なAI...
10ヶ月前
045.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker:デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

概論 Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出す。このシステムは、Whisper、Linly、Micros...といった様々な技術を統合しています。
10ヶ月前
045.4K
Qlib:微软开发的AI量化投资研究工具

Qlib:マイクロソフトが開発したAI定量投資調査ツール

Qlibはマイクロソフトが開発したオープンソースのプラットフォームであり、AI技術を活用してクオンツ投資のリサーチを支援することに主眼を置いている。Qlibは、最も基本的なデータ処理からスタートし、ユーザーが投資アイデアを探求し、使える戦略に変えることをサポートする。このプラットフォームはシンプルで使いやすく、機械学習を使って投資リサーチを改善したい人に適している。
8ヶ月前
045.3K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt:ユニバーサルビデオダウンローダー、YouTube、Vimeo、Twitter、Reddit、SoundCloudなど!

Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するために設計されたオープンソースのメディアダウンローダーです。Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するように設計されたオープンソースのメディアダウンローダです。
11ヶ月前
045.1K
Onyx:连接企业知识库的智能AI聊天平台

Onyx:企業の知識ベースをつなぐインテリジェントなAIチャットプラットフォーム

一般的な紹介 Onyx(旧称Danswer)は、onyx-dot-appチームによって開発されたオープンソースのAIチャットプラットフォームで、ドキュメント、アプリケーション、従業員データの統合と管理を支援します。あらゆる大規模言語モデル(LLM: Large Language Model)の接続をサポートし、豊富なチャット機能を提供します。
9ヶ月前
045.1K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js:AIでブラウザ自動テストを推進するオープンソース・プラグイン

概論 Midscene.jsはAIを搭載したブラウザ自動化ツールで、自然言語コマンドによってウェブページを制御し、アサーションを実行し、データを抽出します。Chrome拡張機能、JavaScript SDK、YAMLスクリプトをサポートし、UI測定を簡素化します。
10ヶ月前
044.9K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT:自然言語プログラミングのためのAIソフトウェア開発チーム構築のための多知能コラボレーションフレームワーク

包括的な紹介 MetaGPTは、完全なAIソフトウェア会社の運営をシミュレートするために設計された革新的なマルチインテリジェンス体のフレームワークです。geekan(アレクサンダー・ウー)によって作成されたこのプロジェクトの目標は、異なる役割を持つGPTモデルを協調的なエンティティに結合することです...
9ヶ月前
044.9K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix:大規模モデル検索用にコードベースをテキストファイルにパッケージ化

概論 Repomix(以前はRepopackとして知られていた)は、コードベース全体を単一のAIフレンドリーなファイルにパッケージ化するために設計されたオープンソースツールです。このツールにより、開発者は自分のコードベースを大規模な言語モデル(ClaudeやChat...
10ヶ月前
044.7K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee:知識グラフベースのRAG構築のためのオープンソースフレームワーク、コアプロンプト学習

概要 CogneeはAIアプリケーションとAIエージェントのために設計された信頼性の高いデータレイヤーソリューションです。LLM(大規模言語モデル)コンテキストのロードと構築を行い、ナレッジグラフとベクトルストアを通じて正確で解釈可能なAIソリューションを作成するように設計されています。このフレームワークは、コスト削減、解釈可能な...
10ヶ月前
044.5K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: AI生成PPT、プレゼンテーション生成

総合紹介 AiPPTは人工知能技術に基づいたPPT生成ツールで、プロフェッショナルなプレゼンテーションを素早く作成できるように設計されています。テーマを入力したり、ファイルをアップロードしたり、URLを提供したりすることで、内容が豊富で美しくデザインされたスライドを自動的に生成します。
9ヶ月前
044.4K
Magic MCP:生成现代化UI组件的MCP服务

Magic MCP: モダンなUIコンポーネントを生成するMCPサービス

一般的な紹介 Magic MCPは21st.devチームによって開発されたAI駆動ツールで、フロントエンド開発者のために設計されています。自然言語の記述からモダンなUIコンポーネントをオンザフライで生成し、Cursor、WindSurfと統合します。
9ヶ月前
044.3K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。
9ヶ月前
044.3K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: 自律実行型マルチインテリジェントの構築、完全機能のオープンソースAIインテリジェントボディ開発フレームワーク

包括的な紹介 Elizaは先進的なマルチインテリジェントボディ(マルチエージェント)開発フレームワークで、自律的なインテリジェントボディ(自律エージェント)の構築と展開プロセスを簡素化することに取り組んでいます。異なる役割設定を持つ複数のインテリジェントボディの配置をサポートし、インテリジェントな...
11ヶ月前
044.2K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio:マルチエージェントシステムAutoGenの使いやすいインターフェイス版

概要 AutoGen Studio 2.0は、マルチエージェント・ソリューションの作成と管理のプロセスを簡素化するために設計されたAutoGenによるユーザー・インターフェースです。このプラットフォームでは、直感的なインターフェースを通じて、エージェントとそのワークフローを宣言的に定義および変更することができます...
10ヶ月前
044.1K
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API

DDG-Chat:ワンクリックでChat2APIバックエンドをデプロイ、DuckDuckGoをAPIへ

一般的な紹介 DDG-Chat は、ワンクリックで複数のプラットフォームにデプロイできる ChatGPT API バックエンドを提供することを目的としたオープンソースプロジェクトです。このプロジェクトは、GPT-4o mini、Claude 3 Haiku、Llam...を含む複数のモデルをサポートしています。
1年前
044.1K
Abogen:将多种文本格式转换为有声读物的工具

Abogen:複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...
7ヶ月前
044.1K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.:コンテキストを考慮したインテリジェントコードアシスタント、コードの生成と修正、マルチIDEサポート

概論 J.A.R.V.I.S. (Just A Rather Very Intelligent System) は、複数の最先端の言語モデルを使用して、開発者のコード生成、修正、技術的なディスカッションを支援するように設計されたインテリジェントなコード・アシスタントです。
11ヶ月前
043.9K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer:プロフェッショナル4コマ漫画イラスト作成ツール、画像生成、漫画ページ編集

概要 SP-MangaEditerは、マンガ制作者のために設計された独立したマンガ編集プラットフォームです。画像生成、レイヤー編集、画像調整、フィルター適用など様々な機能をサポートし、高品質なマンガイラストを簡単に作成することができます。ユーザーは簡単に操作することができます...
11ヶ月前
043.9K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion:シャオミのオープンソースのエンド・ツー・エンドの自動運転推論・計画フレームワーク

包括的な紹介 OrionはXiaomi Labsによって開発されたオープンソースプロジェクトで、エンドツーエンド(E2E)自律走行技術に焦点を当てています。Orionは、視覚言語モデリング(VLM)と生成プランナーによって、従来の自律走行手法の複雑なシナリオにおける因果推論が不十分であるという問題を解決する。
8ヶ月前
043.8K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: RMBG 2.0 用に最適化された、画像やビデオの背景を一括除去するオープンソースプログラム。

概論 RMBG-2-Studioは、BRIA-RMBG-2.0モデルに基づいて開発された、背景の除去および置換を行う拡張アプリケーションです。このアプリケーションは、電子商取引、ゲーム、...を含む様々なタイプの画像に対して、効率的で正確な画像背景処理機能をユーザーに提供するように設計されています。
12ヶ月前
043.7K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。
10ヶ月前
043.7K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2:高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE(Mixture-of-Experts)視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...
10ヶ月前
043.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換

概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。
12ヶ月前
043.6K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI:複雑なタスクを簡素化するマルチロールプレイ協調知能フレームワーク

包括的な紹介 CrewAIは、ロールプレイングと自律型AIエージェント間のコラボレーションをオーケストレーションするために設計された高度なフレームワークです。コラボレーションインテリジェンスを促進することで、CrewAIはエージェントがシームレスに連携して複雑なタスクを解決することを可能にします。インテリジェントアシスタントプラットフォームの構築、カスタマーサービスチームの自動化、マルチエージェント...
11ヶ月前
043.5K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: AIチャットと描画のためのSpringBootベースのバックエンドフレームワーク

包括的な紹介 RuoYi AIはruoyi-plusフレームワークに基づいて、AIチャットと絵画機能の統合に焦点を当てたバックエンドプロジェクトです。Java17とSpringBoot 3.X技術スタックを使用し、完全にオープンソースで無料です。
9ヶ月前
043.5K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: 実験的音声合成モデル、純粋な言語モデリングアプローチで実装されたTTS

包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成(TTS)モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルは、LLaMaアーキテクチャに基づいています。
10ヶ月前
043.4K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: テンセントのオープンソース高解像度3Dモデル生成ツール

概論 Hunyuan3D-2はTencentによって開発されたオープンソースプロジェクトで、テキストや画像から高解像度の3Dモデルを生成する。形状生成モデル(Hunyuan3D-DiT)とテクスチャ生成モデル(Hunyuan3D...)の2つのコアコンポーネントで構成されています。
8ヶ月前
043.4K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror:収益性の高いGrokミラーサイトのワンクリック展開

包括的な紹介 Grok-Mirrorは、操作可能なGrokミラーステーションの構築に基づいた、サーバーレスで迅速なデプロイが可能なGrok3国内ミラーステーションです。Docker経由でワンクリックでローカルのGrokキオスクをデプロイすることができます。GrokはxAIの人工知能です。
8ヶ月前
043.4K
Agno:构建具备记忆、知识和工具的多模态智能体框架

アグノ:記憶、知識、ツールを備えたマルチモーダルインテリジェンス構築のためのフレームワーク

一般的な紹介 Agnoは、agno-agiチームによって開発され、GitHubでホストされているオープンソースのPythonライブラリで、開発者が記憶、知識、ツールを備えたAIインテリジェンスを簡単に構築できるようにすることに専念しています。マルチモーダルなテキスト、画像、音声、動画をサポートしています。
9ヶ月前
043.4K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。
9ヶ月前
043.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

一般的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR(光学式文字認識)ソリューションを提供します。
10ヶ月前
043.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

ディープライブカム:オープンソースのリアルタイムAI顔交換ツール、リアルタイムでライブ顔交換するための写真

概要 Deep Live Camは、1枚の写真からリアルタイムで顔を置き換え、フェイクビデオを生成できるように設計されたオープンソースの人工知能ツールです。高度なディープラーニングアルゴリズムを使用することで、ライブストリーミングやビデオ通話中にリアルタイムで顔を入れ替えることができ、ユーザーのプライバシーを保護し、楽しさを追加します。
1年前
043.3K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser: ブラウザ操作を制御するインテリジェンスとアプリケーションを構築する自動ウェブブラウザAPI

概要 Steel Browserは、AIエージェントとアプリケーションのために設計されたオープンソースのブラウザAPIです。Steel Browserは、インフラストラクチャを気にすることなくウェブ操作を自動化できるフルブラウザインスタンスを提供します。
12ヶ月前
043.3K
Reader API:网页内容提取工具,HTML转换为Markdown格式

Reader API: ウェブコンテンツ抽出ツール、HTMLからMarkdownへの変換

一般的な紹介 Jina AIのReaderプロジェクトは、https://r.jina.ai/转换成适合大型语言模型(Large Languag...)という接頭辞を付加することで、任意のURLを受け取るオープンソースツール(Readerオープンソースアドレス)です。
1年前
043.2K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン

概要 Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使うと、ユーザーはどのウェブページでもサイドバーを開き、ローカルで動作しているAIモデルと対話することができます。
8ヶ月前
043.1K
Open Deep Research:LangChain开源的深度研究智能助手

オープン・ディープ・リサーチ:LangChainのディープ・リサーチ用オープンソース・インテリジェント・アシスタント

包括的な紹介 Open Deep Researchは、あらゆるトピックに関する包括的なリサーチレポートを作成できるウェブベースのリサーチアシスタントです。このシステムでは、時間のかかる調査フェーズに進む前に、レポートの構成を計画し、確認することができる、計画と実行のワークフローを使用しています...
8ヶ月前
043.1K
Prompt Optimizer:优化主流AI模型提示词的开源工具

プロンプト・オプティマイザー:主流AIモデルのプロンプト語を最適化するオープンソースツール

概論 Prompt Optimizerは、GitHubのlinshenkxによって開発された、プロンプト単語の最適化に焦点を当てたオープンソースツールです。インテリジェントなアルゴリズムによってAIモデルのプロンプトワードを最適化し、生成されるコンテンツの品質を向上させます。
9ヶ月前
042.9K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI:カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築

一般的な紹介 FlowiseAIは、開発者がカスタムLLM(大規模言語モデル)アプリケーションとAIエージェントを構築するために設計されたオープンソースのローコードツールです。ドラッグ&ドロップのシンプルなインターフェースで、ユーザーはLLMアプリケーションを素早く作成し、繰り返し実行することができます。
10ヶ月前
042.8K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

アウトライン: 正規表現、JSON、Pydanticモデルによる構造化テキスト出力の生成

概説 Outlinesは、構造化テキスト生成を通じて大規模言語モデル(LLM)のアプリケーションを強化するために、dottxt-aiによって開発されたオープンソースライブラリです。このライブラリは、OpenAIやトランスフォーマーなど、様々なモデルの統合をサポートしています。
10ヶ月前
042.8K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: Dify APIをベースとしたデスクトップインテリジェントダイアログクライアントで、エンタープライズグレードのAIダイアログ機能を提供します。

包括的な紹介 Dify-WebUIは、Dify APIに基づいた最新のデスクトップインテリジェント対話アプリケーションで、企業に強力なAI対話機能を提供するように設計されています。このアプリケーションは、企業の個々のニーズを満たすために、様々なプリセットテーマカラーをサポートし、ナレッジベース管理機能をサポートします。
11ヶ月前
042.7K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス

概論 CAD-MCPはオープンソースプロジェクトであり、ユーザが自然言語コマンドによってCADソフトウェアを制御し、描画操作を行うことを可能にします。自然言語処理とCAD自動化技術を組み合わせ、ユーザーが手動でCADインターフェイスを操作する必要がなく、簡単なテキストコマンドを入力するだけで、CADソフトウェアを操作することができます。
7ヶ月前
042.7K
小红书AI运营助手:自动生成和发布小红书文章

XiaohongshuのAI操作アシスタント:自動的にXiaohongshuの記事を生成し、公開します。

総合紹介 Xiaohongshu AI Operation Assistant(xhsaipublisher)は、Xiaohongshuプラットフォームで記事を公開するために設計された自動化ツールです。このプロジェクトは、グラフィカル・ユーザー・インターフェースと自動化スクリプトを組み合わせ、ビッグモデル技術を使ってコンテンツを生成し、ブラウザ経由で自動的にログインして公開します...
11ヶ月前
042.6K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: PPTプレゼンテーション、ドキュメントからPPTへの自動生成と評価

概要 PPTAgentは、ドキュメントからプレゼンテーションを自動生成する革新的なシステムです。このシステムは、プレゼンテーションの作成における人間のアプローチを取り入れ、コンテンツの品質と視覚的なインパクトを確保するための2段階のプロセスを採用しています。さらに、PPTAgentはPPTEvalを導入しています。
10ヶ月前
042.6K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS:複数のフォーマットをサポートし、柔軟な編集が可能なマイクロソフト開発の3Dアセット生成モデル

概 要 TRELLISは、マイクロソフトが開発した大規模3Dアセット生成モデルです。テキストや画像のプロンプトを受け取り、ラジアルフィールド、3Dガウシアン、メッシュなど、さまざまな形式で高品質な3Dアセットを生成することができます。TRELLISの中核をなすのは、統一された構造化潜在...
12ヶ月前
042.5K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light(V2):画像照明制御マジック、画像の光と影、背景を制御する

包括的な紹介 IC-Lightは画像照明制御のためのプロジェクトであり、高度なAIモデルによって画像の照明効果を操作することを目的としている。Lvmin Zhangらによって開発されたこのプロジェクトは、2つの主要なモデルを提供する:テキスト条件付き再照明モデルと背景条件付きモデル。ユーザは、このモデルを使って...
12ヶ月前
042.5K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

概要 LiteAvatarはHumanAIGCチーム(Aliの一部)によって開発されたオープンソースツールで、音声によって駆動される2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム(fps)で動作し、特に...
9ヶ月前
042.5K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor:OpenWebUIのユーザーアクティビティを監視し、使用量の制限を管理し、ワンクリックのデプロイをサポートします。

概要 OpenWebUI-Monitorは、OpenWebUIユーザーのアクティビティを監視し、使用クォータを管理するためのダッシュボードです。ユーザークォータを効率的に設定し、ユーザデータと視覚的な情報をリアルタイムで表示することができ、ワンクリックのデプロイをサポートし、ユーザ管理と監視を容易にします。
1年前
042.4K
GraphRAG-Dify:让Dify具备GraphRAG能力

GraphRAG-Dify:DifyにGraphRAGの機能を装備する

包括的な紹介 GraphRAG-Difyは、GraphRAGとDifyの技術を組み合わせて、AIエージェントを素早く作成し、デプロイするために設計されたオープンソースプロジェクトです。このプロジェクトでは、サービス構築にFastAPIとUvicornを使用し、DSLのインポートをサポートしています。
1年前
042.4K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): Perplexityを模倣したオープンソースプロジェクトで、AI対話、ウェブ検索、天気クエリなどを統合している。

概論 MiniPerplx (Sciraに改名) はミニマリストデザインのAI駆動型検索エンジンであり、様々な便利な機能を統合し、ユーザーにあらゆる情報検索サービスを提供する。このプロジェクトでは、Next.js、Tailwi...
11ヶ月前
042.4K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

非構造化:オープンソースの非構造化ドキュメントの前処理、非構造化データ処理ツール

包括的な紹介 Unstructured-IOは、画像やPDF、HTML、Word文書などのテキスト文書を処理・前処理するためのオープンソースコンポーネントのセットを提供します。その主な目的は、特に大規模な言語モデル(LL...
1年前
042.4K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトでは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質な音声合成を行うことができます。
10ヶ月前
042.4K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)

Anon-Kode:コマンドラインAIコード・アシスタント(クロード・コードのコード分解)

一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。
9ヶ月前
042.3K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): ナレッジグラフの作成と管理のためのオープンソースプラットフォーム。

包括的な紹介 Knowledge Graph Studio (KGS) は、RAGネイティブなナレッジグラフの作成と管理のプロセスを簡素化するために設計されたオープンソースのプラットフォームです。このプラットフォームは、ルールベースのエンティティ解決、モジュール式のグラフ構築、柔軟なデータ...
12ヶ月前
042.2K