AIオープンソースプロジェクト

合計1020記事
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP:マイクロソフトのブラウザ自動化MCPサービス

一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールである。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御できるようにする。
11ヶ月前
087.6K
Meeting:本地实时转录和生成会议纪要的开源客户端

ミーティング:オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes(別名Meetily)は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...
12ヶ月前
087.6K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer:複数の作業ツールを統合する、企業の知識管理と文書検索のためのAIアシスタント

一般的な紹介 Danswerは、インテリジェントなチャットインターフェイスと統一された検索機能を通じて、統一された検索と自然言語クエリの回答を提供するために、チームのドキュメント、アプリケーション、および人に接続するように設計されたオープンソースのエンタープライズ文書検索AIアシスタントです。ユーザーデータとチャットが完全に制御されていることを保証...
1年前
087.5K
OpenManus:MetaGPT推出的开源版Manus

OpenManus: MetaGPTによるManusのオープンソース版

一般的な紹介 OpenManusは、ユーザーが簡単な設定でローカルにインテリジェンスを実行し、様々な創造的なアイデアを実現できるように設計されたオープンソースプロジェクトです。MetaGPTコミュニティメンバーの@mannaandpoem、@XiangJinyu、@Mos...によって開発されました。
12ヶ月前
087.3K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion:シャオミのオープンソースのエンド・ツー・エンドの自動運転推論・計画フレームワーク

包括的な紹介 OrionはXiaomi Labsによって開発されたオープンソースプロジェクトで、エンドツーエンド(E2E)自律走行技術に焦点を当てています。Orionは、視覚言語モデリング(VLM)と生成プランナーによって、従来の自律走行手法の複雑なシナリオにおける因果推論が不十分であるという問題を解決する。
11ヶ月前
087K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: ジェネレーティブAIアプリケーション開発プラットフォーム、ビジュアルオーケストレーション、プライベートデプロイメントサポート

包括的な紹介 DifyはオープンソースのジェネレーティブAIアプリケーション開発プラットフォームで、開発者が大規模言語モデル(LLM)に基づくネイティブAIアプリケーションを迅速に構築・運用できるように設計されています。このプラットフォームは、エージェントの構築からAIワークフローのオーケストレーション、RAG検索...
1年前
086.8K
RF-DETR:实时视觉对象检测开源模型

RF-DETR:リアルタイム視覚物体検出のためのオープンソースモデル

包括的な紹介 RF-DETRはRoboflowチームによって開発されたオープンソースの物体検出モデルです。RF-DETRはTransformerアーキテクチャをベースにしており、リアルタイム性を特徴としています。このモデルはMicrosoft COCOデータセット上で初めて60APs以上のリアルタイム性を達成した。
11ヶ月前
086.1K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: AIエージェントのためのオープンソースワークフロービルダー

包括的な紹介 Sim Studioは、軽量で直感的なビジュアルインターフェースを通じて、大規模言語モデル(LLM)ワークフローの迅速な設計、テスト、およびデプロイを支援することに重点を置いた、オープンソースのAIエージェントワークフロー構築プラットフォームです。ドラッグ&ドロップで複雑なワークフローを作成できます。
9ヶ月前
086K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: 複数のデータベースでスマートテーブルを作成、オープンソースのAirtable代替ツール

一般的な紹介 NocoDBは、強力で使いやすいオンラインデータベース管理ツールを提供するために設計されたオープンソースのAirtableの代替です。NocoDB を使えば、ユーザーはコードを書くことなく、簡単にデータベースからデータを作成、読み込み、更新、削除することができます。このプラットフォームは、...
1年前
085.7K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Trend Finder: ソーシャルメディアのトレンド、トレンドトピック、新着記事をリアルタイムで追跡し、マーケティングの意思決定に活用。

はじめに Trend Finderは、ソーシャルメディア上のトレンドトピックやトレンドをリアルタイムで追跡できるように設計された強力なツールです。主要なインフルエンサーからの投稿を収集・分析することで、Trend Finderは新しいトレンドや製品リリースをいち早く察知し、発信することができます。
1年前
085.3K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: マルチモーダルコンテンツを解析し、知識グラフとハイブリッド検索を組み合わせた高度AI検索(RAG)システム

包括的な紹介 R2R (RAG to Riches)は、RAG (Retrieval Augmented Generation)機能をサポートする先進的なAI検索システムで、本番環境ですぐに使える機能を備えています。コンテナ化されたRESTful API上に構築されたこのシステムは、マルチモーダルコンテンツの解析、ハイブリッド検索機能を提供します。
1年前
085.2K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse:LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

概要 LangfuseはオープンソースのLLM(大規模言語モデル)エンジニアリングプラットフォームです。LLMアプリケーションのトレース、デバッグ、最適化を支援し、呼び出しの観察、キューワードの管理、実験の実行、結果の評価を行うツールを提供します。このプラットフォームは、Langfuseチームによって開発されています。
12ヶ月前
085K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: 深い文書理解に基づくオープンソースのRAGエンジンで、効率的な検索強化生成ワークフローを提供します。

包括的な紹介 RAGFlowは、深い文書理解技術に基づいたオープンソースのRAG(Retrieval Augmented Generation)エンジンです。RAGFlowは、あらゆる規模の企業向けに効率的なRAGワークフローを提供し、実際の文書に基づいた複雑な形式のデータを提供できる大規模言語モデル(LLM)を組み込んでいます。
1年前
085K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: テンセントのオープンソース高解像度3Dモデル生成ツール

概論 Hunyuan3D-2はTencentによって開発されたオープンソースプロジェクトで、テキストや画像から高解像度の3Dモデルを生成する。形状生成モデル(Hunyuan3D-DiT)とテクスチャ生成モデル(Hunyuan3D...)の2つのコアコンポーネントで構成されています。
12ヶ月前
084K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: 自然言語でコンピュータを制御するDesktop Intelligentsiaアプリケーション

概論 UI-TARS Desktopは、ByteDance社が開発したUI-TARS(Visual Language Model)に基づいたグラフィカルインターフェースエージェントアプリケーションです。UI-TARSデスクトップは、ByteDance社が開発したUI-TARS(Visual Language Model)をベースとしたグラフィカルインターフェースエージェントアプリケーションです。
1年前
083.5K
Eino:字节跳动开源的Golang大模型应用开发框架

Eino: ByteDanceのオープンソースGolangビッグモデル・アプリケーション開発フレームワーク

概論 EinoはCloudWeGoチームによるGolangベースのオープンソース・フレームワークで、大規模モデル(LLM)アプリケーションの究極の開発ツールとなるように設計されている。LangChainやLlamaIndexなどのオープンソースフレームワークを利用しています。
12ヶ月前
083K
Onyx:连接企业知识库的智能AI聊天平台

Onyx:企業の知識ベースをつなぐインテリジェントなAIチャットプラットフォーム

一般的な紹介 Onyx(旧称Danswer)は、onyx-dot-appチームによって開発されたオープンソースのAIチャットプラットフォームで、ドキュメント、アプリケーション、従業員データの統合と管理を支援します。あらゆる大規模言語モデル(LLM: Large Language Model)の接続をサポートし、豊富なチャット機能を提供します。
1年前
082.8K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense:コンピュータビジョンプロジェクトの効率を高める、無料で使える画像注釈ツール

概要 Make Senseは、コンピュータ・ビジョン・プロジェクト用のデータセットを素早く準備できるように設計された、無料のオンライン画像注釈ツールです。複雑なインストールは不要で、ブラウザからアクセスするだけで使用でき、複数のオペレーティングシステムをサポートし、小規模なディープラーニングプロジェクトに最適です。ユーザーは...
1年前
082.5K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: リアルタイム視覚・音声インタラクションのためのオープンソース・マルチモーダル大規模言語モデル

概論 VITAは、オープンソースの対話型マルチモーダル大規模言語モデリング・プロジェクトのリーダーであり、真の完全なマルチモーダル対話を実現する能力を開拓している。プロジェクトは2024年8月にVITA-1.0を立ち上げ、初のオープンソース対話型フルモーダル大規模言語モデルを開拓した。
1年前
082.4K
Orpheus-TTS:生成自然中文语音的文本转语音工具

Orpheus-TTS:自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成(TTS)システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。
11ヶ月前
082.3K
Nanobrowser:浏览器中实现任务自动化的多智能插件

ナノブラウザ:ブラウザのタスク自動化のためのマルチインテリジェンス・プラグイン

概要 NanobrowserはオープンソースのChrome拡張機能で、AI主導のマルチエージェントシステムによってウェブタスクを自動化するように設計されています。OpenAI Operatorに代わる無償の拡張機能で、ユーザーはLLMを提供するだけです。
1年前
081.8K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...
1年前
081.6K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: ローカルAI環境を素早く構築するためのオープンソーステンプレート

包括的な紹介 n8nセルフホストAIスターターキットは、包括的なローカルAIとローコード開発環境を素早く初期化するために設計されたオープンソースのDocker Composeテンプレートです。n8nチームによって作られたこのスイートは、セルフホスト型のn8nプラットフォームと、互換性のある様々なAI...
1年前
081.5K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目

LibreChat: ChatGPTインターフェイスを模倣したAI対話オープンソースプロジェクト

概要 LibreChat は、カスタマイズオプションが豊富で、複数のAIプロバイダー、サービス、統合をサポートする、無料のオープンソースAIチャットプラットフォームです。使い慣れたインターフェースと革新的な機能を備え、複数のAIモデル、プラグイン、多言語をサポートすることで、すべてのAI会話を一つの場所に集約します。バイ...
2年前
081.3K
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: Android用リアルタイム音声翻訳アプリ!

一般的な紹介 RTranslatorは、Androidデバイスのために設計された事実上オープンソース、無料のオフラインリアルタイム翻訳アプリです。ユーザーはBluetoothヘッドセットを接続することで、携帯電話をポケットに入れたまま、まるで自分の国の言葉を話しているかのように他の人と会話をすることができます。
1年前
081.2K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker:デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

概論 Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出す。このシステムは、Whisper、Linly、Micros...といった様々な技術を統合しています。
1年前
081.1K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。
1年前
081.1K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: VSCodeに統合されたネイティブなセルフホストAIプログラミングアシスタント

一般的な紹介 TabbyはTabbyMLチームによって開発されたオープンソースのAIプログラミングアシスタントで、ユーザーはローカルまたはサーバー上に自分でデプロイすることができます。コードの自動補完やスマートQ&Aなど、GitHub Copilotのような機能を提供していますが、最大の特徴は...
11ヶ月前
080.7K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目

OmniSVG: テキストと画像からSVGベクターグラフィックスを生成するオープンソースプロジェクト

概論 OmniSVGは、マルチモーダルモデルによる高品質なベクターグラフィックス(SVG)の生成に特化したオープンソースプロジェクトである。事前に訓練された視覚言語モデルを使用して、テキスト記述や画像入力からのSVG生成をサポートし、単純なアイコンから複雑なアニメキャラクターまで幅広いシナリオをカバーします。アイテム ...
11ヶ月前
080.5K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue:VSコードと統合し、モデルと埋め込みをカスタマイズするオープンソースのAIコードアシスタント

一般的な紹介 Continueは、ソフトウェア開発者の効率を向上させるために設計されたオープンソースのAIコードアシスタントです。主な機能として、コードの自動補完、コードの最適化、VS CodeとJetBrains IDE用のインテリジェントなコード提案があります。
1年前
080.5K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展

Plate: 豊富なプラグイン拡張機能をサポートしたAI駆動型リッチテキストエディタ

概要 PlateはReactとTypeScriptで構築されたAI搭載のリッチテキストエディタで、高度にカスタマイズ可能で拡張性の高い編集体験を提供するように設計されています。Slate.jsをコアに利用し、モダンなUIと組み合わせている。
1年前
080.3K
Prompt Optimizer:优化主流AI模型提示词的开源工具

プロンプト・オプティマイザー:主流AIモデルのプロンプト語を最適化するオープンソースツール

概論 Prompt Optimizerは、GitHubのlinshenkxによって開発された、プロンプト単語の最適化に焦点を当てたオープンソースツールです。インテリジェントなアルゴリズムによってAIモデルのプロンプトワードを最適化し、生成されるコンテンツの品質を向上させます。
1年前
080.1K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

概論 RealtimeSTTは、高度な音声アクティビティ検出とウェイクワードアクティベーションを備えた、効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。
1年前
079.9K
OpenSPG:开源知识图谱引擎

OpenSPG: オープンソース知識グラフエンジン

包括的な紹介 OpenSPGは、SPG (Semantic Augmented Programmable Graph)フレームワークに基づいて、Ant GroupがOpenKGと共同で開発したオープンソースの知識グラフエンジンです。このエンジンは、ドメイン知識グラフの構築と管理をサポートするために、 明示的な意味表現、論理ルール定義、運用フレームワークなどの機能を提供するように設計されています...
1年前
079.7K
Agno:构建具备记忆、知识和工具的多模态智能体框架

アグノ:記憶、知識、ツールを備えたマルチモーダルインテリジェンス構築のためのフレームワーク

一般的な紹介 Agnoは、agno-agiチームによって開発され、GitHubでホストされているオープンソースのPythonライブラリで、開発者が記憶、知識、ツールを備えたAIインテリジェンスを簡単に構築できるようにすることに専念しています。マルチモーダルなテキスト、画像、音声、動画をサポートしています。
1年前
079.7K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: ワンクリックで翻訳とダビングができる動画用多言語グローバル化ツール

包括的な紹介 KrillinAIは、ユーザーがビデオを翻訳し、自動的にそれらをダビングするために人工知能を使用することに焦点を当てたオープンソースのビデオ処理ツールです。ビデオのダウンロードから始まり、様々なプラットフォームに適応した完成品の生成まで、全てのプロセスは数クリックで完了します。開発者はGitHubで公開されている。
9ヶ月前
079.5K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix:大規模モデル検索用にコードベースをテキストファイルにパッケージ化

概論 Repomix(以前はRepopackとして知られていた)は、コードベース全体を単一のAIフレンドリーなファイルにパッケージ化するために設計されたオープンソースツールです。このツールにより、開発者は自分のコードベースを大規模な言語モデル(ClaudeやChat...
1年前
079.3K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI:LLMなしで構造化データを抽出するオープンソースの非同期ウェブクローラツール

包括的な紹介 Crawl4AIは、大規模言語モデル(LLM)と人工知能(AI)アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマットを提供します。
1年前
079K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js:AIでブラウザ自動テストを推進するオープンソース・プラグイン

概論 Midscene.jsはAIを搭載したブラウザ自動化ツールで、自然言語コマンドによってウェブページを制御し、アサーションを実行し、データを抽出します。Chrome拡張機能、JavaScript SDK、YAMLスクリプトをサポートし、UI測定を簡素化します。
1年前
078.9K
BiliNote:从视频自动生成Markdown笔记的AI工具

BiliNote:動画からMarkdownノートを自動生成するAIツール

包括的な紹介 BiliNoteは、オープンソースのAIビデオノートツールです。BiliNoteとYouTubeのビデオリンクからコンテンツを抽出し、Markdown形式で明確に構造化されたノートを自動的に生成します。ネイティブの音声トランスクリプションと様々な大規模モデル(例: ...
11ヶ月前
078.8K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得ることを支援するために特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語をサポートします。
1年前
078.4K
Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

包括的な紹介 Smolagentsは、HuggingFaceによって開発された軽量インテリジェントエージェントライブラリで、AIエージェントシステムの開発プロセスを簡素化することに重点を置いています。このプロジェクトは、約1000行のコアコードしかないシンプルな設計思想で知られていますが、強力な機能統合機能を提供しています。このライブラリの最も ...
1年前
078.3K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: 長期記憶に基づくマルチホップ知識検索フレームワーク

概論 HippoRAGはオハイオ州立大学のOSU-NLPグループによって開発されたオープンソースのフレームワークで、人間の長期記憶メカニズムにヒントを得ている。検索拡張生成(RAG)、ナレッジグラフ、パーソナライズドPageRankのテクニックを組み合わせ、大規模な言語モデル...
12ヶ月前
078.3K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk:完全なデジタルヒューマンビデオ生成フレームワーク|ポートレートからビデオへ|ポーズからビデオへ|リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。
1年前
078.2K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing:インテリジェントビデオ多言語AI吹替/翻訳ツール

包括的な紹介 Linly-Dubbingはインテリジェントな多言語AIダビングと翻訳ツールで、高度なAI技術を統合することにより、ユーザーに高品質の多言語ビデオダビングと字幕翻訳サービスを提供するように設計されています。このツールは、特に国際教育、グローバルコンテンツのローカリゼーションやその他のシナリオに適しており、...
1年前
078.2K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock:AI対応株式分析ツール、自分で選んだ株価のリアルタイム監視とAIに基づく詳細分析

総合紹介 go-stockはWailsとNaiveUIで構築されたAI対応株式分析ツールです。このツールは株価のリアルタイム監視が可能で、コストと損益表示、上下アラームプッシュ機能を提供します。すべてのデータはローカルに保存され、ユーザ...
1年前
077.6K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB:スマートなカスタマーサービスと社内ナレッジベースのための、すぐに使えるAIナレッジベースQ&Aシステム

包括的な紹介 MaxKB (Max Knowledge Base) は、大規模言語モデルとRAG (Retrieval Augmented Generation) に基づいたオープンソースの知識ベースQ&Aシステムです。このシステムは、インテリジェントな顧客サービス、企業の内部知識ベース、学術研究および教育やその他のシナリオで広く使用されています。
1年前
077.6K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt:ユニバーサルビデオダウンローダー、YouTube、Vimeo、Twitter、Reddit、SoundCloudなど!

Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するために設計されたオープンソースのメディアダウンローダーです。Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するように設計されたオープンソースのメディアダウンローダです。
1年前
077.5K
Qlib:微软开发的AI量化投资研究工具

Qlib:マイクロソフトが開発したAI定量投資調査ツール

Qlibはマイクロソフトが開発したオープンソースのプラットフォームであり、AI技術を活用してクオンツ投資のリサーチを支援することに主眼を置いている。Qlibは、最も基本的なデータ処理からスタートし、ユーザーが投資アイデアを探求し、使える戦略に変えることをサポートする。このプラットフォームはシンプルで使いやすく、機械学習を使って投資リサーチを改善したい人に適している。
11ヶ月前
077K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror:収益性の高いGrokミラーサイトのワンクリック展開

包括的な紹介 Grok-Mirrorは、操作可能なGrokミラーステーションの構築に基づいた、サーバーレスで迅速なデプロイが可能なGrok3国内ミラーステーションです。Docker経由でワンクリックでローカルのGrokキオスクをデプロイすることができます。GrokはxAIの人工知能です。
11ヶ月前
077K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1:民生用GPUで高画質ビデオを生成する

概要 Wan2.1は、Wan-Videoチームによって開発され、GitHubでオープンソース化されたビデオ生成ツール群で、人工知能技術によってビデオ作成の限界を押し広げることに焦点を当てています。Wan2.1は、高度な拡散変換アーキテクチャに基づいており、独自の時間変化する自己...
1年前
076.9K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI:カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築

一般的な紹介 FlowiseAIは、開発者がカスタムLLM(大規模言語モデル)アプリケーションとAIエージェントを構築するために設計されたオープンソースのローコードツールです。ドラッグ&ドロップのシンプルなインターフェースで、ユーザーはLLMアプリケーションを素早く作成し、繰り返し実行することができます。
1年前
076.8K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: ダイナミックな知識グラフの構築とクエリーツール(時間を考慮したロングメモリプログラム)

一般的な紹介 Graphitiは、getzep社によって開発された、動的で時間を意識した知識グラフの構築とクエリのためのツールです。エンティティ間の複雑で発展的な関係を表現し、時系列、全文、セマンティック、グラフアルゴリズムなど様々な手法でクエリすることができる。
1年前
076.5K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: GeminiモデルAPIはOpenAIフォーマットと互換性があり、リージョン制限を解除し、マルチAPIキーポーリングをサポートする。

包括的な紹介 Gemini Balanceは、FastAPIフレームワークに基づいて開発されたOpenAI APIプロキシサービスで、効率的なマルチAPI Key管理と最適化機能を提供することを目的としている。このプロジェクトはGeminiモデルコールをサポートしており、主な機能にはマルチAPI...
11ヶ月前
076.2K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI:AIにコンピュータの遠隔操作を委ね、自然言語で制御させるオープンソースプロジェクト

一般的な紹介 NeoAIは革新的なオープンソースのAIアシスタントツールで、ユーザーは自然言語対話を通じて簡単にコンピュータを制御・管理することができます。コードを書くことなく、日常的な対話だけでファイルの検索、タスクの自動化、デバイスの管理などを行うことができます。
1年前
076.2K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

ディープライブカム:オープンソースのリアルタイムAI顔交換ツール、リアルタイムでライブ顔交換するための写真

概要 Deep Live Camは、1枚の写真からリアルタイムで顔を置き換え、フェイクビデオを生成できるように設計されたオープンソースの人工知能ツールです。高度なディープラーニングアルゴリズムを使用することで、ライブストリーミングやビデオ通話中にリアルタイムで顔を入れ替えることができ、ユーザーのプライバシーを保護し、楽しさを追加します。
1年前
076.1K
E2B:安全云沙箱中的AI代码运行平台

E2B: 安全なクラウドサンドボックスでAIコードを実行するプラットフォーム

概要 E2Bは、AIが生成したコードを安全なクラウドサンドボックスで実行するために設計されたオープンソースプラットフォームです。幅広いプログラミング言語とフレームワークをサポートし、コード実行のセキュリティと信頼性を確保するために隔離された仮想環境を提供します。E2Bは、データ分割を含む様々なAIアプリケーションシナリオに適しています。
1年前
076.1K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。
1年前
076.1K
Ragas:评估RAG召回QA准确率与答案相关性

ラガス:RAGリコールQA精度と回答の相関性を評価する

包括的な紹介 Ragasは、RAG(Retrieval Augmented Generation)システムの評価と最適化のために特別に設計されたツールです。Ragasは、クエリ、検索コンテキスト、生成された回答間の関係を分析することで、包括的な評価メトリクスのセットを提供します。これらのメトリクスには、忠実度、回答の関連性、コンテキストの関連性、...
1年前
076K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: AIインテリジェンスがウェブをブラウズするためのオープンソースフレームワーク。

概要 ブラウザユースWeb UIは、AIエージェントにグラフィカルインターフェースツールとしてブラウザインタラクション機能を提供することに焦点を当てた革新的なオープンソースプロジェクトです。このプロジェクトは、ブラウザユースコアフレームワークの上に構築されており、Gradio ...
9ヶ月前
075.8K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat:大規模モデルに基づいて構築されたインテリジェント対話ロボット。

総合的な紹介 ChatGPT-on-WeChatプロジェクトは、大きなモデルベースのインテリジェント対話ロボットであり、個人WeChat、WeChatパブリック番号、企業WeChatアプリケーション、Flybook、Nailなどのマルチプラットフォームへのアクセスをサポートしています。ユーザーはGPT3.5、GPT-4、Claude、Man...
1年前
075.8K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: オープンソースツールの音声ポッドキャストを生成するローカルPDF

概要 Local-NotebookLMはオープンソースプロジェクトで、ローカルで動作するインテリジェントな文書処理とコンテンツ生成ツールを提供することを目的としています。Google NotebookLMにインスパイアされ、ユーザーがPDFやその他のドキュメントを様々な...
12ヶ月前
075.8K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。
1年前
075.7K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee:知識グラフベースのRAG構築のためのオープンソースフレームワーク、コアプロンプト学習

概要 CogneeはAIアプリケーションとAIエージェントのために設計された信頼性の高いデータレイヤーソリューションです。LLM(大規模言語モデル)コンテキストのロードと構築を行い、ナレッジグラフとベクトルストアを通じて正確で解釈可能なAIソリューションを作成するように設計されています。このフレームワークは、コスト削減、解釈可能な...
1年前
075.5K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: RMBG 2.0 用に最適化された、画像やビデオの背景を一括除去するオープンソースプログラム。

概論 RMBG-2-Studioは、BRIA-RMBG-2.0モデルに基づいて開発された、背景の除去および置換を行う拡張アプリケーションです。このアプリケーションは、電子商取引、ゲーム、...を含む様々なタイプの画像に対して、効率的で正確な画像背景処理機能をユーザーに提供するように設計されています。
1年前
075.4K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。
1年前
075.2K
Chat2DB:智能生成SQL与数据报表的数据库管理工具

Chat2DB: インテリジェントSQLとデータレポート生成のためのデータベース管理ツール

一般的な紹介 Chat2DBは、CodePhiliaXチームによって開発されたオープンソースのデータベース管理とSQLクライアントツールです、AI機能と統合され、迅速にSQLクエリを記述するためのサポート、データベースを管理し、データレポートを生成し、マルチデータベースとの相互作用。16以上のデータベースをサポートしています。
12ヶ月前
074.8K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

アウトライン: 正規表現、JSON、Pydanticモデルによる構造化テキスト出力の生成

概説 Outlinesは、構造化テキスト生成を通じて大規模言語モデル(LLM)のアプリケーションを強化するために、dottxt-aiによって開発されたオープンソースライブラリです。このライブラリは、OpenAIやトランスフォーマーなど、様々なモデルの統合をサポートしています。
1年前
074.7K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow:Rooコード拡張に基づくメモリ拡張システム

包括的な紹介 RooFlowはオープンソースのAI支援プログラミングツールであり、プロジェクトのロギングを通じて開発中のコード、決定、タスクの進捗を保存するコア機能を備えています。Roo Codeエクステンションをベースに、アーキテクチャ、コーディング、テスト、デバッグ、Q&Aの5つのモードを統合しています。これらのモードは相互に...
11ヶ月前
074.5K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.:コンテキストを考慮したインテリジェントコードアシスタント、コードの生成と修正、マルチIDEサポート

概論 J.A.R.V.I.S. (Just A Rather Very Intelligent System) は、複数の最先端の言語モデルを使用して、開発者のコード生成、修正、技術的なディスカッションを支援するように設計されたインテリジェントなコード・アシスタントです。
1年前
074.5K
Agent S:像人类一样操作电脑的开源智能体框架

エージェントS:人間のようにコンピュータを操作する知的体のためのオープンソース・フレームワーク

一般的な紹介 エージェントSは、Simular AI社によって開発されたオープンソースのフレームワークであり、グラフィカル・ユーザー・インターフェース(GUI)を通じて人間のようにコンピュータを操作することができる。マルチモーダル大規模言語モデルと経験的学習技術を使用して、ウェブの閲覧、文書の編集、ソフトウェアの使用などのタスクを実行する。
11ヶ月前
074.5K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer:プロフェッショナル4コマ漫画イラスト作成ツール、画像生成、漫画ページ編集

概要 SP-MangaEditerは、マンガ制作者のために設計された独立したマンガ編集プラットフォームです。画像生成、レイヤー編集、画像調整、フィルター適用など様々な機能をサポートし、高品質なマンガイラストを簡単に作成することができます。ユーザーは簡単に操作することができます...
1年前
074.4K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI:リージョン制限を回避し、OpenAI互換APIに変換する逆世代Geminiアドレス

一般的な紹介 Gemini OpenAI API Agentは、無料でサーバーのメンテナンスが不要なOpenAI準拠のエンドポイントです。ユーザは、Vercel、Netlify、Cloudflareなどのプラットフォームに、個人で簡単にデプロイすることができます。プロジェクト ...
1年前
074.2K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: AIチャットと描画のためのSpringBootベースのバックエンドフレームワーク

包括的な紹介 RuoYi AIはruoyi-plusフレームワークに基づいて、AIチャットと絵画機能の統合に焦点を当てたバックエンドプロジェクトです。Java17とSpringBoot 3.X技術スタックを使用し、完全にオープンソースで無料です。
1年前
074.1K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose:全工程のプログラミング作業を自動化する、オープンソースのスケーラブルなプログラミング・インテリジェンス

一般的な紹介 GooseはBlock社によって開発されたオープンソースのAIエージェントツールで、開発者が日常的な開発作業を自動化できるように設計されています。さまざまな大規模言語モデル(LLM)をサポートし、コマンドラインやデスクトップアプリケーションのインターフェースを介してユーザーと対話します。
1年前
073.9K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AIヘッジファンド:複雑なヘッジファンド取引の意思決定に複数の知性を利用するオープンソースの自動取引システム

一般的な紹介 AIヘッジファンドは、マルチ・エージェント・システムを利用して取引の意思決定を行う人工知能ヘッジファンドである。このシステムは、マーケット・データ・エージェント、クオンツ・エージェント、リスク管理エージェント、ポートフォリオ管理エージェントなど、複数の専門エージェントと連携し、複雑な取引を実現する。
1年前
073.8K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot:テキスト記述生成のためのAIアシスタント ComfyUIワークフロー

包括的な紹介 ComfyUI-Copilotは、ComfyUIフレームワークのために設計されたAI駆動のカスタムノードで、自然言語対話を通じてAIアルゴリズムのデバッグとデプロイの効率を向上させることを目的としています。AIDC-AIチーム(Alibaba)によって開発され、GitHu...
1年前
073.7K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル(LLM)が音声を生成します。
10ヶ月前
073.5K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: 画像とビデオの顔復元、古い写真の復元、ワンクリック展開版を提供

CodeFormer 概要 CodeFormerは、南洋理工大学S-Labの研究チームによって開発され、NeurIPS 2022で発表された、頑健なブラインド顔修正のためのコードベースである。このプロジェクトでは、Codebook Lookup Transformer (C...
1年前
073.5K
BrowserTools MCP:实时监控浏览器活动的MCP服务

BrowserTools MCP: ブラウザの動作をリアルタイムで監視するMCPサービス

概要 BrowserTools MCPは、AgentDeskAIチームによって開発されたオープンソースプロジェクトです。AIがChromeエクステンションとNode.jsサービスを通じて、ログ、ネットワークリクエスト、ブラウザアクティビティをリアルタイムで監視することを可能にします。
11ヶ月前
073.4K
小红书AI运营助手:自动生成和发布小红书文章

XiaohongshuのAI操作アシスタント:自動的にXiaohongshuの記事を生成し、公開します。

総合紹介 Xiaohongshu AI Operation Assistant(xhsaipublisher)は、Xiaohongshuプラットフォームで記事を公開するために設計された自動化ツールです。このプロジェクトは、グラフィカル・ユーザー・インターフェースと自動化スクリプトを組み合わせ、ビッグモデル技術を使ってコンテンツを生成し、ブラウザ経由で自動的にログインして公開します...
1年前
073.3K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

透かし除去:オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

概論 透かし除去は、機械学習とディープラーニングの技術を画像修復、特に画像から透かしを除去するために使用するオープンソースプロジェクトです。このプロジェクトはChimzuruoke Okaforによって開発され、Con...
1年前
073.3K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: AI生成PPT、プレゼンテーション生成

総合紹介 AiPPTは人工知能技術に基づいたPPT生成ツールで、プロフェッショナルなプレゼンテーションを素早く作成できるように設計されています。テーマを入力したり、ファイルをアップロードしたり、URLを提供したりすることで、内容が豊富で美しくデザインされたスライドを自動的に生成します。
1年前
073.3K
基于Cloudflare Worker的AI图片生成脚本

Cloudflare WorkerベースのAI画像生成スクリプト

概論 CloudFlare-AI-ImageはGitHubでホストされているオープンソースプロジェクトで、Cloudflare Workersプラットフォームを通じて無料のAI画像生成サービスを提供している。CloudFlare-AI-Imageは、CloudFlare Workersプラットフォームを通じて無料のAI画像生成サービスを提供するオープンソースプロジェクトです。
11ヶ月前
073.1K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe:AIにあなたのコンピュータを直接制御させる、クロードの制御コンピュータのオープンソース実装

概要 Agent.exeはオープンソースのElectronアプリケーションで、AnthropicのClaude 3.5 Sonnet APIを利用し、ユーザーがAIを通してローカルコンピューターを直接コントロールできるようにするものです。このプロジェクトは、K...
1年前
073K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換

概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。
1年前
073K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

概要 LiteAvatarはHumanAIGCチーム(Aliの一部)によって開発されたオープンソースツールで、音声によって駆動される2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム(fps)で動作し、特に...
1年前
073K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン

概要 Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使うと、ユーザーはどのウェブページでもサイドバーを開き、ローカルで動作しているAIモデルと対話することができます。
11ヶ月前
072.6K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: Dify APIをベースとしたデスクトップインテリジェントダイアログクライアントで、エンタープライズグレードのAIダイアログ機能を提供します。

包括的な紹介 Dify-WebUIは、Dify APIに基づいた最新のデスクトップインテリジェント対話アプリケーションで、企業に強力なAI対話機能を提供するように設計されています。このアプリケーションは、企業の個々のニーズを満たすために、様々なプリセットテーマカラーをサポートし、ナレッジベース管理機能をサポートします。
1年前
072.6K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトでは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質な音声合成を行うことができます。
1年前
072.4K