AIオープンソースプロジェクト

合計1020記事
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot:テキスト記述生成のためのAIアシスタント ComfyUIワークフロー

包括的な紹介 ComfyUI-Copilotは、ComfyUIフレームワークのために設計されたAI駆動のカスタムノードで、自然言語対話を通じてAIアルゴリズムのデバッグとデプロイの効率を向上させることを目的としています。AIDC-AIチーム(Alibaba)によって開発され、GitHu...
1年前
085.8K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive:教師なしライブ録画、自動スライス、B局用アップロードツール

総合紹介 biliveはB局ライブ録画のために設計されたツールで、非常に高速なライブ録画、自動スライシング、ポップアップレンダリング、字幕生成を提供します。このツールは、超低構成マシンに対応し、7x24時間の無人録画をサポートし、自動的にポップアップと字幕を識別してレンダリングし、自動的にスライスして...
1年前
085.7K
基于Cloudflare Worker的AI图片生成脚本

Cloudflare WorkerベースのAI画像生成スクリプト

概論 CloudFlare-AI-ImageはGitHubでホストされているオープンソースプロジェクトで、Cloudflare Workersプラットフォームを通じて無料のAI画像生成サービスを提供している。CloudFlare-AI-Imageは、CloudFlare Workersプラットフォームを通じて無料のAI画像生成サービスを提供するオープンソースプロジェクトです。
1年前
085.7K
Cog-ComfyUI:使用API运行ComfyUI工作流

Cog-ComfyUI:APIを使ったComfyUIワークフローの実行

一般的な紹介 Cog-ComfyUIは、APIを介してComfyUIワークフローを実行するために設計されたオープンソースプロジェクトです。GitHubユーザーのfofrによって作成されたこのプロジェクトは、ComfyUIワークフローを統合して実行する効率的な方法を提供します。
1年前
085.3K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持

Knowledge Graph Studio (WhyHow): ナレッジグラフの作成と管理のためのオープンソースプラットフォーム。

包括的な紹介 Knowledge Graph Studio (KGS) は、RAGネイティブなナレッジグラフの作成と管理のプロセスを簡素化するために設計されたオープンソースのプラットフォームです。このプラットフォームは、ルールベースのエンティティ解決、モジュール式のグラフ構築、柔軟なデータ...
1年前
084.5K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI:リージョン制限を回避し、OpenAI互換APIに変換する逆世代Geminiアドレス

一般的な紹介 Gemini OpenAI API Agentは、無料でサーバーのメンテナンスが不要なOpenAI準拠のエンドポイントです。ユーザは、Vercel、Netlify、Cloudflareなどのプラットフォームに、個人で簡単にデプロイすることができます。プロジェクト ...
1年前
084.2K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換

概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。
1年前
083.8K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: オープンソースのプログラミングアシスタントツール。

一般的な紹介 Aiderは強力なオープンソースのAIプログラミングアシスタントツールで、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助けます。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitにシームレスに統合することができます...
1年前
083.8K
Mem0:为AI助手和代理提供智能记忆层的开源项目

Mem0: AIアシスタントやエージェントにインテリジェントなメモリレイヤーを提供するオープンソースプロジェクト

概論 Mem0(「メンゼロ」と発音)は、AIアシスタントやエージェントにインテリジェントなメモリーレイヤーを提供するオープンソースプロジェクトである。ユーザーの好みを記憶し、個人のニーズに適応し、時間の経過とともに改善されるため、顧客サポートのチャットボット、AIアシスタント、自律型システムに最適です。
2年前
083.7K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: Dify APIをベースとしたデスクトップインテリジェントダイアログクライアントで、エンタープライズグレードのAIダイアログ機能を提供します。

包括的な紹介 Dify-WebUIは、Dify APIに基づいた最新のデスクトップインテリジェント対話アプリケーションで、企業に強力なAI対話機能を提供するように設計されています。このアプリケーションは、企業の個々のニーズを満たすために、様々なプリセットテーマカラーをサポートし、ナレッジベース管理機能をサポートします。
1年前
083.6K
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API

DDG-Chat:ワンクリックでChat2APIバックエンドをデプロイ、DuckDuckGoをAPIへ

一般的な紹介 DDG-Chat は、ワンクリックで複数のプラットフォームにデプロイできる ChatGPT API バックエンドを提供することを目的としたオープンソースプロジェクトです。このプロジェクトは、GPT-4o mini、Claude 3 Haiku、Llam...を含む複数のモデルをサポートしています。
1年前
083.4K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: AIチャットと描画のためのSpringBootベースのバックエンドフレームワーク

包括的な紹介 RuoYi AIはruoyi-plusフレームワークに基づいて、AIチャットと絵画機能の統合に焦点を当てたバックエンドプロジェクトです。Java17とSpringBoot 3.X技術スタックを使用し、完全にオープンソースで無料です。
1年前
083.4K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: AndroidのためのMNNマルチモーダル言語モデリング

包括的な紹介 MNN(Mobile Neural Network)は、アリババが開発し、モバイルデバイス向けに最適化された、効率的で軽量なディープラーニングフレームワークである。MNNは、モバイルデバイス上で高速な推論が可能なだけでなく、テキスト生成などのマルチモーダルなタスクもサポートしている...
1年前
083K
文多多 AiPPT:AI生成PPT,演讲稿生成

Wenduoduo AiPPT: AI生成PPT、プレゼンテーション生成

総合紹介 AiPPTは人工知能技術に基づいたPPT生成ツールで、プロフェッショナルなプレゼンテーションを素早く作成できるように設計されています。テーマを入力したり、ファイルをアップロードしたり、URLを提供したりすることで、内容が豊富で美しくデザインされたスライドを自動的に生成します。
1年前
083K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: 自律実行型マルチインテリジェントの構築、完全機能のオープンソースAIインテリジェントボディ開発フレームワーク

包括的な紹介 Elizaは先進的なマルチインテリジェントボディ(マルチエージェント)開発フレームワークで、自律的なインテリジェントボディ(自律エージェント)の構築と展開プロセスを簡素化することに取り組んでいます。異なる役割設定を持つ複数のインテリジェントボディの配置をサポートし、インテリジェントな...
1年前
082.5K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT

PPTAgent: PPTプレゼンテーション、ドキュメントからPPTへの自動生成と評価

概要 PPTAgentは、ドキュメントからプレゼンテーションを自動生成する革新的なシステムです。このシステムは、プレゼンテーションの作成における人間のアプローチを取り入れ、コンテンツの品質と視覚的なインパクトを確保するための2段階のプロセスを採用しています。さらに、PPTAgentはPPTEvalを導入しています。
1年前
082.4K
GraphRAG-Dify:让Dify具备GraphRAG能力

GraphRAG-Dify:DifyにGraphRAGの機能を装備する

包括的な紹介 GraphRAG-Difyは、GraphRAGとDifyの技術を組み合わせて、AIエージェントを素早く作成し、デプロイするために設計されたオープンソースプロジェクトです。このプロジェクトでは、サービス構築にFastAPIとUvicornを使用し、DSLのインポートをサポートしています。
1年前
082.3K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: PPTXファイルをMarkdownに変換する特別なツール

概要 PPTX2MDは、PowerPointのPPTXファイルをMarkdown形式に変換するために設計されたオープンソースツールです。GitHubユーザーのssine氏によって開発されたこのツールは、見出し、リスト、テキストフォーマット(例:太字、斜体、色、スーパー...)を保持することをサポートしています。
1年前
082.3K
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio:マルチエージェントシステムAutoGenの使いやすいインターフェイス版

概要 AutoGen Studio 2.0は、マルチエージェント・ソリューションの作成と管理のプロセスを簡素化するために設計されたAutoGenによるユーザー・インターフェースです。このプラットフォームでは、直感的なインターフェースを通じて、エージェントとそのワークフローを宣言的に定義および変更することができます...
1年前
082.2K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot:ニュースプッシュ、AI対話、グループチャット管理のためのWeChatボット

包括的な紹介 NGCBotはWeChatロボットオープンソースプロジェクトの開発に基づくHOOKメカニズムであり、開発者ngc660sec(Yunshan/eXM)によって作成され、GitHub上でホストされている 反復の2年後、V2.3の現在のバージョンは、最初のシンプルな機能から...
1年前
082.2K
Stagehand:自然语言实现浏览器自动化操作框架

Stagehand: ブラウザオートメーション操作の自然言語実装フレームワーク

一般的な紹介 Stagehand は、シンプルさと拡張性に重点を置いた AI ウェブブラウジングフレームワークである。Playwrightと完全に互換性があり、3つのシンプルなAI API(act、extract、observe)を提供する。
1年前
082.1K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス

概論 CAD-MCPはオープンソースプロジェクトであり、ユーザが自然言語コマンドによってCADソフトウェアを制御し、描画操作を行うことを可能にします。自然言語処理とCAD自動化技術を組み合わせ、ユーザーが手動でCADインターフェイスを操作する必要がなく、簡単なテキストコマンドを入力するだけで、CADソフトウェアを操作することができます。
12ヶ月前
082.1K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT:自然言語プログラミングのためのAIソフトウェア開発チーム構築のための多知能コラボレーションフレームワーク

包括的な紹介 MetaGPTは、完全なAIソフトウェア会社の運営をシミュレートするために設計された革新的なマルチインテリジェンス体のフレームワークです。geekan(アレクサンダー・ウー)によって作成されたこのプロジェクトの目標は、異なる役割を持つGPTモデルを協調的なエンティティに結合することです...
1年前
082K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID:画像をアップロードし、さまざまなスタイルの画像を生成するためにポートレート機能を移行する。

包括的な紹介 InstantIDは、1枚の参照ID画像を使用して、高い忠実度を確保しながら、パーソナライズされたスタイルやポーズの画像を数秒で生成することに焦点を当てた先進技術です。この技術は、顔画像とランドマークマップを統合することで、拡散モデルに基づいたソリューションを使用しています。
2年前
081.9K
Search-R1:强化学习训练大模型搜索与推理的工具

Search-R1: 検索と推論のための大規模モデルを学習する強化学習

概要 Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトであり、veRLフレームワーク上に構築されている。強化学習(RL)技術によって大規模言語モデル(LLM)を学習し、モデルが自律的に学習することを可能にします...
1年前
081.9K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデル

包括的な紹介 InternVLは、上海人工知能研究所(OpenGVLab)によって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルプロジェクトです。視覚処理と言語処理の機能を統合し、画像、動画、テキストの包括的な理解と生成をサポートします。
1年前
081.9K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用

Steel Browser: ブラウザ操作を制御するインテリジェンスとアプリケーションを構築する自動ウェブブラウザAPI

概要 Steel Browserは、AIエージェントとアプリケーションのために設計されたオープンソースのブラウザAPIです。Steel Browserは、インフラストラクチャを気にすることなくウェブ操作を自動化できるフルブラウザインスタンスを提供します。
1年前
081.8K
Orama:高性能全文本和向量搜索引擎

Orama:高性能な書籍・ベクトル全文検索エンジン

概説 Oramaはオープンソースの高性能検索エンジンで、すべてTypeScriptで記述されており、全文検索、ベクトル検索、ハイブリッド検索をサポートしている。OramaはあらゆるJavaScript実行環境で動作するように設計されており、高速で信頼性の高い検索を提供する。
1年前
081.8K
无服务器快速部署Grok3国内镜像站

サーバーレス高速デプロイ Grok3国内ミラーサイト

概要 Grok Playgroundは、"Technical Crawling Shrimp "のチームによって開発されたオープンソースプロジェクトである。このツールの主な機能は、ユーザーがGrok3の国内ミラーサイトを10秒でデプロイできるようにすることです。 Grok3はxAIによって導入された人工知能モデルで、...
1年前
081.7K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2:高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE(Mixture-of-Experts)視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...
1年前
081.3K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light(V2):画像照明制御マジック、画像の光と影、背景を制御する

包括的な紹介 IC-Lightは画像照明制御のためのプロジェクトであり、高度なAIモデルによって画像の照明効果を操作することを目的としている。Lvmin Zhangらによって開発されたこのプロジェクトは、2つの主要なモデルを提供する:テキスト条件付き再照明モデルと背景条件付きモデル。ユーザは、このモデルを使って...
1年前
081.2K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)

Anon-Kode:コマンドラインAIコード・アシスタント(クロード・コードのコード分解)

一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。
1年前
080.8K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包

クローンボイス:Windows用のxtts_v2をベースにした多言語、サンプルレス音声クローンツール。

一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは、NVIDIA GPUがなくても簡単に使用でき、コンパイル済みのアプリで使用できます。
2年前
080.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev:多言語対応のコード自動生成・デバッグツール

概要 AutoDevは、Unit Meshチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、人工知能技術によって開発者のプログラミング効率を向上させることを目的としています。強力なコーディングアシスタントであり、Ja...を含む複数のプログラミング言語をサポートしている。
1年前
080.7K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent:モバイル機器操作アシスタントのためのマルチエージェント・コラボレーション

一般的な紹介 MobileAgentは、マルチエージェントコラボレーションと強化された視覚認識モジュールにより、モバイルデバイス操作の効率と自動化を改善するために設計された強力なモバイルデバイス操作アシスタントです。X-PLUGチームによって開発され、Androidと...
1年前
080.5K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent:AI技術によりデータ駆動型研究開発プロセスを促進する自動化されたデータ駆動型研究開発ツール

一般的な紹介 RD-Agentは、研究開発(R&D)プロセスを自動化し最適化するために設計されたMicrosoftのオープンソースツールです。RD-Agentは、研究開発プロセスを自動化し、最適化するために設計されたMicrosoftのオープンソースツールです。このツールは、人工知能技術によってモデルとデータ開発の効率を向上させるデータ駆動シナリオに焦点を当てています。
1年前
080.4K
Moffee:将Markdown转为PPT幻灯片

Moffee:マークダウンをPPTスライドショーに変換する

一般的な紹介 Moffeeは、Markdownファイルを素早く、簡単かつ効率的にプロフェッショナルなスライドショーに変換するオープンソースツールです。ユーザはMarkdownコンテンツを書くだけで、Moffeeはレイアウト、ページ分割、スタイルを自動的に処理し、手作業でタイプセットする必要がなくなります。
1年前
080.3K
Abogen:将多种文本格式转换为有声读物的工具

Abogen:複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...
12ヶ月前
080.3K
阿布量化交易系统:基于Python的开源量化交易平台

アブ・クオンツ取引システム:Pythonベースのオープンソース・クオンツ取引プラットフォーム

一般的な紹介 Abu Quantitative Trading System は、Python ベースのオープンソースプラットフォームです。投資家がコードを通じて定量的取引戦略を実行できるよう、ユーザー「bbfamily」によって作成されました。このシステムは、株式、オプション、先物、ビットコインなどの様々な金融商品のバックテストと取引をサポートしています。これは...
1年前
080.2K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF、DOCX、Markdownへの画像変換、ビジュアルモデル高精度OCR

一般的な紹介 Zeroxは、ビジュアルモデルを通してPDF、DOCX、画像やその他のドキュメントをMarkdown形式に変換するために設計されたオープンソースプロジェクトです。このプロジェクトはgetomni-aiチームによって開発され、シンプルで効率的なOCR(光学式文字認識)ソリューションを提供します。
1年前
079.8K
FreeAI:基于Pollinations封装的的免费AI工具

FreeAI: PollinationsパッケージをベースにしたフリーのAIツール。

概要 FreeAIは、Pollinations.AI APIをベースとしたオープンソースのAIアプリケーションプラットフォームで、無料で無制限のAIチャットアシスタント、画像生成、音声合成サービスを提供している。このプロジェクトは、開発者のAzad-slによってG...
1年前
079.8K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール

包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。
1年前
079.8K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: 実験的音声合成モデル、純粋な言語モデリングアプローチで実装されたTTS

包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成(TTS)モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルは、LLaMaアーキテクチャに基づいています。
1年前
079.5K
VLM-R1:通过自然语言定位图像目标的视觉语言模型

VLM-R1:自然言語による画像ターゲットの位置決定のための視覚言語モデル

包括的な紹介 VLM-R1は、Om AI Labによって開発され、GitHubでホストされているオープンソースの視覚言語モデリングプロジェクトです。このプロジェクトは、DeepSeekのR1アプローチとQwen2.5-VLモデルを強化学習によって組み合わせたものです。
1年前
079.5K
Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程

オープンR1:ハグする顔がDeepSeek-R1のトレーニングプロセスを再現

一般的な紹介 Hugging FaceのOpen R1プロジェクトは、完全にオープンソースのDeepSeek-R1複製プロジェクトであり、R1パイプラインの欠けている部分を構築し、誰もが複製して構築できるようにすることを目的としています。プロジェクトはシンプルに設計されており、主にトレーニングと評価で構成されています。
1年前
079.3K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit:自然言語指示による画像編集のためのオープンソースツール

一般的な紹介 Step1X-Editは、Stepfun AIチームによって開発され、GitHubでホストされているオープンソースの画像編集フレームワークです。マルチモーダル大規模言語モデル(Qwen-VL)と拡散変換器(DiT)を組み合わせることで、ユーザーはシンプルで自然な操作で画像を作成することができます。
12ヶ月前
079.2K
Klee:桌面本地运行AI大模型并管理私人知识库

Klee:デスクトップ上でAIマクロモデルをローカルに実行し、プライベート知識ベースを管理する

概論 Kleeはオープンソースのデスクトップアプリケーションで、オープンソースの大規模言語モデル(LLM)をローカルで実行し、安全なプライベート知識ベース管理とMarkdownノートテイク機能を利用できるように設計されています。OllamaとLlamaIndexの技術に基づいています。
1年前
079.2K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers:大規模モデル推論パフォーマンス・エンジン:極限の加速、柔軟な権限付与

KTransformers:大規模モデル推論のボトルネックを克服するための高性能Pythonフレームワーク。 KTransformersは、単なるモデル実行ツールにとどまらず、極めて優れたパフォーマンス最適化エンジンのセットであり、柔軟なインターフェース強化プラットフォームでもあります。 KTransf...
1年前
079.1K
AgenticSeek:完全本地运行的任务自动化AI助手

AgenticSeek:完全にローカルで動作するタスク自動化のためのAIアシスタント

概要 AgenticSeekは、完全にローカルで動作するオープンソースのAIアシスタントで、Deepseek R1モデルに基づいています。クラウドAPIを必要とせず、数百ドルの月額費用もかかりません。映画の「ジャービス」のような知的アシスタントを目指しています。
1年前
079K
AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端

AsrTools:音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント

包括的な紹介 AsrToolsはCutscene、Racer、Must Cutなどの大手メーカーのインタフェースを内蔵したインテリジェントな音声テキスト変換ツールです。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の単語を出力することができます。
2年前
079K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent:AIインテリジェンスを迅速に構築するためのTypeScriptオープンソースフレームワーク

概要 VoltAgentはオープンソースのTypeScriptフレームワークで、AIインテリジェンスの迅速な構築とオーケストレーションを支援するために開発者向けに設計されている。モジュール化されたツールと標準化された開発モデルを提供することで、大規模な言語モデル(LLM)、ステート...
12ヶ月前
078.8K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter:単一の画像から一貫性のある文字を生成するオープンソースツール

概要 InstantCharacterは、Tencent HunyuanとInstantXチームによって開発されたオープンソースプロジェクトで、GitHubでホストされています。InstantCharacterは、参照画像とテキスト説明文を含む、一貫性のある文字マップを生成します。
12ヶ月前
078.7K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX:話者から切り離された自動音声認識により、高精度の単語レベルのタイムスタンプを提供

はじめに BetterWhisperXは、効率的で正確な自動音声認識(ASR)サービスを提供することに重点を置いたWhisperXプロジェクトの最適化バージョンです。WhisperXの改良版として、このプロジェクトはFederico ...
1年前
078.6K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI: SOC 2、ISO 27001、GDPR コンプライアンスを自動化するオープンソースプラットフォーム

概要 Comp AIは、米国サンフランシスコに本社を置くComp AI社によって開発されたオープンソースのプラットフォームです。自動化されたツールにより、SOC 2、ISO 27001、GDPRなどのコンプライアンス要件を迅速に完了することができます。
1年前
078.5K
CrewAI:多角色扮演协作智能框架,简化复杂任务

CrewAI:複雑なタスクを簡素化するマルチロールプレイ協調知能フレームワーク

包括的な紹介 CrewAIは、ロールプレイングと自律型AIエージェント間のコラボレーションをオーケストレーションするために設計された高度なフレームワークです。コラボレーションインテリジェンスを促進することで、CrewAIはエージェントがシームレスに連携して複雑なタスクを解決することを可能にします。インテリジェントアシスタントプラットフォームの構築、カスタマーサービスチームの自動化、マルチエージェント...
1年前
078.5K
Motia:用代码快速构建智能体的开发框架

Motia: コードでインテリジェンスを迅速に構築するための開発フレームワーク

一般的な紹介 Motiaは、GitHubでホストされ、MotiaDevチームによって開発された、ソフトウェアエンジニアのためのオープンソースのAIエージェントフレームワークです。開発者は使い慣れたプログラミング言語(例:Python、TypeScript、Rub...
1年前
078.4K
Dia:生成超现实多人对话的文本转语音模型

Dia:超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成(TTS)モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。
1年前
078.3K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全

NSFW Detector: ファイルにNSFWコンテンツが含まれているかどうかを検出し、データのセキュリティを保護します。

包括的な紹介 NSFW DetectorはAIベースの不快コンテンツ検出ツールで、主に画像、動画、PDFファイルなどに不快コンテンツが含まれているかどうかを検出するために使用されます。このツールは、Falconsai/nsfwimagedetectio...を使用しています。
1年前
078.3K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use:AIインテリジェントがブラウザを簡単に操作するためのインテリジェント・ウェブ・オートメーション・ツールの構築

包括的な紹介 Browser-Useは、言語モデル(LLM)がウェブサイトと自然に対話できるように特別に設計された、革新的なオープンソースのウェブ自動化ツールです。強力で柔軟なフレームワークを提供し、GPT-4、Claud...などの主流の言語モデルを幅広くサポートします。
1年前
078.3K
Local Deep Research:本地运行的生成深度研究报告工具

ローカル・ディープ・リサーチ:詳細な調査レポートを作成するためのローカルで実行可能なツール

一般的な紹介 Local Deep Research は、ユーザが深い研究を行い、複雑な問題に対する詳細なレポートを作成するために設計されたオープンソースの AI 研究アシスタントです。ローカルでの実行をサポートしており、ユーザーはクラウドサービスに依存することなく研究タスクを完了することができます。このツールは ...
12ヶ月前
078.1K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

ファブリック:AIオープンソースのワークフローフレームワークで、多くのキューワードを統合し、様々なトランザクションを効率的に処理する。

概論 ファブリックは、ダニエル・ミースラーによって開発されたオープンソースのAIフレームワークで、日常的なコンピュータ・タスクを簡素化・自動化し、人工知能を使いやすくすることを目的としている。モジュール設計とあらかじめ定義されたプロンプトワード(パターン)によって、ユーザーを効率的に支援する。
2年前
078K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: 金融分析と予測のためのオープンソース金融ビッグ言語モデリング・プラットフォーム

概論 FinGPTは、AI4Finance財団によって開発されたオープンソースの金融ビッグ言語モデリング・プラットフォームであり、複雑な金融タスクを解決し、フィンテックにおけるイノベーションを推進するために金融セクター向けに設計されている。FinGPTは、軽量適応技術と強化学習アプローチを利用している。
1年前
078K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ツールコール、コードインタプリタ、RAG、Chrome拡張機能を含む、インテリジェントエージェントアプリケーションのためのQwenベースのフレームワーク。

包括的な紹介 Qwen-Agent は、Qwen 2.0 以降をベースに開発されたインテリジェントエージェントアプリケーションフレームワークで、コマンドフォロー、ツール使用、プランニング、メモリなどの機能を備えています。このフレームワークは、ブラウザアシスタント、コードインタプリタ、カスタムアシスタントのような様々なサンプルアプリケーションを提供します。
1年前
077.8K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: ツリーベースの会話を可視化するAIチャットインターフェース

概要 TreeGPTは、Next.jsをベースとしたオープンソースのチャットアプリケーションです。大規模な言語モデル(LLM、GPTなど)の会話を、ツリーグラフ構造(有向非循環グラフ、DAG)を通して可視化することに重点を置き、従来の直線的なチャット手法に取って代わることで、スピードと...
1年前
077.8K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室(HKUST Audio)が開発したオープンソースの音声合成(TTS)モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。
1年前
077.8K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio:マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話(例:中国語、英語、日本語)、感情音声(例:嬉しい、悲しい)、地域方言(例:広東語、四川語、中国語、英語、日本語)をサポートしています。
1年前
077.5K
Magic MCP:生成现代化UI组件的MCP服务

Magic MCP: モダンなUIコンポーネントを生成するMCPサービス

一般的な紹介 Magic MCPは21st.devチームによって開発されたAI駆動ツールで、フロントエンド開発者のために設計されています。自然言語の記述からモダンなUIコンポーネントをオンザフライで生成し、Cursor、WindSurfと統合します。
1年前
077.5K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。

OpenWebUI-Monitor:OpenWebUIのユーザーアクティビティを監視し、使用量の制限を管理し、ワンクリックのデプロイをサポートします。

概要 OpenWebUI-Monitorは、OpenWebUIユーザーのアクティビティを監視し、使用クォータを管理するためのダッシュボードです。ユーザークォータを効率的に設定し、ユーザデータと視覚的な情報をリアルタイムで表示することができ、ワンクリックのデプロイをサポートし、ユーザ管理と監視を容易にします。
1年前
077.2K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: オープンソースの無制限キャンバス・ホワイトボードSDK、最小限のワイヤーフレームとUMLダイアグラムを生成するAI

一般的な説明 tldraw は、ユーザーが素早くグラフィックを描いたり、テキストを書き込んだり、即座に共同作業ができる無制限のキャンバスを提供する、無料で即座に共同作業ができるドローツールです。直感的なインターフェースと優れたパフォーマンスが特徴で、チームコラボレーションやリモートワークに適しています。オープンソースコミュニティを通じてサポートされているtldr...
1年前
077.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

AIが本を読む:AIがPDFの本を1ページずつ読み、知識の要点を自動的に抽出し、要約を生成する。

包括的な紹介 AI-reads-books-page-by-pageはPythonベースのインテリジェントなPDFブック分析ツールで、PDFブックのページごとの分析を自動化し、重要な知識ポイントを抽出し、指定されたページ間隔の後にフェーズを生成します...
1年前
077.2K
Agent TARS:使用视觉和命令操作电脑的开源智能体

エージェントTARS:視覚とコマンドを使ってコンピュータを操作するオープンソースのインテリジェンス

総合紹介エージェントTARSは、ByteDance社がオープンソース化したマルチモーダルAIインテリジェンスで、ウェブコンテンツを視覚的に理解し、コマンドラインとファイルシステム操作を組み合わせることで、ユーザーが複雑なコンピュータタスクを完了するのを支援するコア機能を備えています。従来のツールのような手動操作を必要とせず、自己...
1年前
076.8K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント

総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル(DeepSeek、Gemini、Tongyi Thousand Questionsなど)をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...
1年前
076.8K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

AI投資システム:市場データを分析するマルチインテリジェンスシステムを利用したA株投資の自動意思決定システム

総合紹介 A_Share_investment_Agentは、マルチインテリジェンスシステムに基づくA株投資判断支援システムです。このシステムは、市場データの分析、銘柄の本質的価値の計算、市場心理の分析、複数の協調知能を通じたファンダメンタルズデータの分析を行うように設計されており、...
1年前
076.7K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: デジタルマンインテグレーションシステムのオープンソースクローン。

総合紹介 AigcPanelは、electron+vue3+typescriptの技術スタックで開発され、Windows上でワンクリックで展開できる、すべてのユーザーのためのワンストップAIデジタルヒューマン制作システムです。AigcPanelは、ユーザーフレンドリーな設計を核心としており、...
1年前
076.7K
WeClone:用微信聊天记录和语音训练数字分身

WeClone:WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成

総合的な紹介 WeCloneは、WeChatのチャット記録と音声メッセージを、大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使ってリアルな音声を生成することができます。
1年前
076.7K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: 画像や動画から背景を高速除去するディープラーニングモデル

包括的な紹介 BEN2(Background Erase Network 2)は、Prama LLCによって開発されたディープラーニングモデルで、特に画像から背景を自動的に除去し、前景画像を生成するように設計されています。このモデルは革新的なConfiden...
10ヶ月前
076.7K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型

Kolorsバーチャル試着:効率的なバーチャル試着/モデル着せ替え、テキストから画像生成モデル

概要 Kolors Virtual Try-Onは、Kwai-KolorsチームによるHugging Faceプラットフォーム上のバーチャル試着アプリです。このアプリは、高度な人工知能技術を使って、ユーザーがバーチャル試着をするのを手助けします。
1年前
076.6K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑

TRELLIS:複数のフォーマットをサポートし、柔軟な編集が可能なマイクロソフト開発の3Dアセット生成モデル

概 要 TRELLISは、マイクロソフトが開発した大規模3Dアセット生成モデルです。テキストや画像のプロンプトを受け取り、ラジアルフィールド、3Dガウシアン、メッシュなど、さまざまな形式で高品質な3Dアセットを生成することができます。TRELLISの中核をなすのは、統一された構造化潜在...
1年前
076.6K
multi-model-bolt.new:基于 Bolt.new 的开源修改版,AI驱动的全栈开发工具

multi-model-bolt.new:AI駆動型フルスタック開発ツールBolt.newをベースとしたオープンソース修正版

一般的な説明 multi-model-bolt.newは、TogetherAIモデルの使用を可能にするBolt.newの改良版で、展開、モバイル応答、音声入力などの機能をサポートしています。ユーザーは、ブラウザーで直接プロンプトを表示したり、...
1年前
076.6K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdownエディタ:シンプルで効率的なWeChatグラフィックレイアウトツール、WeChat公開番号に記事を貼り付けるためのキー

総合紹介 WeChat Markdown Editor (WeChat Markdown Editor)は、ユーザーが簡単に美しいWeChat投稿を作成できるように設計された、非常に簡潔なWeChatグラフィックレイアウトツールです。このエディタはすべての基本的なMarkdown ...
1年前
076.5K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器

非構造化:オープンソースの非構造化ドキュメントの前処理、非構造化データ処理ツール

包括的な紹介 Unstructured-IOは、画像やPDF、HTML、Word文書などのテキスト文書を処理・前処理するためのオープンソースコンポーネントのセットを提供します。その主な目的は、特に大規模な言語モデル(LL...
2年前
076.5K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具

MediaCrawler: マルチソーシャルメディアプラットフォームコンテンツ、ビデオコメントクローラーツール

概要 MediaCrawlerは、開発者向けに設計されたソーシャルメディアコンテンツのクローラーツールです。強力なクローラー機能を提供することで、Xiaohongshu、Shake、Shutter、B、Weiboなどのソーシャルプラットフォームから動画、画像、コメント、いいね、リツイートなどのデータを素早く取得することができます。
2年前
076.4K
A2A:谷歌发布AI智能间通信的开放协议

A2A:グーグル、AIインテリジェンス間の通信のためのオープンプロトコルを公開

概要 A2A (Agent2Agent)は、異なるフレームワークやベンダーによって開発されたAIインテリジェンスが相互に通信し、コラボレーションすることを可能にするためにGoogleによって開発されたオープンソースプロトコルである。このプロトコルは、インテリジェンスが互いの能力を発見し、タスクを共有し、作業を完了するための標準化された一連の方法を提供する。
1年前
076.4K