AIオープンソースプロジェクト

合計1020記事
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: 高品質の線画とスケッチを生成、イメージキューワードをバックプロパゲート、ワンクリックパッケージインストール

概要 Sketch-Genは、アーティストやデザイナーが高品質な線画やスケッチを素早く生成できるように設計された、AI技術ベースの線画・スケッチ生成ツールです。Paints-UNDOプロジェクトから生まれたこのツールは、高度な機械学習モデルを使用しています。
8ヶ月前
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V:多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。深く圧縮された可変オートエンコーダ(VAE)により、このモデルは...
6ヶ月前
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。

包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース(GUI)を提供します。
8ヶ月前
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak:LLMの脆弱性を検出し、安全な生成AIを実現するオープンソースツール

包括的な紹介 NVIDIA Garakは、大規模言語モデル(LLM)の脆弱性を検出するために特別に設計されたオープンソースツールです。静的、動的、適応的なプロービングを通して、イリュージョン、データリーク、ヒントインジェクション、エラーメッセージ生成、有害コンテンツ生成などの複数の弱点がないかモデルをチェックします。
9ヶ月前
02.7K
Coding Agent:基于Langgraph构建的简单编程助手

コーディング・エージェント:Langgraph上に構築されたシンプルなプログラミング・アシスタント

概要 Coding AgentはAbhinavTheDevによって開発されたインテリジェントなプログラミングアシスタントで、開発者のプログラミング効率を向上させるために設計されています。このツールは、人工知能技術を使用して、コードを自動的に生成し、プログラミングの提案を行い、さまざまなコーディングで開発者を支援します。
7ヶ月前
02.7K
AIEvo:创建多智能体协作应用的高效框架

AIEvo:マルチインテリジェントな協調アプリケーションを作成するための効率的なフレームワーク

概要 AIEvoは、Ant Groupのオープンソースマルチエージェントフレームワークで、 マルチエージェントアプリケーションを効率的に作成するために設計されています。このフレームワークは、複雑なタスクの実行成功率を向上させるために、 SOPタスクグラフに厳密に従います。また、フィードバックと監視機構により、高い柔軟性とスケーラビリティを保証します。
7ヶ月前
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介 中国語DeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された、110Kのデータを含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的なデータだけでなく、一般的なタイプのデータも多数含まれている。
6ヶ月前
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツール

一般的な紹介 PDF Craftは、書籍のPDFをスキャンしてMarkdown形式に変換するために設計されたオープンソースツールです。このツールはoomol-labによって開発され、電子書籍を整理したいユーザのためにGitHubでホストされています。このツールは、以下の方法で動作します。
5ヶ月前
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント

総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル(DeepSeek、Gemini、Tongyi Thousand Questionsなど)をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...
6ヶ月前
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: ノードオーケストレーションに基づくAIモデルのワークフロー可視化クライアント

概要 NodeToolは、AI愛好家、開発者、データサイエンティスト、クリエイターにシンプルで直感的なインターフェイスを提供するように設計された革新的なAIオーサリングプラットフォームです。アーティスト、開発者、初心者を問わず、NodeToolはクリエイティブなプロトタイプを素早く作成するのに役立ちます。
8ヶ月前
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: AIインテリジェンスをSolanaプロトコルに接続するためのオープンソースツールキット

概要 Solana Agent Kitは、AI知能をSolanaブロックチェーン・プロトコルにシームレスに接続するために設計されたオープンソースのツールキットである。このキットにより、AI研究者と暗号通貨開発者の双方が、モデル訓練された知的体を使用して、ブロックチェーン上で...
6ヶ月前
02.7K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev:ワイヤーフレームをアップロードしてLlama4ベースのフロントエンドコードを生成する

一般的な紹介 Napkins.devはフリーのオープンソースプロジェクトです。コア機能は、ユーザーがインターフェイスのスクリーンショットやワイヤーフレームをアップロードして、実行可能なフロントエンドコードを自動的に生成できるようにすることです。ユーザーはデザイン画を提供するだけでよく、ツールはLlama 4モデル(by Together ...
4ヶ月前
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdownエディタ:シンプルで効率的なWeChatグラフィックレイアウトツール、WeChat公開番号に記事を貼り付けるためのキー

総合紹介 WeChat Markdown Editor (WeChat Markdown Editor)は、ユーザーが簡単に美しいWeChat投稿を作成できるように設計された、非常に簡潔なWeChatグラフィックレイアウトツールです。このエディタはすべての基本的なMarkdown ...
7ヶ月前
02.7K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: 非構造化データと複雑なクエリのための検索エンジン

概要 dsRAGは、非構造化データに対する複雑なクエリを処理するために設計された高性能検索エンジンである。dsRAGは、財務報告書、法律文書、学術論文など、高密度なテキストに含まれる難易度の高いクエリに対して特に優れた性能を発揮する。dsRAGは性能を向上させるために3つの主要なアプローチを採用している。
6ヶ月前
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG(Retrieval Augmentation Generation)システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。
6ヶ月前
02.7K
基于Wan2.1为ComfyUI提供视频生成能力的插件

Wan 2.1に基づくビデオ生成機能を提供するComfyUI用プラグイン

一般的な紹介 ComfyUI-WanVideoWrapperは、ComfyUIプラットフォーム用に設計された、開発者kijaiによって作成されたオープンソースのプラグインです。WanVideoのWan2.1モデルに基づいており、強力なビデオ圧縮機能を提供します。
5ヶ月前
02.7K
Agno:构建具备记忆、知识和工具的多模态智能体框架

アグノ:記憶、知識、ツールを備えたマルチモーダルインテリジェンス構築のためのフレームワーク

一般的な紹介 Agnoは、agno-agiチームによって開発され、GitHubでホストされているオープンソースのPythonライブラリで、開発者が記憶、知識、ツールを備えたAIインテリジェンスを簡単に構築できるようにすることに専念しています。マルチモーダルなテキスト、画像、音声、動画をサポートしています。
5ヶ月前
02.6K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: オープンソースLLMプログラミング能力比較アリーナ、最適なコード生成モデルをリアルタイム表示

一般的な紹介 CodeArenaは、リアルタイムの対決を通じて最高のオープンソースコード生成モデル(LLM)を紹介するために設計されたユニークなプラットフォームです。ユーザーは、異なる LLM が同じプログラミング・タスクで競い合う様子を見たり、リアルタイム・リーダーボードを通じて最高のパフォーマンスを発揮したモデルを見ることができます。このプラットフォームは、Togetter...
8ヶ月前
02.6K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)

Anon-Kode:コマンドラインAIコード・アシスタント(クロード・コードのコード分解)

一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。
5ヶ月前
02.6K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: ニュースのタイムライン要約ツールでニュースの検索とタイムライン生成の効率を改善

一般的な紹介 CHRONOSはAlibaba NLPチームによって開発されたニュースタイムライン要約ツールです。CHRONOSはオープンドメインのタイムライン要約タスクを処理できるだけでなく、効率性とスケーラビリティの面でも優れています。
7ヶ月前
02.6K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス

概論 CAD-MCPはオープンソースプロジェクトであり、ユーザが自然言語コマンドによってCADソフトウェアを制御し、描画操作を行うことを可能にします。自然言語処理とCAD自動化技術を組み合わせ、ユーザーが手動でCADインターフェイスを操作する必要がなく、簡単なテキストコマンドを入力するだけで、CADソフトウェアを操作することができます。
3ヶ月前
02.6K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデル

包括的な紹介 InternVLは、上海人工知能研究所(OpenGVLab)によって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルプロジェクトです。視覚処理と言語処理の機能を統合し、画像、動画、テキストの包括的な理解と生成をサポートします。
4ヶ月前
02.6K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow:カートゥーンシェーディング、白黒画像の自動シェーディングによる画像の色の一貫性と品質の向上

包括的な紹介 ColorFlowは、Tencent ARCチームによって開発された画像シーケンスの自動カラーリングツールで、白黒画像シーケンスの自動カラーリングの問題を解決します。このツールは、検索で強化されたシェーディングパイプラインを使用して、キャラクターの髪の色やサービスなど、参照画像のプールを通して様々な要素の色を正確に生成します。
8ヶ月前
02.6K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClick:任意のLLMを有効にし、AndroidとPCの操作を自動化する

一般的な紹介 ClickClickClickはBandarLabsによって開発されたフレームワークで、ローカルまたはリモートの大規模言語モデル(LLM)を使用してAndroidやPCの操作を自動化することを目的としています。このプロジェクトは現在、非常に実験的な段階にあり、以下のような様々なモデルをサポートしています。
8ヶ月前
02.6K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty:AIを搭載したコードエディターを体験しよう!

概論 Meltyは、チャットによる会話とGitによるバージョン管理を組み合わせた画期的なAIコードエディターである。ReplicateのCharlieとJacksonによって開発されたこのツールは、従来のAIコーディングツールのペインポイントを解決することを目指している。最大の特徴は...
7ヶ月前
02.6K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings:子供の手描きの落書きをアニメーションに変換、子供のお絵かきアニメーション自動生成ツール

概論 AnimatedDrawingsはFacebook Researchによって開発されたオープンソースプロジェクトで、自動化技術によって子供の絵をアニメーションのキャラクターに変換する。このプロジェクトは、「A Method for A...
8ヶ月前
02.6K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): GPT APIを使用して作成されたネイティブのコパイロットで、どのウィンドウでもダイアログを完了できます。

概要 ChatFreeは、ユーザーのAIアプリをブラウザの制約から解放し、ローカルで実行することを目的としたオープンソースプロジェクトです。GPTAPIを使用して作成されたCopilotは、Office、Word、WPSなどの幅広いオフィスソフトウェアをサポートするように設計されています。このプロジェクトは...
8ヶ月前
02.6K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: 大規模モデルの微調整データセットを作成するシンプルなツール

包括的な紹介 Easy Datasetは、大規模モデル(LLM)を微調整するために特別に設計されたオープンソースツールで、GitHubでホストされています。ファイルのアップロード、コンテンツの自動セグメント化、質問と回答の生成、そして最終的に適切なLLMの出力を可能にする、使いやすいインターフェースを提供します。
5ヶ月前
02.6K
Magic MCP:生成现代化UI组件的MCP服务

Magic MCP: モダンなUIコンポーネントを生成するMCPサービス

一般的な紹介 Magic MCPは21st.devチームによって開発されたAI駆動ツールで、フロントエンド開発者のために設計されています。自然言語の記述からモダンなUIコンポーネントをオンザフライで生成し、Cursor、WindSurfと統合します。
5ヶ月前
02.6K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO:複数のAI製品を統合した商品化アグリゲーション・プラットフォーム

総合紹介 AIBot PROは、複数のAI製品を統合するための便利なプラットフォームをユーザーに提供するために設計された、.NET 6ベースのAIアグリゲーションクライアントです。このクライアントは、無感覚な切り替え対話をサポートし、ChatGPT、Gemini、Claude、Wenxin Yiyin...を統合します。
6ヶ月前
02.6K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

ディスポーズ:人間の姿勢を精密に制御してビデオを生成し、踊る女性を作り出す

一般的な紹介 DisPoseは、制御されたキャラクター画像アニメーション生成に焦点を当てた革新的なオープンソースの人工知能プロジェクトです。研究者チームによって開発され、GitHubでオープンソース化されたこのプロジェクトは、高度なディープラーニング技術を用いて、骨格のポーズ情報を分解することで正確なキャラクターアニメーションの制御を実現しています。
8ヶ月前
02.6K
hugo-translator:自动翻译Hugo博客内容的Python脚本

hugo-translator: ヒューゴのブログコンテンツを自動翻訳するPythonスクリプト

一般的な紹介 hugo-translatorはHugoの静的サイトジェネレータ用に設計された自動翻訳ツールで、GitHubでホストされており、開発者のRico00121によって作成されました。hugo-translatorはHugoの静的サイトジェネレータ用に設計された自動翻訳ツールです。
5ヶ月前
02.6K
WeChatFerry:功能全面的微信机器人开发框架

WeChatFerry:WeChatロボット開発のための完全機能フレームワーク

包括的な紹介 WeChatFerryは、オープンソースのWeChatロボットの基礎となるフレームワークであり、GitHub上の開発者lich0821によって作成され、維持されています。このプロジェクトは、WeChat Hook技術を通じて、一連の強力なSDKを提供し、開発者がWeChat ...
5ヶ月前
02.6K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers:OpenAI互換のAPIリクエストデータを追跡するAI observabilityのための軽量ライブラリ

概要 Observersは、生成AI APIに包括的な観測機能を提供するために設計されたオープンソースのPython SDKです。このライブラリにより、ユーザーはAIモデルとのインタラクションを簡単に追跡・記録し、これらの観測結果を複数のバックエンドに保存することができます。どのような...
8ヶ月前
02.6K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

Gemini Next Chat: ワンクリックで、プライベートなマルチモーダルGeminiアプリを無料でデプロイできます!

概論 Gemini Next Chatは、Geminiプライベートアプリケーションを簡単にデプロイできるように設計されたオープンソースプロジェクトです。このプロジェクトは、Gemini 1.5とGemini 2.0のマルチモーダルモデルをサポートしており、ユーザーはVercel上でワンクリックするだけでデプロイすることができます。
7ヶ月前
02.6K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow:Rooコード拡張に基づくメモリ拡張システム

包括的な紹介 RooFlowはオープンソースのAI支援プログラミングツールであり、プロジェクトのロギングを通じて開発中のコード、決定、タスクの進捗を保存するコア機能を備えています。Roo Codeエクステンションをベースに、アーキテクチャ、コーディング、テスト、デバッグ、Q&Aの5つのモードを統合しています。これらのモードは相互に...
4ヶ月前
02.6K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: 大規模モデルグループチャットフレームワーク: 複数の大規模言語モデルと同時にチャットする

包括的な紹介 OpenAOEは、オープンソースの大規模モデルグループチャットフレームワークです。OpenAOEを使えば、ユーザーは複数の大規模言語モデル(LLM)と同時に会話し、並列出力を得ることができます。このフレームワークは...
6ヶ月前
02.6K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务

ベーシック・メモリー:AIとの会話から永続的な知識グラフを構築するMCPサービス

概論 Basic Memoryは、ClaudeのようなAIアシスタントとの会話を通じてナレッジグラフを構築するためのツールである。Basic Machinesによって開発され、対話の内容をMarkdownファイルとして保存すること、...
5ヶ月前
02.6K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind:タイムスタンプによるビデオ位置決めコンテンツとQ&Aオープンソースプロジェクト

概論 VideoMindは、長い動画の推論、Q&A、要約生成に焦点を当てたオープンソースのマルチモーダルAIツールである。香港理工大学のYe Liuとシンガポール国立大学のShow Labのチームによって開発された。このツールは人間の動画理解を模倣している。
2ヶ月前
02.6K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます!

はじめに GitPodcastは、GitHubのリポジトリをポッドキャストに変える革新的なツールで、開発者はいつでもどこでもコードの更新を聞くことができます。OpenAIとAzure Speech SDKを使って、GitPodca...
7ヶ月前
02.6K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: PPTXファイルをMarkdownに変換する特別なツール

概要 PPTX2MDは、PowerPointのPPTXファイルをMarkdown形式に変換するために設計されたオープンソースツールです。GitHubユーザーのssine氏によって開発されたこのツールは、見出し、リスト、テキストフォーマット(例:太字、斜体、色、スーパー...)を保持することをサポートしています。
6ヶ月前
02.6K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open:GitHub、GitLabリポジトリ用のAIドキュメント自動生成

包括的な紹介 DeepWiki-Openは、GitHub、GitLab、Bitbucket上のコードリポジトリの構造化ドキュメントを自動的に生成するために設計されたオープンソースプロジェクトです。AI技術を使って、コード構造、ファイルの内容、論理的な関係を分析し、迅速に構造化ドキュメントを生成します。
3ヶ月前
02.6K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
3ヶ月前
02.6K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2Bオープンコンピュータの使用:E2BサンドボックスでAIオペレーティングシステムを安全に実行する

概要 E2B Open Computer Useは、E2B Desktop Sandboxを通じて、安全なクラウドベースのLinuxコンピュータ利用体験を提供することを目的としたオープンソースプロジェクトです。E2B Sandboxは、ユーザが任意の大規模コンピュータに接続できるデスクトップグラフィカル環境を提供します。
7ヶ月前
02.6K
Vercel AI SDK:使用流行前端框架构建AI驱动应用程序

Vercel AI SDK:人気のフロントエンドフレームワークでAI搭載アプリケーションを構築する

概論 Vercel AI SDKは、React、Svelte、Vue、Solidなどのフレームワークを使用してAIアプリケーションを構築する開発者を支援するために、Vercelチームによって開発されたオープンソースツールです。複数の言語モデルプロバイダをサポートしています。
7ヶ月前
02.6K
BlenderMCP:依赖Blender生成3D模型的MCP服务

BlenderMCP:3Dモデルの生成にBlenderを使用するMCPサービス

一般的な紹介 BlenderMCPは、モデルコンテキストプロトコル(MCP)プロトコルを介してBlenderとClaude AIを接続するオープンソースツールです。ユーザはテキストコマンドを使って、Claude AI を直接制御することができます。
5ヶ月前
02.6K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT:中国法知識モデリング、法律クイズと司法試験トレーニングをサポート

一般的な紹介 LaWGPTは、南京大学の機械学習・データマイニング研究グループによってサポートされているオープンソースプロジェクトで、中国の法律知識に基づいた大規模な言語モデルの構築に専念しています。一般的な中国語モデル(Chinese-LLaMAやChatGLMなど)をベースにしています。
5ヶ月前
02.6K
Whisper Input:利用Groq免费且高速的语音转录文本服务

ウィスパーインプット:Groqを使った無料・高速の音声テキスト起こしサービス

概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。
6ヶ月前
02.6K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

フラッシュカード:Duolingoに代わってDify上に構築された単語フラッシュカード外国語学習ツール

概要 Flashcardは、Duolingoに代わるオープンソースの言語学習ツールです。Steven Lynn (GitHub username: stvlynn) によって開発されたこのプロジェクトは、モダンなユーザーインターフェイスと多言語を特徴としています。
6ヶ月前
02.6K
Mobius Diffusion:文本提示生成无缝循环视频

メビウス・ディフュージョン:テキスト・プロンプトがシームレスなループ映像を生成

はじめに メビウス・ディフュージョンは、テキスト入力からシームレスにループするビデオコンテンツを生成することに特化した革新的なオンラインツールです。事前にトレーニングされたビデオ拡散モデルに基づいており、ユーザーのトレーニングやアノテーションデータを必要とせず、すぐに使い始めることができます。このサイトのコアテクノロジーは...
5ヶ月前
02.6K
HiveChat:适合公司内部快速部署的AI聊天机器人

HiveChat:企業内で迅速に展開できるAIチャットボット

概要 HiveChatは中小規模のチーム向けのAIチャットボットで、管理者は複数のAIモデル(Deepseek、OpenAI、Claude、Geminiなど)を一度に設定し、チームメンバーが簡単に使用できるようにすることができます。このチャットボットは ...
6ヶ月前
02.6K
Archon:自主构建与优化AI智能体的开发框架

Archon:AIインテリジェンスを自律的に構築・最適化する開発フレームワーク

Archonは、開発者のCole Medin(GitHubユーザー名 coleam00)によって構築された世界初の「Agenteer」プロジェクトであり、AIの自律的な構築、最適化、反復に焦点を当てたオープンソースのフレームワークである。インテリジェンス。これは...
5ヶ月前
02.6K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf:大規模言語モデルをPDFファイルで実行する実験的プロジェクト

一般的な紹介 llm.pdfは、ユーザーが直接PDFファイルで大規模言語モデル(LLM)を実行できるようにするオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています:Em...
3ヶ月前
02.6K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

NoneBot DeepSeek Plugin: NoneBotとDeepSeekをベースにしたカスタマーサービス用のインテリジェントな対話。

一般的な紹介 NoneBot DeepSeek プラグインは、DeepSeek モデルを統合し、インテリジェントな対話と Q&A 機能を提供するように設計された NoneBot プラグインです。DeepSeek モデルにアクセスすることで、ユーザは NoneBot ...
6ヶ月前
02.6K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse:LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

概要 LangfuseはオープンソースのLLM(大規模言語モデル)エンジニアリングプラットフォームです。LLMアプリケーションのトレース、デバッグ、最適化を支援し、呼び出しの観察、キューワードの管理、実験の実行、結果の評価を行うツールを提供します。このプラットフォームは、Langfuseチームによって開発されています。
5ヶ月前
02.6K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC:オープンソースコンピュータ微信機能強化ツール、二次開発支援

総合紹介 SuperWeChatPCはオープンソースのコンピュータ用WeChat拡張ツールであり、その核心はユーザーと開発者に利便性を提供することである。当初、WeChatは単独でしか開くことができないという問題を解決し、後にWeChatSDKを追加し、開発者がWeChatの機能を呼び出すことができるようにしました。
5ヶ月前
02.6K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。
6ヶ月前
02.6K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: AIエージェントのためのオープンソースワークフロービルダー

包括的な紹介 Sim Studioは、軽量で直感的なビジュアルインターフェースを通じて、大規模言語モデル(LLM)ワークフローの迅速な設計、テスト、およびデプロイを支援することに重点を置いた、オープンソースのAIエージェントワークフロー構築プラットフォームです。ドラッグ&ドロップで複雑なワークフローを作成できます。
3ヶ月前
02.6K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM:大規模モデルに外部知識を埋め込むためのオープンソース拡張ツール

KBLaMはマイクロソフトによって開発されたオープンソースプロジェクトで、正式名称は「知識ベース拡張言語モデル」(Knowledge Base Augmented Language Model)である。これは、外部の知識をベクトルに変換し、大規模なモデルに埋め込むことで、...
5ヶ月前
02.6K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。
6ヶ月前
02.6K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast:拡散モデルに基づく中期的な世界気象予測の学習と予測のための効率的なツール

はじめに GraphCastはGoogle DeepMindによって開発された先進的な天気予報ツールで、ディープラーニング技術によって中期的な世界の天気予報の精度を向上させることを目的としている。このプロジェクトでは、事前に学習された様々なモデルとサンプルコードを提供しており、ユーザーはこれらのコードをリソースとして利用することができます。
8ヶ月前
02.6K
VACE:视频创作和编辑的开源模型(未开放)

VACE: ビデオ制作・編集のためのオープンソースモデル(オープンではない)

総合紹介 VACEはAlitongyi Visual Intelligence Lab (ali-vilab)によって開発されたオープンソースプロジェクトで、ビデオの作成と編集に焦点を当てています。リファレンスに基づいた動画の生成、既存の動画コンテンツの編集、ローカライズの修正など、様々な機能を統合したオールインワンツールです。
5ヶ月前
02.6K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot:金融データ分析の効率化と投資リサーチを向上させる知的ボディ

包括的な紹介 FinRobotはAI4Finance Foundationによって開発されたオープンソースのAIインテリジェンス・プラットフォームであり、金融分析用に設計されている。従来の言語モデルをカバーするだけでなく、様々なAI技術を取り入れ、金融業界に包括的なソリューションを提供することを目指しています。
6ヶ月前
02.6K
Minima:支持本地部署或集成到ChatGPT、Claude的开源RAG容器

Minima: オープンソースのRAGコンテナで、ローカルへのデプロイやChatGPTへの統合が可能。

一般的な紹介 MinimaはオープンソースのRAG(Retrieval-Augmented Generation)ソリューションで、ChatGPTのローカル展開と統合をサポートしています。プロジェクトはdmayborodaによって管理されており、その目的は...
6ヶ月前
02.6K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI:独自のコードベースを素早く作成するAIエンジニアリング・アシスタント

包括的な紹介 Potpie AIは、カスタマイズされたAIエンジニアリング・アシスタントを開発者に提供することに特化したオープンソースのプラットフォームです。AIエージェントがコード構造とロジックを深く理解し、コードベースのナレッジグラフを構築することで、デバッグ、テスト、コード生成などのタスクを自動化します。ユーザーはシンプルな...
4ヶ月前
02.6K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

視覚エージェント:複数の視覚的ターゲット検出タスクを解決する視覚インテリジェンス

概要 Vision Agentは、LandingAI(Team Enda Wu)によって開発されたオープンソースプロジェクトで、GitHubでホストされています。先進的なエージェントフレームワークとマルチモーダルモデルを使用しています。
5ヶ月前
02.6K
PiT:用图像零件拼出完整图像的工具(未开放)

PiT:画像パーツから完全な画像をつなぎ合わせるツール(未開封)

概論 PiT(Piece it Together)はGitHubでホストされているオープンソースツールで、テルアビブ大学のエラッド・リチャードソンなどの研究者によって開発された。羽のような断片化された画像パーツを入力することができる。
5ヶ月前
02.6K
Vexa:实时会议转录与智能知识提取工具

Vexa:リアルタイム会議記録・インテリジェント知識抽出ツール

包括的な紹介 Vexaはオープンソースのリアルタイム会議記録および知識管理プラットフォームで、効率的な会議記録とインテリジェントな知識抽出サービスを企業や個人に提供するように設計されています。API駆動の会議ロボットにより、Google MeetやZoomなどのプラットフォームに自動的に参加します。
4ヶ月前
02.6K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate:静的な3Dモデルから骨格構造のアニメーション資産を生成する

包括的な紹介 MagicArticulateは、ByteDanceが南洋理工大学(NTU)と共同で開発したAIフレームワークで、静的な3Dモデルをアニメーション可能なデジタル資産に迅速に変換することに焦点を当てています。これは、高度な自己回帰変換器と関数拡散モデル、自己...
6ヶ月前
02.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder:無料のビッグモデルAPIを使用してAIのトレーニングデータを生成。

包括的な紹介 SFT-data-builderは、無料のBig Model APIとユーザーのプライベートドメインデータを組み合わせて、高品質のSFTトレーニングデータを生成するために設計されたオープンソースプロジェクトです。このツールは、複数のAIモデル形式をサポートし、ワンクリック生成、バッチ生成、柔軟な編集、ローカル...
9ヶ月前
02.6K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: レンズ制御とモーション振幅制御をサポートする、画像からビデオへのオープンソースモデルを生成します。

概要 Ruyi-Modelsは、画像から高品質の動画を生成するために設計されたオープンソースプロジェクトです。IamCreateAIチームによって開発されたこのプロジェクトは、768の解像度、毎秒24フレーム、5秒で120フレームの映画のようなビデオの生成をサポートしています。
8ヶ月前
02.6K
Swarms:多智能体编排框架,企业级生产工具

Swarms: マルチインテリジェンス・オーケストレーション・フレームワーク、エンタープライズ・プロダクション・ツール

概要 Swarmsは、効率的なエージェント管理とタスク処理によってビジネスの生産性を向上させるために設計された、エンタープライズグレードのプロダクション対応マルチエージェント・オーケストレーション・フレームワークです。複数のモデル、複数のメモリシステム、カスタムエージェントの作成をサポートするこのフレームワークは、モジュール設計と包括的なロギング機能を提供し、システム...
8ヶ月前
02.6K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

概要 Base Chatは、Ragie Connectを使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、複数のRagie機能のリファレンスアプリケーションであり、Next.jsで構築され、Goo...
6ヶ月前
02.5K
LineAvatars:生成 Notion 风格线条头像的免费工具

LineAvatars: Notionスタイルのラインアバターを生成するフリーツール

概要 LineAvatarsは、Notionスタイルのラインアバターを生成するためにデザインされた、無料で使いやすいオンラインツールです。ユーザーは写真をアップロードするか、ウェブカメラで写真を撮ると、システムが自動的にAIを使ってラインアバターを生成します。このツールは...
6ヶ月前
02.5K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: マルチインテリジェンス・コラボレーションをサポートするオープンソースのAI自動化フレームワーク

概要 LangManusは、GitHubでホストされているオープンソースのAI自動化フレームワークです。元同僚のグループが余暇を利用して開発したもので、言語モデルとウェブ検索、データクローリング、コード実行のための専門ツールを組み合わせることを目的とした学術的なプロジェクトである。
5ヶ月前
02.5K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM:LLM事前学習のための効率的なウェブクローリングツール

包括的な紹介 Crawl4LLMは清華大学とカーネギーメロン大学によって共同開発されたオープンソースプロジェクトであり、大規模モデル(LLM)の事前学習のためのウェブクローリングの効率最適化に焦点を当てている。高品質なウェブページデータをインテリジェントに選択することで、非効率なクロールを大幅に削減し、本来1...
6ヶ月前
02.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow:ビデオ内のオブジェクトの動きをコントロールし、ビデオ内の動くオブジェクトを加算または減算します。

一般的な紹介 Go-with-the-Flowは、Netflix Eyeline Studiosの研究チームによって開発されたオープンソースプロジェクトで、ノイズを歪ませることで映像拡散モデルのモーションパターンを制御します。このプロジェクトにより、ユーザーはシーンのカメラと...
7ヶ月前
02.5K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG:マルチソースPDFドキュメントのローカルQ&Aをサポートするインテリジェントなチャットツール

包括的な紹介 LocalPdfChatRAGは、ローカルPDF文書とRAG(Retrieval Augmented Generation)モデルを組み合わせることで、インテリジェントなチャット機能を実装することを目的としたオープンソースプロジェクトです。このプロジェクトでは、ユーザがPDFドキュメントをアップロードし、自然言語を通じて質問することで、ドキュメントから相対的な...
6ヶ月前
02.5K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

検索 o1: 推論モデルに能動的な検索機能を与え、大規模モデルが思考しながら外部の知識を検索できるようにする。

包括的な紹介 Search-o1は、高度な検索メカニズムを統合することで、大規模推論モデル(LRM)のパフォーマンスを向上させることを目的としたオープンソースプロジェクトである。コアとなるアイデアは、動的な検索と知識の統合を通じて、推論プロセスで遭遇する知識不足の問題を解決することです。プロジェクトのスポンサーはsunn...
7ヶ月前
02.5K
VirtualWife:支持B站直播和语音互动的二次元数字人

バーチャル・ワイフ:Bステーションのライブ・ストリーミングと音声インタラクションをサポートする第二のデジタル・パーソン

VirtualWifeは、開発者yakami129によって作成されたオープンソースのバーチャルデジタルパーソンプロジェクトです。現在、インキュベーション段階にあり、ゴールは「魂」を持ったバーチャルキャラクターを作ることで、ユーザーは友達のように交流することができる。このプロジェクトはB Station Liveによってサポートされています。
5ヶ月前
02.5K
Rowfill:批量提取文档结构化信息并自动化分析

ロウフィル:文書からの構造化情報の一括抽出と自動分析

概要 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。高度な人工知能技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、Large Language Model(LLM)とOpe...
6ヶ月前
02.5K