AIオープンソースプロジェクト

合計1020記事
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する

包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークであり、GitHubでホストされている。GraphGenは、知識グラフを通して合成データ生成を導くことによって、大規模言語モデル(LLM)の教師ありファインチューニングを最適化することに焦点を当てている。LLMは...
1年前
066.9K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは単に...
1年前
066.8K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCPサーバーChatSum: ClaudeでWeChatメッセージをクエリーし要約するためにMCPに頼る

一般的な紹介 MCPサーバー ChatSumは、ユーザーがチャットメッセージを照会し要約するために設計されたオープンソースプロジェクトです。このプロジェクトはGitHubでホストされており、ユーザーが特定のパラメータに基づいてチャットログを照会し、対応する要約を生成することができる強力なツールセットを提供します...
1年前
066.8K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: 1枚の画像からマルチオブジェクトの3Dシーンを高速生成するオープンソースツール

一般的な紹介 MIDI-3DはVAST-AI-Researchチームによって開発されたオープンソースプロジェクトで、開発者、研究者、クリエイターのために1つの画像から複数のオブジェクトを含む3Dシーンを素早く生成します。このツールはマルチインスタンス拡散モデリング技術に基づいています。
1年前
066.8K
NextChat:兼容多平台的本地化AI聊天助手

NextChat:複数のプラットフォームに対応するローカライズされたAIチャットアシスタント

概要 NextChatは、GPT-3、GPT-4、GPT-4.5、Gemini Proなどのクラス最高の言語モデルでチャットサービスを展開できる画期的なAIチャットサービスです。エレガントなユーザーインターフェース、コラボレーション機能、統合機能、テンプレート、...
1年前
066.8K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat:マルチプラットフォームAIモデルを統合したシンプルなWebチャットインタフェース(デプロイメント不要)

OrionChatは、複数の主流AIモデルと対話するための統一されたプラットフォームをユーザーに提供する、ウェブベースのAIチャット・インターフェースです。このプロジェクトは、Ollama(ローカルで動作)、OpenAI GPT、Google Gemi...を含む幅広いAIモデルをサポートしています。
1年前
066.7K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita:モジュラーRAGアプリケーションを構築し、多様なRAG戦略を迅速にテストするためのオープンソースフレームワーク

包括的な紹介 Cognitaは、RAG(Retrieval-Augmented Generation)ベースのアプリケーションの開発を簡素化するためにTrueFoundry社によって開発されたオープンソースのフレームワークです。このフレームワークは、構造化されたモデ...
1年前
066.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。
1年前
066.7K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: オープンソースLLMプログラミング能力比較アリーナ、最適なコード生成モデルをリアルタイム表示

一般的な紹介 CodeArenaは、リアルタイムの対決を通じて最高のオープンソースコード生成モデル(LLM)を紹介するために設計されたユニークなプラットフォームです。ユーザーは、異なる LLM が同じプログラミング・タスクで競い合う様子を見たり、リアルタイム・リーダーボードを通じて最高のパフォーマンスを発揮したモデルを見ることができます。このプラットフォームは、Togetter...
1年前
066.7K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou:顔の特徴を保持する写真生成・編集ツール

概要 InfiniteYouは、ByteDance Intelligent Creationチームによって開発されたオープンソースプロジェクトです。拡散トランスフォーマー(DiTs)技術に基づき、FLUX.1-devモデルを使用しています。主な機能は、ユーザーが写真をアップロードし、テキストの説明を入力することで、写真を生成することです。
1年前
066.7K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix(Emage):全身ジェスチャー生成フレームワーク、音声から全身ジェスチャーを生成する3Dアニメーションフレームワーク

包括的な紹介 PantoMatrixは、音声と顔、体の一部、手、全身の動きを含む部分的なジェスチャーから、完全な人間の動きを生成できる先進的なフルボディジェスチャー生成フレームワークです。このフレームワークは、最新のマルチモーダルデータセットとディープラーニング技術を利用して、高品質の3D...
2年前
066.7K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1:1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。
1年前
066.6K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG(Parametric Retrieval-Augmented Generation)は、大規模言語モデル(LLM)のパラメータ空間に直接埋め込むことで、外部知識の生成を強化することを目的とした革新的な検索拡張生成ツールである。
1年前
066.6K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: 1つのビデオからマルチビュービデオを生成するレンダリングツール

一般的な紹介 ReCamMasterはオープンソースのビデオ処理ツールで、コア機能は1つのビデオから新しいカメラビューを生成することです。ユーザーはカメラ軌道を指定し、ビデオを再レンダリングすることで、異なるアングルのダイナミックな画像を得ることができます。ReCamMasterは、浙江大学とRacer Technologyのチームによって開発されました。
1年前
066.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: パーソナライズされた個人指導を提供するAIツール, Llama 3.1で構築されたオープンソースのAI個人指導プロジェクト

一般的な紹介 Llama Tutorは、Llama 3.1上に構築されたオープンソースのAIパーソナル・チューター・プロジェクトで、パーソナライズされた学習体験をユーザーに提供するように設計されています。Together AI、Next.js、T...などの複数の技術スタックを統合することで、学習者のニーズに合わせた学習体験を提供します。
2年前
066.5K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIAとLangChainが、AI主導のテクニカルレポート生成を可能にする、アナリティクス向け構造化レポート作成のアドバンスガイドを発表

概論 これはLangChainとNVIDIAが共同開発した構造化レポート生成ブループリント・プロジェクトで、GitHubのJupyter notebookチュートリアルで紹介されている。このプロジェクトは高度なAI技術、特にLlama-3.3-7...を利用しています。
1年前
066.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。
1年前
066.4K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

最短:エンド・ツー・エンドのテストに自然言語を使用するAI自動テストツール

一般的な紹介 Shortestは、Anti-Workチームによって開発されたAIを搭載した自然言語エンドツーエンドテストフレームワークです。Playwrightをベースに構築されており、GitHubとの統合や二要素認証(2FA)をサポートしています。Shortestの主な特徴は...
1年前
066.4K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn:ジェミニベースのバーチャル試着ツール

概論 AI-ClothingTryOnは、開発者のspeedTDによって作成され、GitHubでホストされているPythonベースのオープンソースデスクトップアプリケーションです。このアプリケーションは、Google Geminiの人工知能技術を使用しています。
1年前
066.3K
TgWechat:为微信提供端到端加密的聊天插件

TgWechat: WeChat用エンドツーエンド暗号化チャットプラグイン

一般的な紹介 tgwechatは、開発者dplusecによって開発されたオープンソースのWeChatプラグインです。エンドツーエンドの暗号化によりWeChatチャットのプライバシーを保護し、ユーザーが安全にメッセージを送信できるようにします。このプロジェクトは2019年8月31日にGPL v3ライセンスのもとGitHubで公開されました。
1年前
066.3K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 複数のデータベースと言語モデルをサポートする効率的な検索補強生成(RAG)ツール。

概要 RAGLiteは、PostgreSQLまたはSQLiteデータベースをサポートするRAG(Retrieval Augmented Generation)用のPythonツールキットです。異なる言語モデルやリフォーマラを選択できる柔軟な設定オプションを提供します。
2年前
066.3K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf:大規模言語モデルをPDFファイルで実行する実験的プロジェクト

一般的な紹介 llm.pdfは、ユーザーが直接PDFファイルで大規模言語モデル(LLM)を実行できるようにするオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています:Em...
1年前
066.3K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具

RSS Translator: RSSコンテンツをリアルタイムで購読・翻訳するツール

概要 RSS Translatorは、ユーザーがリアルタイムでRSSコンテンツを翻訳して購読できるように設計された、オープンソースのクリーンで自己展開可能なツールです。このツールは、Google翻訳、Microsoft Tra...など、複数の翻訳エンジンをサポートしています。
1年前
066.3K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库

OpenAI WebRTC Python: OpenAIリアルタイムAPIと音声対話するためのPythonライブラリ

包括的な紹介 OpenAI Realtime WebRTC Pythonは、OpenAI Realtime APIを使った音声インタラクションの完全なソリューションを開発者に提供する、プロフェッショナルなPythonライブラリです。このプロジェクトは、低遅延を可能にするWebRTC技術に基づいています...
1年前
066.3K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: 複数のデータソースを迅速に統合するカスタムチャットボット

概要 OpenChatは、大規模言語モデル(LLM)の使用を簡素化するために設計されたユーザーフレンドリーなチャットボットコンソールです。OpenChatは、2ステップのセットアッププロセスを提供することで、ユーザーが簡単に複数のカスタムチャットボットを作成し、管理することを可能にします。このプラットフォームはG...
1年前
066.3K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine:検索知識に基づいて未来の出来事の確率を予測する

概論 Forecast AIは高度な人工知能技術に基づく優れた予測プラットフォームです。強力なデータ分析と機械学習アルゴリズムを駆使し、ユーザーに精度の高い未来予測を提供します。政治選挙、経済動向、社会的出来事のいずれであっても、Forecast ...
2年前
066.2K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate:静的な3Dモデルから骨格構造のアニメーション資産を生成する

包括的な紹介 MagicArticulateは、ByteDanceが南洋理工大学(NTU)と共同で開発したAIフレームワークで、静的な3Dモデルをアニメーション可能なデジタル資産に迅速に変換することに焦点を当てています。これは、高度な自己回帰変換器と関数拡散モデル、自己...
1年前
066.2K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

クロード・エンジニア:クロード・モデルを用いてAIツールを自律的に生成・管理する知的身体対話アシスタント

概要 Claude EngineerはDoriandarkoによって開発された対話型コマンドラインインターフェイス(CLI)で、AnthropicのClaude-3.5-Sonnetモデルを利用してソフトウェア開発作業を支援する。
1年前
066.2K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: Whisper-Large v3より小型で高速な多言語音声テキスト変換ツール

包括的な紹介 PengChengStarling (PengCheng Labs) は、異なる言語の音声を対応するテキストに変換できる多言語自動音声認識 (ASR) ツールです。このツールキットはicefallプロジェクトに基づいて開発され、完全な音声認識プロセスを提供します...
1年前
066.2K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

ディープリサーチ:効率的なリサーチツールとレポート作成機能を提供するAIベースのディープリサーチアシスタント

一般的な紹介 Deep Research は、検索エンジン、ウェブクローリング、大規模な言語モデルを組み合わせることで、反復的なディープリサーチを実行するように設計された AI ベースのリサーチアシスタントです。このプロジェクトは、使いやすいディープリサーチジェネレータを提供することを目的として、dzhng によって GitHub で公開されました。
1年前
066.2K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

ライトカード:HTML5カードジェネレーターツール、シンプルなツールで美しいコンテンツカードを作る

概要 lightcard は、ユーザーが簡単に美しいコンテンツカードを作成できるように設計された、シンプルでエレガントなカード生成ツールです。このツールは、カスタムテキストコンテンツ、複数のテーマスタイル、QRコードに対応しており、作成がより簡単で楽しくなります。ユーザーは、タイトル、本文、作者を編集できます。
1年前
066.2K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: あらゆるクラウドでAIとバッチタスクを効率的に実行するオープンソースフレームワーク

概 要 SkyPilotは、カリフォルニア大学バークレー校のSky Computing Labが始めたオープンソースのフレームワークで、あらゆるクラウドインフラ上でAIやバッチ処理タスクを効率的に実行できるように設計されています。14以上のクラウドサービス(...
1年前
066.1K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

シンバ:文書整理のためのナレッジマネジメントシステムで、あらゆるRAGシステムにシームレスに統合されます。

概要 Simbaは、あらゆるRAG(Retrieval Augmentation Generation)システムとシームレスに統合できるように設計されたポータブルな知識管理システム(KMS)です。GitHubのユーザーGitHamza0206によって作成されたこのプロジェクトは、様々なナレッジマネジメントのための効率的なソリューションを提供します。
1年前
066.1K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

視覚エージェント:複数の視覚的ターゲット検出タスクを解決する視覚インテリジェンス

概要 Vision Agentは、LandingAI(Team Enda Wu)によって開発されたオープンソースプロジェクトで、GitHubでホストされています。先進的なエージェントフレームワークとマルチモーダルモデルを使用しています。
1年前
066.1K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...
1年前
066.1K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: あらゆるサイズの画像拡大、デエイリアス・オープンソースツール

概論 Theraは、チューリッヒ工科大学とチューリッヒ大学のチームによって開発されたオープンソースの画像超解像ツールである。低解像度の画像を、2倍、3.14倍、あるいは整数倍など、任意の倍率にズームすることができる。
1年前
066.1K
GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型

GPT4Free: 複数のGPTモデルを自由に使用するためのAI対話ウェブサイトのインターフェイスをデコンパイルします。

GPT4Freeの概要 GPT4Freeは、開発者のxtekkyがGitHubで公開したオープンソースプロジェクトで、GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...など、さまざまな強力な言語モデルを無料で提供することを目的としています。
2年前
066K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築

一般的な紹介 Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークです。ユーザーは、1文の記述でインテリジェントなAIエージェントを作成することができ、複雑なタスクで共同作業する複数のエージェントをサポートしています。このフレームワークは2つの...
1年前
066K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: 効率的なデータ分析とAIアプリケーションのためのデータサイエンティスト向けPythonオープンソースライブラリ

概要 TaipyはAvaiga社によって開発された強力なPythonライブラリで、データ科学者や機械学習エンジニアがデータ駆動型のWebアプリケーションを迅速に構築・展開できるように設計されています。
2年前
066K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter:ウィズダム・スペクトラムは、超長文を生成するための強力なモデルを発表し、1回の会話で10,000語以上の生成に対応。

包括的な紹介 LongWriter は、清華大学データマイニング研究グループ (THUDM) によって開発された強力な長文生成ツールです。このツールは、先進的なロングコンテクスト言語モデル(LLM)に基づいており、10,000語以上の長文を生成することができます。
2年前
066K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT:衣服のディテールの信憑性を高める高忠実度AIバーチャルフィッティングツール

包括的な紹介 FitDiTは、拡散トランスフォーマー(Diffusion Transformers)に基づいた高忠実度のバーチャルフィッティングシステムである。Tencent AI Labによって開発されたこのプロジェクトは、衣服の詳細を表示するという従来のバーチャルフィッティングシステムの限界に対処することを目的としている。
1年前
065.9K

「常時稼働のDeepseek AIアシスタント:Deepseek-V3に基づくインテリジェントな音声対話システムの構築

総合紹介 Always-On AI Assistantは、Deepseek-V3、RealtimeSTT、Typerなどの先進技術を統合することで、強力で永続的なオンラインAIアシスタントシステムを構築する革新的なAIアシスタントプロジェクトです。
1年前
065.9K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook:TypeScriptの完全なプロジェクトを迅速に構築し、反復するオープンソースのフルスタックAIエンジニア

Srcbookの概要 SrcbookはTypeScriptを中心としたアプリケーション開発プラットフォームであり、AIアシスタントを用いてWebアプリケーションを迅速に作成し、繰り返し実行できるように設計されている。ネイティブランタイムをサポートし、インタラクティブなノートブックインターフェースを提供し、バックエンドのコードを書いて実行することができる。
2年前
065.9K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraphスーパーバイザー:スーパーバイジングインテリジェンスを用いたマルチインテリジェンスコラボレーション管理ツール

概要 LangGraph SupervisorはLangGraphフレームワークをベースとしたPythonライブラリで、マルチインテリジェントな身体システムの作成と管理のために設計されています。このライブラリは、中央の監督エージェントを通して複数の専門化されたエージェントの作業を調整し、通信の流れやタスクの分割を確実にします...
1年前
065.9K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream:画像手がかり語のバッチバックプロパゲーションのためのオープンソースの軽量視覚言語モデル

包括的な紹介 Moondreamは、ディープラーニングとコンピュータビジョン技術による画像記述機能を実現するために設計された、オープンソースの軽量視覚言語モデルです。このモデルは、様々なプラットフォーム上で効率的に実行することができ、特にエッジデバイスに適しています。
1年前
065.8K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk:インテリジェントな仕事検索アシスタント、自動履歴書配置(英語のみ)

概論 Auto_Jobs_Applier_AIHawkは、人工知能技術を用いた求人検索の自動化ツールである。短時間で大量の履歴書を自動配信し、個人情報や求職の意図に応じてパーソナライズすることができます。このツールは、求職者の転職意欲を...
1年前
065.8K
ALog:便携AI语音日记应用,支持语音转文字。

ALog:音声読み上げ機能付きの携帯型AI音声日記アプリ。

一般的な紹介 ALogはAIベースの音声日記アプリケーションで、ユーザーが音声で日常生活を記録できるように設計されています。duxinsによって開発され、GitHubでオープンソース化されている。ユーザーは音声入力で日記を記録することができ、アプリは自動的に音声をテキストに変換します...
1年前
065.8K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: フロントエンド設計のためのオープンソースCursor、Reactアプリケーションの設計とコードの公開

一般的な紹介 Onlookはデザイナーと開発者のために作られたオープンソースのデザインツールで、ユーザーは実行中のReactアプリケーションで直接デザインし、デザインの変更をコードに変換することができます。このツールは、Figma や Webf... に似た直感的なビジュアル編集体験を提供します。
1年前
065.7K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo:異なるAIインテリジェンスフレームワークをリアルタイムで連携させる統合プラットフォーム

Mahiloは、開発者Jayesh SharmaによってGitHubで公開されたオープンソースのマルチインテリジェンス統合プラットフォームであり、ユーザーが異なるフレームワークのAIインテリジェンスを接続し、リアルタイムのコミュニケーション、人間とコンピュータのインタラクション、インテリジェントなコラボレーションをサポートできるように設計されている。この ...
1年前
065.7K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架

PrimisAI Nexus:スケーラブルなAIマルチインテリジェンスシステムとタスク自動化のための軽量フレームワーク

概要 PrimisAI Nexusは、GitHubでホストされている軽量なオープンソースのPythonフレームワークで、PrimisAIチームによって開発されています。大規模言語モデリング(LLM)を通じて、スケーラブルなAIマルチインテリジェント体システムの構築と管理を支援することを目的としており、...
1年前
065.7K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: 複数のフロントエンドフレームワークをサポートするAI駆動型リッチテキストエディタの作成

包括的な紹介 AIEditorは、Webコンポーネント開発に基づいて、Vue、React、Angularおよび他のほとんどすべての主流のフロントエンドフレームワークをサポートしているAI駆動型の次世代リッチテキストエディタです。PCのWebと...
1年前
065.7K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: タスクパフォーマンスを向上させるプロンプトプロジェクト最適化のためのオープンソースフレームワーク

包括的な紹介 PromptWizardはMicrosoftによって開発されたオープンソースのフレームワークであり、モデルがプロンプトの単語を生成、評価、改善し、それ自身で例を生成し、継続的なフィードバックによってアウトプットの質を向上させる自己進化メカニズムを使用しています。プロンプトの単語を自律的に最適化し、適切な例文を生成・選択し、...
1年前
065.6K
Cloudflare Agents:在边缘网络上构建实时交互的智能体

Cloudflare Agents: エッジネットワーク上にリアルタイムの対話型インテリジェンスを構築

概論 Cloudflare AgentsはCloudflareのオープンソース開発フレームワークで、開発者がグローバルエッジネットワーク上にインテリジェントなAIエージェントを構築できるように設計されています。エージェントが状態を保持し、リアルタイムで通信し、自律的に実行する能力を提供します。
1年前
065.6K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: Nuxt 3とOllamaをベースにしたローカルリアルタイムチャットアプリケーションUI

包括的な紹介 ChatOllamaは、大規模言語モデル(LLM)に基づくオープンソースのオンラインチャットアプリケーションプロジェクトです。ユーザは、モデル管理(リスト表示、ダウンロード、削除)、モデルとのチャットやその他の機能のためにプラットフォームを使用することができます。このプロジェクトは...
2年前
065.6K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: FP8行列演算を効率的にサポートするオープンソースライブラリ (DeepSeek Open Source Week 3日目)

包括的な紹介 DeepGEMMは、DeepSeekチームによって開発されたオープンソースのFP8 GEMM (Generalised Matrix Multiplication)ライブラリで、行列演算の効率的なサポートを提供することに重点を置いています。特にNVIDIA HopperアーキテクチャのTensor ...
1年前
065.6K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: ノードオーケストレーションに基づくAIモデルのワークフロー可視化クライアント

概要 NodeToolは、AI愛好家、開発者、データサイエンティスト、クリエイターにシンプルで直感的なインターフェイスを提供するように設計された革新的なAIオーサリングプラットフォームです。アーティスト、開発者、初心者を問わず、NodeToolはクリエイティブなプロトタイプを素早く作成するのに役立ちます。
1年前
065.6K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

概要 Base Chatは、Ragie Connectを使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、複数のRagie機能のリファレンスアプリケーションであり、Next.jsで構築され、Goo...
1年前
065.5K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW:拡張可能なプラグインを備えた、フル機能の軽量クロスプラットフォームAIクライアント

包括的な紹介 AIaW(AI as Workspace)は、フル機能で軽量かつ拡張可能なソリューションを提供するために設計された次世代AIクライアントです。このプラットフォームは、OpenAI、Anthropic、Googleを含む幅広いサービスプロバイダをサポートし、...
1年前
065.4K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor: ローカルのLLM開発環境をワンクリックでデプロイし、AIサービスを簡単に管理・実行するためのコンテナ化されたツールセット。

概論 Harborは、ローカルのAI開発環境のデプロイと管理を簡素化することに焦点を当てた、画期的なコンテナ化LLMツールセットです。クリーンなコマンドラインインターフェイス(CLI)とコンパニオンアプリケーションにより、ワンクリックでLLMバックエンド、APIインターフェイス、フロント...
1年前
065.4K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind:タイムスタンプによるビデオ位置決めコンテンツとQ&Aオープンソースプロジェクト

概論 VideoMindは、長い動画の推論、Q&A、要約生成に焦点を当てたオープンソースのマルチモーダルAIツールである。香港理工大学のYe Liuとシンガポール国立大学のShow Labのチームによって開発された。このツールは人間の動画理解を模倣している。
12ヶ月前
065.4K
LM Speed:快速测试大模型API性能

LMスピード:大規模モデルAPIのパフォーマンスを迅速にテストする

概要 LM Speed は、AI 開発者向けに設計されたツールであり、lmspeed.net でオンラインサービスとしても提供されている。主な機能は、言語モデル API のパフォーマンスをテスト・分析し、スピードのボトルネックを素早く特定し、呼び出し戦略を最適化することである。これは...
1年前
065.4K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI:インテリジェントなドキュメントQ&Aシステムの構築と、プライベートなウェブサイド・ナレッジベースのシンプルな構築

総合紹介 RAG Web UIは、RAG(Retrieval Augmented Generation)技術に基づいた知的対話システムです。企業や個人が独自の知識ベースに基づいてインテリジェントなQ&Aシステムを構築するのに役立ちます。文書検索と大規模な言語モデルを組み合わせることで、RAG Web UIは正確で信頼性の高い...
1年前
065.4K
オーケストラ:より簡単で効率的なマルチインテリジェンス共同開発のためのスマートAIチーム構築

オーケストラ:より簡単で効率的なマルチインテリジェンス共同開発のためのスマートAIチーム構築

Orchestraは革新的な軽量Pythonフレームワークで、大規模言語モデル(LLM)に基づくマルチインテリジェンス協調システムの構築に重点を置いています。複数のAI知能が交響楽団のように調和して動作するように、知能を配置する独自の方法を採用している。モデル化することで ...
1年前
065.4K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI:高付加価値AIモデル転送インターフェース管理システム、公式サイトがAPI枠を毎日無料提供

総合紹介 VoAPIは、知名度が高く高性能な新しいAIモデルインターフェース管理・配信システムであり、主に個人または企業の内部管理と配信チャネルに使用されます。NewAPIに基づいて開発されたこのシステムは、豊富な機能モジュールと最適化されたユーザーインターフェースを提供します。
2年前
065.4K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD: 任意の3Dおよび4Dシーンのビデオを生成するためのオープンソースフレームワーク

一般的な紹介 GenXDは、シンガポール国立大学(NUS)とMicrosoftチームによって開発されたオープンソースプロジェクトです。GenXDは、任意の3Dおよび4Dシーンを生成することに重点を置き、データ不足やモデル設計の複雑さによる現実世界の3Dおよび4D生成の問題を解決する。このプロジェクトは、...
1年前
065.3K
CogView4:生成中英双语高清图片的开源文生图模型

CogView4:中国語と英語の高精細対訳画像を生成するオープンソースのグラフィカルモデル

一般的な紹介 CogView4は清華大学のKEG研究室(THUDM)によって開発されたオープンソースのテキストからグラフへのモデルであり、テキスト記述を高品質な画像に変換することに重点を置いている。二ヶ国語のキューワード入力をサポートしており、特に中国語のキューを理解し、中国語の文字、非...
1年前
065.3K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC:オープンソースコンピュータ微信機能強化ツール、二次開発支援

総合紹介 SuperWeChatPCはオープンソースのコンピュータ用WeChat拡張ツールであり、その核心はユーザーと開発者に利便性を提供することである。当初、WeChatは単独でしか開くことができないという問題を解決し、後にWeChatSDKを追加し、開発者がWeChatの機能を呼び出すことができるようにしました。
1年前
065.2K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev:ワイヤーフレームをアップロードしてLlama4ベースのフロントエンドコードを生成する

一般的な紹介 Napkins.devはフリーのオープンソースプロジェクトです。コア機能は、ユーザーがインターフェイスのスクリーンショットやワイヤーフレームをアップロードして、実行可能なフロントエンドコードを自動的に生成できるようにすることです。ユーザーはデザイン画を提供するだけでよく、ツールはLlama 4モデル(by Together ...
1年前
065.2K
Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件

Artab:ブラウザで開いた新しいタブで世界の名画を表示、Chromeプラグイン

一般的な説明 Artabは、新しいタブを開くたびに世界の素晴らしい芸術作品を紹介するように設計されたブラウザ拡張機能です。この拡張機能はChrome、Edge、Firefoxブラウザで利用できます。Artabを使用すると、ユーザーはブラウズすることができます...
1年前
065.2K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

ソーシャルメディア・エージェント:ソーシャルメディア・コンテンツを自動生成・管理するソーシャルメディア用インテリジェント・アシスタント

概要 ソーシャルメディアエージェント(Social Media Agent)は、ソーシャルメディアコンテンツの生成と管理を自動化するために設計された、新しいエージェントインボックスによってインタラクション情報を管理するオープンソースプロジェクトです。このプロジェクトはLangChainチームによって開発されました。
1年前
065.2K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: 記憶、知識、ツールを備えたAIインテリジェンスの構築

包括的な紹介 PhiDataは、インテリジェントなAIアシスタントを開発するために設計されたフレームワークです。PhiDataは、拡張されたメモリ、知識統合、ツール呼び出し機能を通じて、AIアシスタントが長期的な会話を行い、正確なビジネスコンテキストを提供し、さまざまな操作を実行できるようにします。
1年前
065.1K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT:ローカルデバイス上の複数のドキュメントと対話することで、データプライバシーを確保する

一般的な紹介 LocalGPTはオープンソースプロジェクトで、ユーザーがローカルデバイス上のドキュメントと会話できるように設計されており、データのプライバシーを保証します。様々なオープンソースモデルを使用することで、LocalGPTはデータをクラウドにアップロードすることなく、ドキュメントコンテンツを処理し理解することができます。このプロジェクトは、様々なアプリケーションをサポートしています。
1年前
065.1K
Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis:AIインテリジェンスに安全なサンドボックス環境を提供するオープンソースツール

一般的な紹介 Arrakisは、安全でカスタマイズ可能な環境を提供するためにAI知能のために設計されたサンドボックス環境です。Abhishek Bhardwajによって開発され、GitHubでホストされており、AGPL v3ライセンスを使用しています。
1年前
065.1K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI:オープンソースの軽量AIツール・ナビゲーション・プロジェクト

包括的な紹介 Tap4 AI WebUIは、オープンソースの軽量AIツールナビゲーションウェブサイトプロジェクトです。このプロジェクトは、Next.jsとSupabaseテクノロジースタックを使用し、多言語SEO最適化をサポートし、AIツールカタログを提供します。
2年前
065K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App: リアルタイムのウェブ検索と知的推論のためのオープンソースチャットアプリ

包括的な紹介 Exa & Deepseekチャットアプリは、オープンソースのスマートチャットアプリです。主な機能には、ExaのAPIを使用したリアルタイムのウェブ検索や、インテリジェントなDeepseek R1言語モデルの使用などがあります。
1年前
065K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT:医療画像解析と診断Q&Aを支援する医療ビッグモデル

包括的な紹介 HealthGPTは、異種知識適応による統一的な医療視覚理解と生成能力の達成を目指す、先進的な医療グランドビジュアル言語モデルである。このプロジェクトの目標は、医療グラフを大幅に改善する統一的な自己回帰フレームワークに医療視覚理解と生成能力を統合することである。
1年前
065K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni:人間のビデオ感情や行動を分析するためのマルチモーダル・マクロモデル

一般的な紹介 HumanOmniは、HumanMLLMチームによって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルです。HumanOmniは人間の動画を分析することに特化しており、画像と音声の両方を処理することで、感情や行動、対話の内容を理解するのに役立ちます。このプロジェクトでは2...
1年前
065K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码

マイクロ・エージェント:コードを自動生成し、テストと修正を行うAIプログラミング・インテリジェンス。

一般的な紹介 Micro-Agentは、Builder.ioによって開発されたオープンソースのAIコーディングアシスタントであり、開発者にコードを自動的に生成してテストする機能を提供するように設計されている。自然言語による記述を理解することでテストケースを生成し、すべてのテストがパスするまでコードを繰り返し実行することで、オープンなコードを減らすことができます。
1年前
064.9K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

ロボ・ブロガー:ラングラフをもとに音声コンテンツからブログ記事を生成、ブログ執筆を自動化

はじめに ロボ・ブロガーは、音声読み上げ技術によってコンテンツ生成プロセスを簡素化するように設計された革新的なブログ作成ツールです。ユーザーはあらゆる音声テキスト変換アプリケーションを使ってアイデアを記録することができ、ロボ・ブロガーはそれらのアイデアを構造化されたブログコンテンツに変換します。
1年前
064.9K
自动解析PDF内容并提取文字与表格的开源服务

PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。

総合紹介 PDF文書のレイアウトを自動的に分析し、ページ内のテキスト、タイトル、画像、表、数式、その他の要素を識別し、それらの正しい順序を決定します。このツールはOCR機能をサポートしており、スキャンしたPDFを検索可能なテキストに変換することができます。Docker上で動作し、2つのモデルを提供します。
1年前
064.9K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

ScrapeGraphAI:ウェブクローリングのための単一のキューワード、ルールを書く必要のないインテリジェントなウェブコンテンツ抽出ツール

包括的な紹介 ScrapeGraphAIは革新的なPythonのWebスクレイピングライブラリで、Large Language Modelling (LLM)とDirect Graph Logicを巧みに組み合わせ、Webサイトやローカルドキュメントのスクレイピングパイプラインを作成します。このツールのユニークな点は、完璧なレベルのシンプルさとパワーです。
1年前
064.8K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDFをオープンソースツールのポッドキャストに変換する

概要 Open NotebookLMは、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースのLarge Language Model (LLM)とText-to-Speech (TTS)モデルを使用してPDFコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成します...
1年前
064.8K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

TransRouterは、GoogleのGeminiモデルをベースにしたリアルタイム音声翻訳ツールで、特に英語と中国語のリアルタイム音声翻訳用に設計されている。このツールは、Zoomのようなビデオ会議ソフトウェアにシームレスに統合され、クロスランゲージのための強力なツールを提供します...
1年前
064.8K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: エンタープライズ級ジェネレーティブAIアプリケーションのためのローコード開発プラットフォーム

包括的な紹介 BuffGPTはLarge Language Model (LLM)に基づいたオープンソースのAIアプリケーション開発プラットフォームであり、データ処理、モデル呼び出し、RAG検索、視覚的なワークフローオーケストレーションなどのすぐに使える機能を提供し、ユーザーが生成AIアプリケーションを簡単に構築・運用できるように支援します。このプラットフォームは、プライベート...
1年前
064.8K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO:単一主題および複数主題のカスタマイズされた画像生成ツールのサポート(eコマース・グラフィックに最適)

UNOはByteDance Intelligent Creation Teamによって開発されたオープンソースの画像生成フレームワークです。FLUX.1モデルに基づいており、"less-to-more "汎化アプローチによる単一被写体および複数被写体のカスタム画像生成に重点を置いている。
1年前
064.7K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档

クラウド文書変換:Flying Book文書ダウンロードプラグイン、Flying Bookクラウド文書からローカルMarkdown形式文書への変換

概要 Cloud Document Converterは、Flying Bookのクラウド文書をMarkdown形式に変換するためのChrome拡張機能です。ユーザーはフライングブックのクラウド文書を簡単にダウンロードまたはコピーしてMarkdo...
2年前
064.7K
infinite-zoom-stable-diffusion:生成无限缩放循环视频

infinite-zoom-stable-diffusion: 無限ズームのループビデオを生成する。

包括的な紹介 無限ズーム安定拡散(Infinite Zoom Stable Diffusion)は、安定拡散技術を使用して無限ズームビデオを作成するために設計されたオープンソースプロジェクトです。このプロジェクトは、使いやすいColabノートブックを提供し、ユーザは...
1年前
064.7K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: WindowsネイティブAIモデル開発ツールセット、Windowsアプリケーションへのエンドサイドモデルの統合

概論 AI Dev Galleryは、Windows開発者向けに設計されたマイクロソフトのAI開発ツールアプリケーション(現在パブリックプレビュー中)である。開発者がAI機能を簡単にWindo...
1年前
064.7K