AIオープンソースプロジェクト

合計1020記事

順番に並べる

magic-html：从HTML网址中提取主体数据，输出纯文本/markdown

magic-html: HTML URLから本文データを抽出し、プレーンテキスト/マークダウンを出力する。

概要 magic-htmlは、HTMLから本文領域のコンテンツを抽出するプロセスを簡素化するために設計されたPythonライブラリです。複雑なHTML構造を扱う場合でも、単純なウェブページを扱う場合でも、このライブラリはユーザーに便利で効率的なインターフェースを提供することを目的としています。マルチモーダルな抽出をサポートしています。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

084K

TryOffAnyone: 人物の衣服をタイル状の衣服表示画像として抽出するAIツール

包括的な紹介 TryOffAnyoneは、Eコマース分野における衣服ディスプレイの課題を解決するために特別に設計された画期的なAI画像処理ツールです。TryOffAnyoneは、実際に服を着ている人の写真を、レイフラットディスプレイ効果のある画像にインテリジェントに変換することができ、この技術は最新のLatent Dif...

2年前

084K

R1-Omni: ビデオと音声による感情分析のためのオープンソースモデル

はじめに R1-Omniは、HumanMLLMチームによってGitHubで立ち上げられたオープンソースプロジェクトです。これは、検証可能な報酬による強化学習（RLVR）技術を、感情認識に焦点を当てたマルチモーダル大規模言語モデルに適用した最初のプロジェクトである。このプロジェクトでは、動画と音声データを...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

084K

エージェント・インボックス：AIインテリジェンスとのヒューマンコンピュータインタラクションのための管理インターフェース

概論 Agent InboxはLangChainチームによって開発されたオープンソースプロジェクトで、AIインテリジェンスと対話するための新しいユーザー体験を提供します。このプロジェクトにより、ユーザーは一元化されたインターフェイスを通して、複数のAIインテリジェンスとのインタラクションを管理し、最適化することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

084K

BrownChat：オープンソースのリアルタイム音声チャットAIアシスタント

概要 BrownChatはLarge Language Modelling (LLM)技術に基づいたリアルタイム音声チャットアプリケーションです。GitHubユーザーのsugarforeverによって開発されたこのプロジェクトは、高度な自然言語処理技術によってユーザーのコミュニケーション体験を向上させることを目的としています。

2年前

084K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR: 3行のコードで画像をMarkdownに変換するOCRライブラリ。

概要 Llama OCRは、Llama 3.2 VisionをベースにしたOCR（光学式文字認識）ライブラリで、文書をMarkdown形式に変換することができます。このライブラリーはNutlope社によって開発され、Togetherを使用しています。

2年前

084K

AutoFlow：基于GraphRAG的对话式知识库/网页深度搜索工具，对话框可集成到其他网站

AutoFlow: GraphRAGベースの会話型知識ベース／ディープ・ウェブ検索ツール。

概要 AutoFlowはPingCAP社によって開発されたオープンソースのツールで、TiDBサーバーレス・ベクトル・ストレージを用いてグラフベースの知識ベースを構築する。LlamaIndexとDSPyフレームワークを統合し、複雑なダイアログ検索と知識グラフをサポートする。

2年前

084K

TripoSF：高解像度3Dモデルを迅速に生成する実用的なツール

概論 TripoSFはVAST-AI-Researchチームによって構築されたオープンソースプロジェクトで、特に1枚の画像から高解像度の3Dモデルを素早く生成するように設計されています。SparseFlexと呼ばれる技術を使用しており、処理効率が高く、一般的な...

1年前

083.9K

DeepSeek-RAG-Chatbot：本地运行的 DeepSeek RAG 聊天机器人

DeepSeek-RAG-Chatbot: ローカルで動作する DeepSeek RAG チャットボット

一般的な紹介 DeepSeek-RAG-Chatbotは、GitHubでホストされているDeepSeek R1モデルに基づいて構築されたオープンソースのチャットボットプロジェクトで、開発者のSaiAkhil066によって作成されました。DeepSeek-RAG-Chatbotは、拡張された生成...

1年前

083.8K

AI-ClothingTryOn：ジェミニベースのバーチャル試着ツール

概論 AI-ClothingTryOnは、開発者のspeedTDによって作成され、GitHubでホストされているPythonベースのオープンソースデスクトップアプリケーションです。このアプリケーションは、Google Geminiの人工知能技術を使用しています。

1年前

083.8K

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

概要 Base Chatは、Ragie Connectを使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、複数のRagie機能のリファレンスアプリケーションであり、Next.jsで構築され、Goo...

1年前

083.8K

FitDiT：衣服のディテールの信憑性を高める高忠実度AIバーチャルフィッティングツール

包括的な紹介 FitDiTは、拡散トランスフォーマー（Diffusion Transformers）に基づいた高忠実度のバーチャルフィッティングシステムである。Tencent AI Labによって開発されたこのプロジェクトは、衣服の詳細を表示するという従来のバーチャルフィッティングシステムの限界に対処することを目的としている。

2年前

083.8K

Tap4 AI WebUI：オープンソースの軽量AIツール・ナビゲーション・プロジェクト

包括的な紹介 Tap4 AI WebUIは、オープンソースの軽量AIツールナビゲーションウェブサイトプロジェクトです。このプロジェクトは、Next.jsとSupabaseテクノロジースタックを使用し、多言語SEO最適化をサポートし、AIツールカタログを提供します。

2年前

083.7K

ドルフィン：アジア言語認識とアジア言語のための音声テキストモデル

総合紹介 Dolphinは、DataoceanAIと清華大学によって開発された、アジア言語の音声認識と言語認識に特化したオープンソースモデルです。東アジア、南アジア、東南アジア、中東の40の言語と22の中国語方言をサポートしています。

1年前

083.7K

Deep Research：基于AI的深度研究助手，提供高效的研究工具和报告生成功能

ディープリサーチ：効率的なリサーチツールとレポート作成機能を提供するAIベースのディープリサーチアシスタント

一般的な紹介 Deep Research は、検索エンジン、ウェブクローリング、大規模な言語モデルを組み合わせることで、反復的なディープリサーチを実行するように設計された AI ベースのリサーチアシスタントです。このプロジェクトは、使いやすいディープリサーチジェネレータを提供することを目的として、dzhng によって GitHub で公開されました。

1年前

083.7K

OpenHealthForAll：个人健康数据管理AI助手，上传检查报告定制健康计划

OpenHealthForAll：個人の健康データ管理のためのAIアシスタント、カスタマイズされた健康計画のための検査レポートのアップロード

概論 OpenHealthForAllは、ユーザーの個人的な健康データの管理と理解を支援するために設計されたオープンソースプロジェクトである。人工知能技術を活用することで、OpenHealthForAllはローカルで動作する健康アシスタントを提供し、ユーザーがより良く管理できるようにします。

1年前

083.7K

CodeWeaver: コード構造とコンテンツから自動的にMarkdownドキュメントを生成します。

一般的な紹介 CodeWeaverは、コード・ライブラリを単一の見やすいMarkdownドキュメントに編むために設計されたコマンドライン・ツールです。ディレクトリを再帰的にスキャンし、各ファイルの内容をコードブロックに埋め込むことで、プロジェクトのファイル階層を構造化した表現を生成します。このツールは...

1年前

083.6K

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。

1年前

083.6K

PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。

総合紹介 PDF文書のレイアウトを自動的に分析し、ページ内のテキスト、タイトル、画像、表、数式、その他の要素を識別し、それらの正しい順序を決定します。このツールはOCR機能をサポートしており、スキャンしたPDFを検索可能なテキストに変換することができます。Docker上で動作し、2つのモデルを提供します。

1年前

083.5K

GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する

包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークであり、GitHubでホストされている。GraphGenは、知識グラフを通して合成データ生成を導くことによって、大規模言語モデル（LLM）の教師ありファインチューニングを最適化することに焦点を当てている。LLMは...

1年前

083.4K

Kreuzberg: あらゆる文書からテキストを抽出するオープンソースツール

一般的な紹介 Kreuzbergは、PDFファイルからのテキスト抽出を簡素化するためのライブラリで、シンプルで手間のかからないテキスト抽出ソリューションを提供するように設計されています。このライブラリは、特にRAG（Retrieval-Augmented Generatio...

1年前

083.4K

csm-mlx: Appleデバイス用csm音声生成モデル

包括的な紹介 csm-mlxはAppleが開発したMLXフレームワークをベースにしており、特にApple Silicon (Apple Silicon) CSM (Conversation Speech Model)音声対話モデル用に最適化されています。このプロジェクトにより、...

1年前

083.4K

NVIDIA联合LangChain推出：分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIAとLangChainが、AI主導のテクニカルレポート生成を可能にする、アナリティクス向け構造化レポート作成のアドバンスガイドを発表

概論これはLangChainとNVIDIAが共同開発した構造化レポート生成ブループリント・プロジェクトで、GitHubのJupyter notebookチュートリアルで紹介されている。このプロジェクトは高度なAI技術、特にLlama-3.3-7...を利用しています。

1年前

083.4K

Memora：人間との相互作用に関する情報を保存・更新するための、人間化されたAIメモリモジュールの構築

概要 Memoraは、パーソナライズされたAIに人間の記憶を複製するように設計されたエージェントである。タイムスタンプ付きの記憶、感情マーカー、マルチモーダル記憶などの機能により、AIが人間のように過去の交流、感情、共有された経験の詳細を記憶することを支援する。

2年前

083.3K

Napkins.dev：ワイヤーフレームをアップロードしてLlama4ベースのフロントエンドコードを生成する

一般的な紹介 Napkins.devはフリーのオープンソースプロジェクトです。コア機能は、ユーザーがインターフェイスのスクリーンショットやワイヤーフレームをアップロードして、実行可能なフロントエンドコードを自動的に生成できるようにすることです。ユーザーはデザイン画を提供するだけでよく、ツールはLlama 4モデル（by Together ...

1年前

083.3K

DeepGEMM：高效支持FP8矩阵运算的开源库（DeepSeek 开源周第三天）

DeepGEMM: FP8行列演算を効率的にサポートするオープンソースライブラリ (DeepSeek Open Source Week 3日目)

包括的な紹介 DeepGEMMは、DeepSeekチームによって開発されたオープンソースのFP8 GEMM (Generalised Matrix Multiplication)ライブラリで、行列演算の効率的なサポートを提供することに重点を置いています。特にNVIDIA HopperアーキテクチャのTensor ...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

083.3K

Pieces OS：逆向Pieces-OS GRPC转换为OpenAI接口（失效）

Pieces OS: Pieces-OSのGRPCをOpenAIインターフェイスに逆変換(失敗)

一般的な紹介 Pieces-OSは、Pieces-OSのGRPCストリームをリバースし、標準的なOpenAI APIインターフェースに変換することを目的としたオープンソースプロジェクトで、Claude、GPT、Geminiをサポートしています。

2年前

083.3K

TextDistiller：一键总结一整本书，高效提炼书籍内容，快速掌握核心思想

TextDistiller：ワンクリックで本全体を要約し、本の内容を効率的に抽出し、核となるアイデアを素早く把握する。

包括的な紹介 TextDistillerは、章ごとに、または全体として本を要約し、簡潔でありながら包括的な概要を提供するように設計された高度なAI駆動型ツールです。TextDistillerを使うことで、ユーザーはどんな本でも、核心となるアイデアや重要なポイントを素早く把握することができます...

2年前

083.2K

オープン・ディープ・リサーチ：ウェブ検索コンテンツに基づくAI研究の生成

概論 Open Deep Researchは、Google Geminiのディープリサーチ機能に代わるオープンソースのAI駆動型リサーチレポート作成ツールである。プロジェクトはTypeScriptで開発されており、Next.js 1...をベースにしています。

1年前

083.2K

オープン・オペレーター：AIインテリジェンスでクラウド・ブラウザの操作を自動化する

概論 Open Operatorは、AIインテリジェンスによってブラウザの操作を自動化することを目的としたオープンソースプロジェクトである。このプロジェクトはBrowserbaseによって開発され、StagehandとBrowserbaseの技術を組み合わせています...

2年前

083.2K

3FS：データアクセス効率を向上させる並列ファイルシステム（DeepSeek Open Source Week 5日目）

概説 3FS（Fire-Flyer File System）は、DeepSeekチームによって開発されたオープンソースの並列ファイルシステムで、最新のSSDとRDMAネットワーク向けに設計されており、データアクセス効率の飛躍的な向上を目指している。180ノードのクラスタに実装されています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

083.2K

Workers AIに基づいて、無料で複数のファイルをMarkdown形式に変換する

概要 serverless-markdown-convertorは、Cloudflare WorkerとWorkers AIをベースとしたフリーでオープンソースのツールで、様々なファイルをMarkdow...

1年前

083.2K

OpenSearch-SQL: 自然言語をSQLクエリに変換するオープンソースツール

包括的な紹介 OpenSearch-SQLはオープンソースプロジェクトで、ユーザーの自然言語記述をSQLクエリ文に変換できる強力なText-to-SQLツールです。このプロジェクトはO...

1年前

083.2K

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...

1年前

083.2K

小半 WordPress AI 助手：实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: 対話、投稿生成、翻訳のためのWordPress AIアシスタントプラグイン

総合紹介 WordPress AI Assistant Plugin (wp-ai-chat)は、AI対話、記事生成、記事要約、記事翻訳、コンテンツ読み上げなど、様々なAI機能をユーザーに提供するために設計されたオープンソースのWordPressプラグインです。このプラグインは、複数のAIとのドッキングをサポートしています。

1年前

083.2K

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは単に...

2年前

083.1K

ANUS：タスク自動化とマルチエージェント・コラボレーションのためのオープンソースAIフレームワーク

概論 ANUS（Advanced Neural Understanding System）は、GitHubでホストされているオープンソースのAIエージェント・フレームワークである。

1年前

083.1K

Shandu: 複数のラウンドで情報を収集・分析するためのAIリサーチ自動化ツール

一般的な紹介 ShanduはGitHubでホストされているオープンソースの人工知能ベースの研究システムで、開発者のjolovicdevによって作成されました。LangChainとLangGraphの技術を利用し、自動化された包括的な...

1年前

083K

LocalGPT：ローカルデバイス上の複数のドキュメントと対話することで、データプライバシーを確保する

一般的な紹介 LocalGPTはオープンソースプロジェクトで、ユーザーがローカルデバイス上のドキュメントと会話できるように設計されており、データのプライバシーを保証します。様々なオープンソースモデルを使用することで、LocalGPTはデータをクラウドにアップロードすることなく、ドキュメントコンテンツを処理し理解することができます。このプロジェクトは、様々なアプリケーションをサポートしています。

2年前

083K

HelloMeme：生成局部高保真表情动作一致的图像或视频，Runway Act one 开源平替

HelloMeme：ローカルの忠実度の高い表現アクション一貫性のある画像やビデオを生成、Runway Act oneオープンソースピンポン！

包括的な紹介 HelloMemeはHelloVisionによって開発されたオープンソースプロジェクトであり、空間編み目アテンションを統合することによって、拡散モデルに高レベルで忠実なストリップを埋め込むことを目的としている。

2年前

082.9K

HealthGPT：医療画像解析と診断Q&Aを支援する医療ビッグモデル

包括的な紹介 HealthGPTは、異種知識適応による統一的な医療視覚理解と生成能力の達成を目指す、先進的な医療グランドビジュアル言語モデルである。このプロジェクトの目標は、医療グラフを大幅に改善する統一的な自己回帰フレームワークに医療視覚理解と生成能力を統合することである。

1年前

082.9K

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

総合紹介 AudioNotesは、FunASRとQwen2に基づいて構築された、オーディオ/ビデオから構造化ノートへのシステムです。オーディオ/ビデオコンテンツを素早く抽出し、大きなモデルを呼び出して構造化されたMarkdownノートを生成することができます。

1年前

082.8K

H2O GPT: ネイティブAI対話および文書処理ツールの柔軟な構成

一般的な紹介 H2O GPTは、プライベート化されたチャットとドキュメント処理機能を提供することを目的としたオープンソースプロジェクトです。このプロジェクトはApache 2.0ライセンスに基づいており、LLaMa2、Mistral、Falconなどの様々なGPTモデルをサポートしています。...

2年前

082.8K

Humanify：AIの助けを借りてJavaScriptコードを素早く解読し、美化するツール

一般的な紹介 HumanifyはGitHubでホストされているオープンソースツールで、開発者のJesse Luotoによって、プログラマーが人工知能技術を使用して難読化されたJavaScriptコードを素早く解読し、美しくするために作成されました。このツールはCh...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

082.8K

Exa & Deepseek Chat App：实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App: リアルタイムのウェブ検索と知的推論のためのオープンソースチャットアプリ

包括的な紹介 Exa & Deepseekチャットアプリは、オープンソースのスマートチャットアプリです。主な機能には、ExaのAPIを使用したリアルタイムのウェブ検索や、インテリジェントなDeepseek R1言語モデルの使用などがあります。

2年前

082.8K

Markdown To Poster：将Markdown转换为社交媒体/小红书海报，支持在线编辑和一键部署。

Markdown To Poster: オンライン編集とワンクリック配備サポートで、Markdownをソーシャルメディアや小赤字ポスターに変換します。

概要 Markdown to Imageは、Markdownテキストを視覚的に魅力的なソーシャルメディア画像にレンダリングするためのReactコンポーネントです。このプロジェクトには、オンラインのMarkdown to posterエディタとして使用できる組み込みのWebエディタも含まれています...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

082.8K

RSS Translator: RSSコンテンツをリアルタイムで購読・翻訳するツール

概要 RSS Translatorは、ユーザーがリアルタイムでRSSコンテンツを翻訳して購読できるように設計された、オープンソースのクリーンで自己展開可能なツールです。このツールは、Google翻訳、Microsoft Tra...など、複数の翻訳エンジンをサポートしています。

1年前

082.8K

LongWriter：智谱推出生成超长文本的强大模型，支持一次对话生成10000+字

LongWriter：ウィズダム・スペクトラムは、超長文を生成するための強力なモデルを発表し、1回の会話で10,000語以上の生成に対応。

包括的な紹介 LongWriter は、清華大学データマイニング研究グループ (THUDM) によって開発された強力な長文生成ツールです。このツールは、先進的なロングコンテクスト言語モデル（LLM）に基づいており、10,000語以上の長文を生成することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

082.7K

FastAPI DocGPT: FastAPIベースのPDF文書処理とQ&Aシステム

一般的な紹介 FastAPI DocGPTは、FastAPIベースのドキュメントクイズシステムで、ユーザがPDFファイルをアップロードし、ドキュメントの内容に基づいてクイズを受けることができます。このシステムは、OpenAIのエンベッディング技術を利用して、ドキュメントのコンテンツをベクターデータベースのQ...

2年前

082.7K

Diffbot GraphRAG LLM：依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: 外部リアルタイム知識グラフデータに依存するLLM推論サービス

包括的な紹介 Diffbot LLM Reasoning Server は LLama モデルアーキテクチャに基づいた特別な最適化と改良が施された革新的な大規模言語モデリングシステムです。このプロジェクトの最も重要な特徴は、リアルタイムナレッジグラフと検索を強化した生成の統合です...

2年前

082.6K

スーパーメモリー：ブックマークやウェブコンテンツをインポートして個人の知識ベースを構築する

概論 Supermemoryは、ユーザーが「第二の脳」を構築することを支援するために設計されたオープンソースプロジェクトである。強力なChrome拡張機能とAI技術により、ユーザーはウェブページやTwitterのブックマークから簡単にデータを保存、整理、取得することができます。

2年前

082.6K

Aana SDK: マルチモーダルAIモデルを簡単に導入できるオープンソースツール

概論 Aana SDKはMobius Labsが開発したオープンソースのフレームワークで、マラヤーラム語のആന（象）にちなんで名付けられた。開発者がマルチモーダルAIモデルを迅速にデプロイ、管理できるように支援し、テキスト、画像、音声、動画、その他のデータの処理をサポートします。

1年前

082.6K

OpenDeepSearch: 知的推論をサポートするオープンソース検索ツール

概要 OpenDeepSearchは、sentient-agiチームによって開発されたオープンソースの検索ツールです。大規模言語モデリング(LLM)と知的推論エージェントを組み合わせ、ユーザがウェブページから情報を検索し、簡単な方法で正確な答えを得ることを可能にします。この ...

1年前

082.5K

Artab：ブラウザで開いた新しいタブで世界の名画を表示、Chromeプラグイン

一般的な説明 Artabは、新しいタブを開くたびに世界の素晴らしい芸術作品を紹介するように設計されたブラウザ拡張機能です。この拡張機能はChrome、Edge、Firefoxブラウザで利用できます。Artabを使用すると、ユーザーはブラウズすることができます...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

082.5K

PrivateGPT: RAG処理フローを完全に局所化した文書Q&Aシステム

一般的な紹介 PrivateGPTは、インターネットに接続せずに大規模言語モデル（LLM）を使って文書をクイズすることを可能にする、本番環境で利用可能なAIプロジェクトです。このプロジェクトは、100%のデータプライバシーを保証し、すべてのデータはユーザの実行環境で処分されます...

2年前

082.5K

MCPサービスのセキュリティリスクを検出するオープンソースツール

一般的な紹介 mcp-is-dangerousは、Shaojie JiangによってGitHub上で開発されたオープンソースツールです。シンプルなPythonコードを使用し、ユーザーがMCP（Model Context ...

1年前

082.5K

Describe Anything: 画像やビデオ領域の詳細な説明を生成するオープンソースツール

一般的な説明 Describe AnythingはNVIDIAといくつかの大学によって開発されたオープンソースプロジェクトで、Describe Anything Model (DAM)を中核としています。このツールは、ユーザーの...

1年前

082.5K

SimGRAG: 類似部分グラフを用いた知識グラフ駆動型検索拡張生成

包括的な紹介 SimGRAG (SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented G...

2年前

082.5K

Model Context Provider CLI：任意大模型中使用MCP服务的命令行工具，不依赖Claude

Model Context Provider CLI: クロードに依存しない、あらゆる大規模モデルでMCPサービスを使用するためのコマンドラインツール。

包括的な紹介モデルコンテキストプロバイダCLI（mcp-cli）は、モデルコンテキストプロバイダサーバと対話するためのプロトコルレベルのコマンドラインツールです。このツールによって、ユーザーはコマンドを送信したり、データを照会したり、サーバーが提供する様々なリソースと対話したりすることができます...

1年前

082.4K

DeepSeek-R1-FP4：FP4优化版DeepSeek-R1推理速度25倍

DeepSeek-R1-FP4：DeepSeek-R1の推論を25倍高速化したFP4最適化バージョン

包括的な紹介 DeepSeek-R1-FP4は、NVIDIAがオープンソース化し最適化した定量化言語モデルで、DeepSeek AIのDeepSeek-R1をベースに開発されました。DeepSeek-R1-FP4 は、DeepSeek AIのDeepSeek-R1をベースに開発され、TensorRT Model Opt...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

082.4K

Podcastfy：多源内容转多语言音频对话工具，NotebookLM 播客功能的开源替代方案

Podcastfy：NotebookLMのポッドキャスティング機能に代わるオープンソースの多言語音声会話ツール、マルチソースコンテンツ

一般的な紹介 PodcastfyはオープンソースのPythonパッケージで、生成人工知能（GenAI）技術を使用して、ウェブコンテンツ、PDFファイル、テキスト、画像、YouTube動画、その他多くのソースを魅力的な多言語に変換します。

2年前

082.4K

Groq AppGen：使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: Groq APIを使用したLlama 3.3 70B HTMLコード生成機能の実証実験プロジェクト

一般的な紹介 Groq AppGenは、Groq Inc.によって開発され、オープンソース化された革新的なインタラクティブ・ウェブ・アプリケーション・ジェネレーターです。このプロジェクトは、HTMLコード生成のためのLlama 3.3 70Bモデルのパワーを実証しています。Groq...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

082.3K

オープンMCPクライアント：ウェブベースのMCPクライアントで、あらゆるMCPサービスに素早く接続できます。

概要 Open MCP Clientはオープンソースのツールで、最大の特徴はMCP（Model Context Protocol）クライアントのウェブバージョンを提供することです。また ...

1年前

082.3K

dsRAG: 非構造化データと複雑なクエリのための検索エンジン

概要 dsRAGは、非構造化データに対する複雑なクエリを処理するために設計された高性能検索エンジンである。dsRAGは、財務報告書、法律文書、学術論文など、高密度なテキストに含まれる難易度の高いクエリに対して特に優れた性能を発揮する。dsRAGは性能を向上させるために3つの主要なアプローチを採用している。

1年前

082.3K

Go-Proxy：Docker統合のための高性能リバースプロキシサーバー

包括的な紹介 Go-ProxyはGo言語を使って開発された高性能なプロキシサーバーで、主にさまざまなネットワーク環境でプロキシサービスを提供するために使用されます。HTTP、HTTPS、SOCKS5、WebSocket、TCP、UDPを含む様々なプロトコルをサポートし、プロキシサーバーとして使用することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

082.3K

HiveChat：企業内で迅速に展開できるAIチャットボット

概要 HiveChatは中小規模のチーム向けのAIチャットボットで、管理者は複数のAIモデル（Deepseek、OpenAI、Claude、Geminiなど）を一度に設定し、チームメンバーが簡単に使用できるようにすることができます。このチャットボットは ...

1年前

082.3K

InspireMusic：Aliのオープンソース統合音楽・楽曲・音声生成フレームワーク

一般的な紹介 InspireMusicはPyTorchベースのオープンソースツールキットで、音楽、歌、オーディオの生成に特化しています。高品質なオーディオを生成するための統一されたフレームワークを提供し、テキストキュー、音楽構造、音楽スタイルを制御します。

1年前

082.3K

BotSharp：.NETベースのマルチインテリジェンスAI開発・管理プラットフォーム

包括的な紹介 BotSharpは、包括的なAIチャットボットプラットフォーム構築ツールを提供することに特化した、.NET Coreベースのオープンソースプロジェクトです。C#プログラミングを採用し、クロスプラットフォームでの運用をサポートし、機械学習アルゴリズムの適用を簡素化することで、エンタープライズレベルの開発者が効率的に...

2年前

082.2K

UIGEN-T1-Qwen-7b: HTML および CSS UI コンポーネント生成のための特殊モデル

総合的な紹介 UIGEN-T1は、Qwen2.5-Coder-7B-Instruct上で微調整された70億パラメータのトランスフォーマーモデルで、推論ベースのUI生成用に設計されています。複雑な...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

082.2K

TPO-LLM-WebUI：質問を入力してリアルタイムにモデルを学習し、結果を出力できるAIフレームワーク。

概論 TPO-LLM-WebUIは、AirmomoがGitHubでオープンソース化している革新的なプロジェクトで、直感的なWebインターフェースを通じて大規模言語モデル（LLM）のリアルタイム最適化を可能にします。TPO (Test-Time Pr...

1年前

082.2K

Ovis：画像手がかり語の正確なバックプロパゲーションのための視覚的・テキスト的アライメントモデル

一般的な紹介 Ovis (Open VISion) は、アリババの国際デジタル商取引グループのAIDC-AIチームによって開発され、GitHubでホストされているオープンソースのマルチモーダル大規模言語モデル（MLLM）です。このモデルは、革新的な構造埋め込みアライメント技術を使用して、視覚化...

1年前

082.2K

シンバ：文書整理のためのナレッジマネジメントシステムで、あらゆるRAGシステムにシームレスに統合されます。

概要 Simbaは、あらゆるRAG（Retrieval Augmentation Generation）システムとシームレスに統合できるように設計されたポータブルな知識管理システム（KMS）です。GitHubのユーザーGitHamza0206によって作成されたこのプロジェクトは、様々なナレッジマネジメントのための効率的なソリューションを提供します。

1年前

082.2K

ディープリサーチWeb UI：多言語でのディープリサーチをサポートするAIアシスタント

包括的な紹介 Deep Research Web UIは、AI技術に基づいたオープンソースのリサーチアシスタントツールであり、ユーザーがあらゆるトピックについて深い反復研究を行うことを支援するように設計されています。直感的なウェブインターフェースを通じて、検索エンジン、ウェブクローリング、大規模言語モデリングのパワーを組み合わせています...

1年前

082.1K

llms.txt Generator：快速抓取网站内容并，生成LLM训练文本数据集

llms.txt Generator: Webサイトのコンテンツを素早くキャプチャし、LLMトレーニング用テキストデータセットを生成します。

包括的な紹介 llmstxt-generatorは、大規模言語モデリング(LLM)の訓練と推論のための高品質のテキストデータセットを準備するための専門的なウェブコンテンツ抽出と統合ツールです。このツールはMendable AIによって開発され、@firec...

2年前

082.1K

Coding-Tutor: 個別のプログラミング指導を提供するインテリジェントなティーチング・アシスタント

一般的な紹介 Coding-Tutorは、GitHubでホストされているオープンソースプロジェクトで、開発者のiwangjianによって作成され、学習者にパーソナライズされたプログラミング教育の経験を提供します。会話型AI技術を使用し、ユーザーの知識背景と...

1年前

082K

WhoDB: 自然言語対話をサポートする軽量データベース可視化管理ソフトウェア

概要 WhoDBは、データベース管理タスクを簡素化するために設計された、軽量(~20MB)で強力かつユーザーフレンドリーなデータベース管理ツールです。Adminerのシンプルさと、ユーザーエクスペリエンスとパフォーマンスの向上を兼ね備えています。

2年前

082K

講師：大規模言語モデルの構造化出力ワークフローを簡素化するPythonライブラリ

概要 Instructorは、大規模言語モデル（LLM）からの構造化出力を処理するために設計された人気のあるPythonライブラリです。Pydanticをベースに構築されており、データを管理するためのシンプルで透過的、かつユーザーフレンドリーなAPIを提供します。

1年前

081.9K

Gemini Search：Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎

Gemini Search: Gemini 2.0 Flashで構築されたPerplexityスタイルのAI検索エンジン

包括的な紹介 Gemini-SearchはGoogle Gemini 2.0の技術に基づいたオープンソースのインテリジェント検索エンジンのプロジェクトである。このプロジェクトはTypeScriptを使用しており、Perplexity検索エンジンの複製に取り組んでいる。

2年前

081.9K

Chunkr: 文書の取り込みにビジュアルモデルを使用し、テキストの段落階層に基づくインテリジェントなチャンキングを行うオールインワンサービス。

概要 Chunkrは、PDF、PPTX、DOCX、ExcelファイルをRAG（Retrieval Augmented Generation）やLLM（Large Language Modelling）で使用するのに適したデータに変換するためのセルフホストAPIです。このプロジェクトはLumina...によって開発されました。

2年前

081.9K

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...

1年前

081.9K

検索 o1: 推論モデルに能動的な検索機能を与え、大規模モデルが思考しながら外部の知識を検索できるようにする。

包括的な紹介 Search-o1は、高度な検索メカニズムを統合することで、大規模推論モデル(LRM)のパフォーマンスを向上させることを目的としたオープンソースプロジェクトである。コアとなるアイデアは、動的な検索と知識の統合を通じて、推論プロセスで遭遇する知識不足の問題を解決することです。プロジェクトのスポンサーはsunn...

2年前

081.9K

DevDocs：技術文書を素早くクロールして整理するMCPサービス

概要 DevDocsは、CyberAGIチームによって開発され、GitHubでホストされている完全に無料のオープンソースツールです。プログラマーやソフトウェア開発者のために設計されたこのツールは、技術文書のURLから始まり、関連するページを自動的にクロールし、簡潔なMa...

1年前

081.9K

STORM：トピックに基づくウェブデータの検索、引用文献を含む論文の生成、長い論文レポート

概論 STORMはスタンフォード大学のOvalチームによって開発された知識統合・記事生成システムである。ウィキペディアのような網羅的な記事（体系的な論文）をゼロから生成することに重点を置いている。このシステムは、トピックの調査、概要の作成、実際の相互接続のシミュレーションのために大規模な言語モデルを使用する。

1年前

081.9K

CRCT：大規模コードタスクの再帰的分解とプロジェクト状態の永続的保存

概論 Cline Recursive Chain-of-Thought System（略してCRCT）は、VS Codeで大規模なコード・プロジェクトを管理するために設計されたオープンソースのフレームワークである。現在のバージョンはv7.0で、VS Code上で再帰的に...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

081.8K

Crawl4LLM：LLM事前学習のための効率的なウェブクローリングツール

包括的な紹介 Crawl4LLMは清華大学とカーネギーメロン大学によって共同開発されたオープンソースプロジェクトであり、大規模モデル（LLM）の事前学習のためのウェブクローリングの効率最適化に焦点を当てている。高品質なウェブページデータをインテリジェントに選択することで、非効率なクロールを大幅に削減し、本来1...

1年前

081.8K

WikiChat：ウィキペディアのデータを使って知識を検索するためのチャットツール

概論ウィキチャットはスタンフォード大学で開発された実験的なチャットボットで、ウィキペディアからデータを取得することで、大規模言語モデルの事実性を向上させることを目的としている。大規模言語モデル（ChatGPTやGPT-4など）は、最新の情報や人気のないトピックを処理する傾向があります。

2年前

081.8K

TrendPublish：AIニュースをリアルタイムで追跡・要約し、WeChatに自動配信。

概論 ai-trend-publishはGitHubでホストされているオープンソースプロジェクトで、OpenAISpaceチームによって開発された。このツールは、開発者、技術ホビースト...

1年前

081.8K

ComfyUI Portrait Master 中文版：优化肖像生成的提示词工具

ComfyUI ポートレートマスター中国語版：似顔絵生成を最適化するキューワードツール

はじめに ComfyUI Portrait Master 中国語版は、AI画像クリエイターのために設計された似顔絵キューワード生成ツールです。このツールは、ユーザーがキューワードを最適化することによって、高品質の似顔絵を生成するのに役立ちます。ユーザーは、要求に応じて異なるレンズを選択することができます...

2年前

081.8K

Text2Video-Zero：Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Picsart AI研究チームによるテキストからビデオへのゼロサンプル生成ツールがリリースされました。

一般的な紹介 Text2Video-Zeroは、Picsart AI Researchチームによって開発されたGitHub用のサンプル数ゼロのテキストからビデオへのジェネレーターの公式実装です。このプロジェクトは、時間的一貫性と正しいテキストを生成するためにテキストキューを使用する方法を提供します。

2年前

081.7K

FlipSketch: 静的なドローイングをテキストガイド付きのスケッチアニメーションに変換し、アニメーションプロセスを簡素化します。

一般的な紹介 FlipSketchは、静的な図面をテキストガイド付きのアニメーションに変換するために設計されたオープンソースプロジェクトです。GitHubでホストされているこのプロジェクトは、ユーザーがテキストの説明からアニメーション効果を生成できる革新的なツールを提供しています。

2年前

081.7K

AI Web Operator：浏览器自动化操作，OpenAI Operator的开源实现

AI Web Operator: ブラウザ自動化、OpenAI Operatorのオープンソース実装

概要 AI Web Operatorは、複数のAI技術とSDKを統合することで、ブラウザでのユーザー体験を簡素化するために設計されたオープンソースのAIブラウザ・オペレーター・ツールです。このツールは、BrowserbaseとVercel...をベースにしています。

2年前

081.7K

AgentIQ: AIインテリジェンスの柔軟な接続と管理のためのオープンソースツール

概要 AgentIQは、開発者がAIインテリジェンスを効率的に接続・管理できるように設計されたNVIDIAのオープンソースツールです。異なるフレームワークのインテリジェンスがシームレスに連携し、企業データとツールを接続し、関数を呼び出すようなワークフローを構築することを可能にします。このツールの最大の特徴は...

1年前

081.7K

PhiData: 記憶、知識、ツールを備えたAIインテリジェンスの構築

包括的な紹介 PhiDataは、インテリジェントなAIアシスタントを開発するために設計されたフレームワークです。PhiDataは、拡張されたメモリ、知識統合、ツール呼び出し機能を通じて、AIアシスタントが長期的な会話を行い、正確なビジネスコンテキストを提供し、さまざまな操作を実行できるようにします。

1年前

081.6K

素晴らしいCursorRules：CursorのAI体験を向上させるルールセット

概要 awesome-cursorrulesは、Cursor AI用のカスタムルールファイルを提供することに特化したプロジェクトです。Cursor AIはAIを搭載したコードエディタで、.cursorrulesファイルは...

2年前

081.6K

Morphic：AIを搭載したオープンソース検索エンジン、スマートなQ&A、動画検索、UIコードの生成を提供

一般的な紹介 MorphicはAI技術に基づいた検索エンジンで、インテリジェントなQ&Aと効率的な検索体験を提供するように設計された生成的なユーザーインターフェースを持つ。ユーザーはMorphicでテキスト、動画など様々な検索を行うことができ、検索履歴の保存や検索結果の共有が可能です。

2年前

081.6K

ミニカバー：ブログ、ショートビデオ、ソーシャルメディアなどにパーソナライズされたカバーを作成するために設計されたオンラインカバーメーカー！

概要 Mini-Coverは、ブログやショートビデオ、ソーシャルメディアなどのプラットフォーム用にパーソナライズされたカバーを生成するために設計されたオープンソースのオンラインカバー生成ツールです。JLinMrによって開発されたこのツールは、シンプルで効率的なソリューションを提供し、ユーザーのニーズに合ったカバーを素早く生成することを目的としています。

2年前

081.6K