AIオープンソースプロジェクト

合計1020記事

順番に並べる

PocketFlow：100行のコードでAIアプリケーションを開発するための最小限のフレームワーク

総合紹介 PocketFlowは、The-Pocketチームによって開発され、GitHub上でオープンソース化された、わずか100行のコードからなる軽量なAIアプリケーション開発フレームワークです。ミニマリストデザインを追求し、100行のコアコード制御、外部依存なし...

1年前

069.3K

xiaozhi-esp32-server: Xiaozhi AIチャットボットオープンソースバックエンドサービス

一般的な紹介 xiaozhi-esp32-serverはXiaozhi AIチャットボット（xiaozhi-esp32）のバックエンドサービスを提供するツールです。Pythonで書かれており、WebSocketプロトコルをベースにしています。

1年前

0167.3K

WeChatのCoze：WeChatにCoze（ボタン）ボットを導入

概要 Coze on WeChatは、ユーザーがCozeプラットフォームからWeChatにAIボットをシームレスに接続できるように設計されたオープンソースプロジェクトです。chatgpt-on-wechatとdify-on-wechatの開発に基づいています。

1年前

088.3K

csm-mlx: Appleデバイス用csm音声生成モデル

包括的な紹介 csm-mlxはAppleが開発したMLXフレームワークをベースにしており、特にApple Silicon (Apple Silicon) CSM (Conversation Speech Model)音声対話モデル用に最適化されています。このプロジェクトにより、...

1年前

061.2K

Langfuse：LLMアプリケーションのためのオープンソース観測・デバッグプラットフォーム

概要 LangfuseはオープンソースのLLM（大規模言語モデル）エンジニアリングプラットフォームです。LLMアプリケーションのトレース、デバッグ、最適化を支援し、呼び出しの観察、キューワードの管理、実験の実行、結果の評価を行うツールを提供します。このプラットフォームは、Langfuseチームによって開発されています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

093K

GAG：人間の行動をシミュレートする大規模モデルを用いた社会関係グラフの生成

はじめに GraphAgentは、Ji-Catherによって開発され、GitHubでホストされているオープンソースのフレームワークです。Large Language Model (LLM)を使用して人間の行動をシミュレートし、テキスト属性を持つダイナミックなソーシャルグラフを生成します。このツールは、オンライン・ソーシャル・メディア...

1年前

051.3K

CSMボイスクローニング：CSM-1Bによる高速ボイスクローニング

概要 CSM Voice Cloningは、Isaiah Bjorkによって開発され、GitHubでホストされているオープンソースプロジェクトです。このプロジェクトはSesame CSM-1Bモデルに基づいており、ユーザは音声サンプルを提供するだけでクローンを作成することができます。

1年前

055K

AgenticSeek：完全にローカルで動作するタスク自動化のためのAIアシスタント

概要 AgenticSeekは、完全にローカルで動作するオープンソースのAIアシスタントで、Deepseek R1モデルに基づいています。クラウドAPIを必要とせず、数百ドルの月額費用もかかりません。映画の「ジャービス」のような知的アシスタントを目指しています。

1年前

074.9K

MM-EUREKA：視覚的推論を探求するマルチモーダル強化学習ツール

MM-EUREKAは、上海交通大学の上海人工知能研究所とその他の関係者によって開発されたオープンソースプロジェクトです。ルールベースの強化学習技術により、テキスト推論機能をマルチモーダルシナリオに拡張し、モデルによる画像とテキスト情報の処理を支援します。このツールのコア...

1年前

057.1K

Feeds.Fun：自動的にタグ付けとフィルタリングを行うRSSフィード

一般的な紹介 Feeds.Funは、ユーザーが効率的にニュースを読むためのツールであり、自動的にニュースにタグを付けたり、ユーザーの好みに基づいてコンテンツをフィルタリングするなどのコア機能を備えています。開発者のAliaksei Yaletski（スクリーンネームTiendil）によって作成され、...

1年前

062.7K

Ollama+LangGraph 学術研究レポート作成アシスタントのローカル展開

概要 Ollama Deep Researcherは、LangChainチームによって開発された、完全にネイティブに動作するウェブリサーチとレポート生成アシスタントです。Ollamaによってホストされている任意の大規模言語モデル（LLM）と連動し、ユーザが...

1年前

055.1K

Agentic Radar: Agentic ワークフローのセキュリティ検査用可視化ツール

概要 Agentic Radarは、大規模モデル（LLM）ベースのAIワークフローをスキャンし、セキュリティを確保するために設計されたSplxAIのオープンソースツールです。コードを分析することで、明確なワークフロー図とセキュリティレポートを生成し、開発者やセキュリティ専門家を迅速に支援します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

052.4K

Xata Agent: PostgreSQLデータベースの監視と最適化のためのAIアシスタント

概要 Xata Agentは、PostgreSQLデータベース専用に設計されたオープンソースのAIツールです。データベースの稼働状況を自動的に監視し、パフォーマンス上の問題や障害の根本原因を突き止め、それを解決するための推奨事項を提示します。開発チームのxAIは、このツールをPostgreSQLのような...

1年前

050.4K

ACE++: テキストコマンドによる画像の正確なローカル編集を可能にする多機能なオープンソースツール

包括的な紹介 ACE++は、Alibaba Tongyi Lab (Tongyi Lab)のali-vilabチームによって開発されたオープンソースプロジェクトです。FLUX.1-Fill-devモデルに基づいており、簡単なテキストコマンドで画像生成とコンパイルを実現することを目指しています...

1年前

069.4K

Magic MCP: モダンなUIコンポーネントを生成するMCPサービス

一般的な紹介 Magic MCPは21st.devチームによって開発されたAI駆動ツールで、フロントエンド開発者のために設計されています。自然言語の記述からモダンなUIコンポーネントをオンザフライで生成し、Cursor、WindSurfと統合します。

1年前

074K

ベーシック・メモリー：AIとの会話から永続的な知識グラフを構築するMCPサービス

概論 Basic Memoryは、ClaudeのようなAIアシスタントとの会話を通じてナレッジグラフを構築するためのツールである。Basic Machinesによって開発され、対話の内容をMarkdownファイルとして保存すること、...

1年前

062.5K

Chitu (Red Rabbit): 清華チームが発表した高性能大規模言語モデル推論フレームワーク

Chituは、清華大学のPACMANチームによって開発されたオープンソースの推論フレームワークで、「Red Rabbit」と呼ばれ、大規模な言語モデルを実行するために特別に設計されています。Chituは効率性、柔軟性、実用性に重点を置いており、企業が様々なデバイス上で大規模なモデルを迅速に展開することを可能にします。 Chituは様々なハードウェアをサポートしています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

052.9K

MCP Playwright：ブラウザの自動化操作を提供するMCPサービス

一般的な紹介 MCP-Playwrightは、ExecuteAutomationによって開発され、GitHubでホストされているオープンソースのツールです。PlaywrightとModel Context Proto... をベースにしている。

1年前

073.7K

SuperWeChatPC：オープンソースコンピュータ微信機能強化ツール、二次開発支援

総合紹介 SuperWeChatPCはオープンソースのコンピュータ用WeChat拡張ツールであり、その核心はユーザーと開発者に利便性を提供することである。当初、WeChatは単独でしか開くことができないという問題を解決し、後にWeChatSDKを追加し、開発者がWeChatの機能を呼び出すことができるようにしました。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

059.3K

CRCT：大規模コードタスクの再帰的分解とプロジェクト状態の永続的保存

概論 Cline Recursive Chain-of-Thought System（略してCRCT）は、VS Codeで大規模なコード・プロジェクトを管理するために設計されたオープンソースのフレームワークである。現在のバージョンはv7.0で、VS Code上で再帰的に...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

054.1K

WeWe RSS：WeChatの公開RSSフィードを生成するオープンソースツール

包括的な紹介 WeWe RSSは、WeChatの公開番号ユーザーのために特別に設計された無料のオープンソースツールです。WeChatの読書プラットフォームを通じて公開番号の記事を取得し、RSSフィードを生成するため、ユーザーはRSSリーダーを使っていつでもコンテンツを閲覧することができます。このツールは、WeChat公開番号の文字...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0140.9K

Wan 2.1に基づくビデオ生成機能を提供するComfyUI用プラグイン

一般的な紹介 ComfyUI-WanVideoWrapperは、ComfyUIプラットフォーム用に設計された、開発者kijaiによって作成されたオープンソースのプラグインです。WanVideoのWan2.1モデルに基づいており、強力なビデオ圧縮機能を提供します。

1年前

0137.6K

SciToolAgent: 500以上の研究ツールを統合し、研究と科学的タスクを自動化するインテリジェンス

包括的な紹介 SciToolAgentは、杭州にある浙江大学のイノベーションセンター（HICAI-ZJU）によって開発されたオープンソースのツールプラットフォームです。ナレッジグラフ（SciToolKG）とビッグランゲージモデリング技術を通じて500以上の科学ツールを統合し、研究者が...

1年前

055.3K

オープンMCPクライアント：ウェブベースのMCPクライアントで、あらゆるMCPサービスに素早く接続できます。

概要 Open MCP Clientはオープンソースのツールで、最大の特徴はMCP（Model Context Protocol）クライアントのウェブバージョンを提供することです。また ...

1年前

057.6K

VACE: ビデオ制作・編集のためのオープンソースモデル（オープンではない）

総合紹介 VACEはAlitongyi Visual Intelligence Lab (ali-vilab)によって開発されたオープンソースプロジェクトで、ビデオの作成と編集に焦点を当てています。リファレンスに基づいた動画の生成、既存の動画コンテンツの編集、ローカライズの修正など、様々な機能を統合したオールインワンツールです。

1年前

052.7K

Autiobooks: epub電子書籍をm4bオーディオブックに変換する

概要 Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。自然で滑らかな音声を生成するために、Kokoroが提供する高品質の音声合成技術を使用しています。このツールは...

1年前

057.4K

Story-Flicks：トピックを入力することで、子供向けのショートストーリービデオが自動生成される。

包括的な紹介 Story-Flicksは、ユーザーがHDストーリービデオを素早く生成することに焦点を当てたオープンソースのAIツールです。ユーザーはストーリーのトピックを入力するだけで、システムは大規模な言語モデルを通してストーリーの内容を生成し、AIが生成した画像、音声、字幕を組み合わせて完全なビデオを出力します。

1年前

054.9K

Qdrantベクトル検索エンジン上に構築されたMCPサービス

概要 mcp-server-qdrantはQdrantベクトル検索エンジン上に構築されたモデルコンテキストプロトコル(MCP)サーバーです。主にAIシステムが記憶を保存したり検索したりするのに使われます。

1年前

061.6K

R1-Omni: ビデオと音声による感情分析のためのオープンソースモデル

はじめに R1-Omniは、HumanMLLMチームによってGitHubで立ち上げられたオープンソースプロジェクトです。これは、検証可能な報酬による強化学習（RLVR）技術を、感情認識に焦点を当てたマルチモーダル大規模言語モデルに適用した最初のプロジェクトである。このプロジェクトでは、動画と音声データを...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

057.4K

フライング・パドル PP-TableMagic: 複雑なテーブルの構造化情報抽出

表認識の目的は、画像中の表を解析し、表の構造やセルの位置を正確に特定し、構造化された表形式（HTMLなど）に変換することである。今日の情報化時代において、大量の重要な表データがまだ構造化されていない状態で存在している（例えば、統計表の写真をスキャンした文書など）。

1年前

066.7K

BlenderMCP：3Dモデルの生成にBlenderを使用するMCPサービス

一般的な紹介 BlenderMCPは、モデルコンテキストプロトコル（MCP）プロトコルを介してBlenderとClaude AIを接続するオープンソースツールです。ユーザはテキストコマンドを使って、Claude AI を直接制御することができます。

1年前

072.7K

Cloudflare Agents: エッジネットワーク上にリアルタイムの対話型インテリジェンスを構築

概論 Cloudflare AgentsはCloudflareのオープンソース開発フレームワークで、開発者がグローバルエッジネットワーク上にインテリジェントなAIエージェントを構築できるように設計されています。エージェントが状態を保持し、リアルタイムで通信し、自律的に実行する能力を提供します。

1年前

060K

codemcp: コーディング・アシスタント MCP for Claude Desktop

概要 codemcp は、Edward Z. Yang 氏が GitHub で開発した、Claude Desktop ユーザーのためのオープンソースツールです。Claudeデスクトップを便利な...

1年前

066.5K

OpenAIエージェントSDK：協調的マルチインテリジェンスワークフロー構築のためのPythonフレームワーク

概論 OpenAI Agents SDKは、マルチインテリジェントワークフローを構築するために設計された、OpenAIの軽量な開発ツールです。Pythonをベースとしており、使いやすく、開発者はAgentを設定し、タスクをカットすることができます。

1年前

063.2K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

オストリスによるAIツールキット：FLUX.1モデルトレーニングツールキットによる安定した拡散

概論 OstrisによるAI Toolkitは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに重点を置いたオープンソースのAIツールセットです。このツールセットは、開発者のOstrisによって作成・保守されています。

1年前

0149.3K

ハイブリッド・ターボS：テンセントの「速く考える」ビッグモデル（募集中）

総合紹介テンセント・ターボSは、2025年2月27日にテンセント・クラウドの公式サイトで発表された、テンセントが自社開発した新世代の高速思考モデルである。従来のスローシンキングモデル（例：Deepseek R1、Hybrid T1）とは異なり、「セカンドリプライ」を実現し、...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

047.4K

HippoRAG: 長期記憶に基づくマルチホップ知識検索フレームワーク

概論 HippoRAGはオハイオ州立大学のOSU-NLPグループによって開発されたオープンソースのフレームワークで、人間の長期記憶メカニズムにヒントを得ている。検索拡張生成（RAG）、ナレッジグラフ、パーソナライズドPageRankのテクニックを組み合わせ、大規模な言語モデル...

1年前

085.8K

ANP: インテリジェントエージェント間の安全で効率的な通信のためのオープンソースプロトコル

概要 AgentNetworkProtocol（略してANP）は、GitHubでホストされているオープンソースのプロトコルプロジェクトで、インテリジェントエージェント（AIエージェント）に安全で効率的な通信ソリューションを提供することに焦点を当てている。このプロトコルは、アイデンティティと暗号化という3つのレイヤーから構成されています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

062.4K

Open-LLM-VTuber：リアルタイム音声対話のためのLive2DアニメーションAIバーチャルコンパニオン

概論 Open-LLM-VTuberは、音声とテキストを通してユーザーが大規模言語モデル（LLM）と対話することを可能にするオープンソースプロジェクトであり、ダイナミックなバーチャルキャラクターを提示するためにLive2D技術を組み込んでいます。Windows、macOS、Linuxをサポートし、完全に...

1年前

0205.3K

Ovis：画像手がかり語の正確なバックプロパゲーションのための視覚的・テキスト的アライメントモデル

一般的な紹介 Ovis (Open VISion) は、アリババの国際デジタル商取引グループのAIDC-AIチームによって開発され、GitHubでホストされているオープンソースのマルチモーダル大規模言語モデル（MLLM）です。このモデルは、革新的な構造埋め込みアライメント技術を使用して、視覚化...

1年前

058.2K

X-R1：一般的なデバイスの0.5Bモデルを低コストでトレーニング

一般的な紹介 X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づいてモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。このプロジェクトはDeepSeek...によってサポートされている。

1年前

050.8K

Eino: ByteDanceのオープンソースGolangビッグモデル・アプリケーション開発フレームワーク

概論 EinoはCloudWeGoチームによるGolangベースのオープンソース・フレームワークで、大規模モデル（LLM）アプリケーションの究極の開発ツールとなるように設計されている。LangChainやLlamaIndexなどのオープンソースフレームワークを利用しています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

094.4K

OpenManus-RL: 大規模モデルの微調整による知的身体推論と意思決定の強化

概論 OpenManus-RLは、UIUC-UlabがMetaGPTコミュニティのOpenManusチームと共同で開発したオープンソースプロジェクトであり、GitHubでホストされている。このプロジェクトは、強化学習（RL）技術によって大規模言語モデリング（LLM）を強化する...

1年前

062.7K

ANUS：タスク自動化とマルチエージェント・コラボレーションのためのオープンソースAIフレームワーク

概論 ANUS（Advanced Neural Understanding System）は、GitHubでホストされているオープンソースのAIエージェント・フレームワークである。

1年前

056.6K

Long-VITA：非常に長い文脈出力をサポートする視覚言語モデル

包括的な紹介 Long-VITAは、VITA-MLLMチームによって開発されたオープンソースのマルチモーダル・マクロモデルであり、非常に長い文脈を扱う視覚的・言語的タスクに焦点を当てている。画像、動画、テキストを同時に分析でき、最大100万トークンの入力をサポートする。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

051.3K

ミーティング：オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes（別名Meetily）は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...

1年前

0103.8K

HyperChat：MCPインテリジェンスを使用して複雑なタスクを実行するAI対話クライアント

概要 HyperChatは、BigSweetPotatoStudioによって開発され、GitHubでホストされているオープンソースのチャットクライアントです。OpenAI、Cla...などのいくつかの大規模な言語モデル（LLM）のAPIを統合することにより、BigSweetPotatoStudio言語モデルの包括的な概要を提供するように設計されています。

1年前

066.2K

Chat2DB: インテリジェントSQLとデータレポート生成のためのデータベース管理ツール

一般的な紹介 Chat2DBは、CodePhiliaXチームによって開発されたオープンソースのデータベース管理とSQLクライアントツールです、AI機能と統合され、迅速にSQLクエリを記述するためのサポート、データベースを管理し、データレポートを生成し、マルチデータベースとの相互作用。16以上のデータベースをサポートしています。

1年前

091.2K

Local-NotebookLM: オープンソースツールの音声ポッドキャストを生成するローカルPDF

概要 Local-NotebookLMはオープンソースプロジェクトで、ローカルで動作するインテリジェントな文書処理とコンテンツ生成ツールを提供することを目的としています。Google NotebookLMにインスパイアされ、ユーザーがPDFやその他のドキュメントを様々な...

1年前

085.8K

メガペア：BGEによる新しいマルチモーダルベクトル埋め込みモデル

包括的な紹介 MegaPairsはVectorSpaceLabチームによるGitHub上のオープンソースプロジェクトであり、大規模なデータ合成技術によって画像-テキスト-画像検索タスクのためのマルチモーダル埋め込みモデルを生成する。このプロジェクトは、2,600万以上の異種...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

054.5K

LitServe：エンタープライズグレードの汎用AIモデル推論サービスの迅速な展開

包括的な紹介 LitServeは、FastAPI上に構築されたLightning AIによるオープンソースのAIモデルサービスエンジンであり、汎用AIモデル向けの推論サービスを迅速に展開することに重点を置いている。大規模言語モデル(LLM)、視覚的モデル(Visual...

1年前

049.5K

LaWGPT：中国法知識モデリング、法律クイズと司法試験トレーニングをサポート

一般的な紹介 LaWGPTは、南京大学の機械学習・データマイニング研究グループによってサポートされているオープンソースプロジェクトで、中国の法律知識に基づいた大規模な言語モデルの構築に専念しています。一般的な中国語モデル（Chinese-LLaMAやChatGLMなど）をベースにしています。

1年前

053.1K

autoMate：AIとRPAを組み合わせてコンピュータ作業を自動化するネイティブツール

総合紹介 autoMateは、yuruotong1がGitHubでオープンソース開発したローカル自動化ツールで、AI+RPA（Artificial Intelligence+Robotic Process Automation）を中核機能としている。大規模言語モデルのインテリジェントな理解とRPAを組み合わせ...

1年前

059K

ナノブラウザ：ブラウザのタスク自動化のためのマルチインテリジェンス・プラグイン

概要 NanobrowserはオープンソースのChrome拡張機能で、AI主導のマルチエージェントシステムによってウェブタスクを自動化するように設計されています。OpenAI Operatorに代わる無償の拡張機能で、ユーザーはLLMを提供するだけです。

1年前

089.6K

OWL：現実的なタスクにおけるマルチインテリジェンス・コラボレーションのための自動化ツール

概論 OWL（Optimized Workforce Learning）は、CAMEL-AIチームによって開発されたオープンソースのフレームワークで、実世界のタスクを自動化するためのマルチインテリジェンス・コラボレーションの最適化に焦点を当てている。CAMEL-AIフレームワークに基づいて...

1年前

062.7K

BuffGPT: エンタープライズ級ジェネレーティブAIアプリケーションのためのローコード開発プラットフォーム

包括的な紹介 BuffGPTはLarge Language Model (LLM)に基づいたオープンソースのAIアプリケーション開発プラットフォームであり、データ処理、モデル呼び出し、RAG検索、視覚的なワークフローオーケストレーションなどのすぐに使える機能を提供し、ユーザーが生成AIアプリケーションを簡単に構築・運用できるように支援します。このプラットフォームは、プライベート...

1年前

059K

RLAMA: コマンドラインから操作するローカルドキュメントのインテリジェントなクイズのためのRAGシステム

一般的な紹介 RLAMAはDonTiziによってオープンソースで開発され、GitHubでホストされている文書インテリジェンスクイズRAG(Retrieval Augmentation Generation)システムである。ユーザは簡単なターミナルコマンドを使って、ローカルの...

1年前

062.3K

Fast-Agent: マルチインテリジェントなボディ・ワークフローを迅速に構築するための宣言的文法とMCPの統合

概要 Fast-Agentは、evalstateチームによってGitHubでメンテナンスされているオープンソースツールで、開発者がマルチインテリジェンスワークフローを素早く定義、テスト、構築できるように設計されています。シンプルな宣言的構文に基づいており、MCP（Mode...

1年前

065.4K

HeyGem：シリコン・インテリジェンスのオープンソースHeygenデジタル・ヒューマン・ピンクッション製品

概論 HeyGemはWindowsシステム用に設計された完全オフラインのビデオ合成ツールで、GuijiAI (Silicon Intelligence)チームによって開発され、GitHubでオープンソース化されています。高度なAIアルゴリズムを使用し、ユーザーの外見と声を正確にクローニングします。

10ヶ月前

0129.9K

NGCBot：ニュースプッシュ、AI対話、グループチャット管理のためのWeChatボット

包括的な紹介 NGCBotはWeChatロボットオープンソースプロジェクトの開発に基づくHOOKメカニズムであり、開発者ngc660sec（Yunshan/eXM）によって作成され、GitHub上でホストされている反復の2年後、V2.3の現在のバージョンは、最初のシンプルな機能から...

1年前

078.1K

データベースクエリをサポートしたDifyプラグイン

一般的な紹介 dify-plugin-tools-dbqueryは、Dify 1.0プラットフォーム用に設計されたオープンソースのプラグインで、開発者のjunjiemがGitHubで公開しています。このプラグインは、データベースクエリ機能を提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

083.6K

アグノ：記憶、知識、ツールを備えたマルチモーダルインテリジェンス構築のためのフレームワーク

一般的な紹介 Agnoは、agno-agiチームによって開発され、GitHubでホストされているオープンソースのPythonライブラリで、開発者が記憶、知識、ツールを備えたAIインテリジェンスを簡単に構築できるようにすることに専念しています。マルチモーダルなテキスト、画像、音声、動画をサポートしています。

1年前

089.6K

FlowDown：iOS/macOS向けのスムーズなAIクライアント体験

概要 FlowDown-Appは、SwiftとUIKitを使用して開発された、軽量で効率的なAI対話クライアントです。このアプリは標準バージョン（FlowDown...

1年前

071.3K

WeChatFerry：WeChatロボット開発のための完全機能フレームワーク

包括的な紹介 WeChatFerryは、オープンソースのWeChatロボットの基礎となるフレームワークであり、GitHub上の開発者lich0821によって作成され、維持されています。このプロジェクトは、WeChat Hook技術を通じて、一連の強力なSDKを提供し、開発者がWeChat ...

1年前

0115.3K

Audio-Reasoner: オーディオ深層推論をサポートする大規模言語モデル

包括的な紹介 Audio-Reasonerは清華大学のチームによって開発され、GitHubでホストされているオープンソースプロジェクトである。このモデルはQwen2-Audio-Instructをベースにしており、...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

052.9K

Light-R1: 360のオープンソース、数学領域のための超絶推論モデル

総合紹介 Light-R1はQihoo360(奇虎360)チームによって開発されたオープンソースのAIモデルで、数学分野のChain-of-Thought(COT)推論に焦点を当てています。Qwen2.5-32B-Iをベースにしています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

051.9K

OpenManus: MetaGPTによるManusのオープンソース版

一般的な紹介 OpenManusは、ユーザーが簡単な設定でローカルにインテリジェンスを実行し、様々な創造的なアイデアを実現できるように設計されたオープンソースプロジェクトです。MetaGPTコミュニティメンバーの@mannaandpoem、@XiangJinyu、@Mos...によって開発されました。

1年前

098.5K

Klee：デスクトップ上でAIマクロモデルをローカルに実行し、プライベート知識ベースを管理する

概論 Kleeはオープンソースのデスクトップアプリケーションで、オープンソースの大規模言語モデル（LLM）をローカルで実行し、安全なプライベート知識ベース管理とMarkdownノートテイク機能を利用できるように設計されています。OllamaとLlamaIndexの技術に基づいています。

1年前

075.6K

LettuceDetect：RAGシステムにおける幻覚検出のための効率的なツール

包括的な紹介 LettuceDetectは、KRLabsOrgによって開発された軽量なオープンソースツールで、特にRAG（Retrieval Augmented Generation）システムで生成された幻覚的なコンテンツを検出するためのものです。文脈、質問、答えを比較することで、文脈によってサポートされていない回答を識別します。

1年前

051.7K

Onyx：企業の知識ベースをつなぐインテリジェントなAIチャットプラットフォーム

一般的な紹介 Onyx（旧称Danswer）は、onyx-dot-appチームによって開発されたオープンソースのAIチャットプラットフォームで、ドキュメント、アプリケーション、従業員データの統合と管理を支援します。あらゆる大規模言語モデル（LLM: Large Language Model）の接続をサポートし、豊富なチャット機能を提供します。

1年前

095.9K

Firecrawl MCP Server：基于 Firecrawl 的网页爬虫 MCP 服务

Firecrawl MCPサーバー: FirecrawlベースのWebクローラーMCPサービス

概要 Firecrawl MCP Serverは、MendableAIによって開発されたオープンソースツールで、モデルコンテキストプロトコル（MCP）プロトコルの実装に基づき、Firecrawl A...

1年前

072.5K

Archon：AIインテリジェンスを自律的に構築・最適化する開発フレームワーク

Archonは、開発者のCole Medin（GitHubユーザー名 coleam00）によって構築された世界初の「Agenteer」プロジェクトであり、AIの自律的な構築、最適化、反復に焦点を当てたオープンソースのフレームワークである。インテリジェンス。これは...

1年前

0119.9K

Proxy Lite：3Bパラメトリック・ビジュアルモデル駆動型ウェブ自動化ツール

包括的な紹介 Proxy Liteは、Convergence AIによって開発されたオープンソースの軽量なWeb自動化ツールで、Proxyのミニバージョンとしてオープンウェイト設計になっています。3BパラメータのVisual Language Model (VLM)をベースにしており、自己...

1年前

063K

Agenta：AIアプリケーションに統合されたキューワードとモデルの効果を評価するツール

包括的な紹介 AgentaはオープンソースのAIモデル管理ツールで、ユーザが簡単にキューワードを使って実験したり、モデルの効果をテストしたり、実行をモニターしたりできるように設計されています。AIアプリケーションを素早く開発したい人に適しており、操作が簡単なプラットフォームを提供します。様々なキューワードの効果を試すことができます。

1年前

060.4K

AgentGPT：自動化されたAIインテリジェンスを作成・実行するオープンソースプロジェクト

一般的な紹介 AgentGPTは、Reworkdチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、ユーザーがブラウザを通して自律的にAIインテリジェンスを作成、設定、デプロイできるように設計されています。ユーザーは目標を設定するだけで、AgentGPTは...

1年前

062.7K

agents.json: 自然言語を介してAPIと対話するインテリジェンスのためのオープンソース仕様

一般的な紹介 agents.jsonは、Wildcard AIチームによって開発されたオープンソースの仕様で、OpenAPI標準に基づき、インテリジェンスが自然言語を通じてAPIと効率的に通信できるように設計されています。構造化されたJSONファイルを使用して、インテリジェントな...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

055.3K

Foudinge Scrub: レストランのレビューからナレッジグラフを構築する

一般的な紹介 Foudinge ScrubはGitHubでホストされているオープンソースのウェブツールで、開発者のThéophile Cantelobreによって作成された。複雑なテキストデータから抽出されたナレッジグラフのクリーニングと編集を支援するように設計されています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

045.2K

PhotoDoodle: テキストコマンドで写真にアーティスティックな落書きができるAIツール

概要 PhotoDoodleは、ShowLabによって開発されたオープンソースの画像編集ツールで、人工知能技術による写真の芸術的な編集に焦点を当てています。ユーザーは、簡単なテキストプロンプトを入力するだけで、実際の写真に漫画スタイル、3D効果、光を追加することができます...

1年前

067.8K

DiffRhythm：最大4分45秒の曲を10秒で生成。

概要 DiffRhythmはASLP-lab (Audio, Speech and Language Processing Group, Northwestern Polytechnical University)によって開発されたオープンソースプロジェクトで、人工知能技術によるエンドツーエンドの音楽作成に焦点を当てています。DiffRhythmはLatent Diffu...

1年前

074K

素晴らしいAIエージェント：150以上のAIフレームワークのリソース集

概要 Awesome AI Agentsは、e2b-devチームによって管理されているGitHubのオープンソースプロジェクトで、自律型AI知能に関連するリソースの収集と整理に重点を置いている。このプロジェクトは、150以上のAI知能のコレクションである...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

060.7K

Anon-Kode：コマンドラインAIコード・アシスタント（クロード・コードのコード分解）

一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。

1年前

076.6K

ReSearch: Qwen2.5-7Bによる検索推論強化モデル（実験的）

包括的な紹介 ReSearchは、強化学習（RL）によって大規模言語モデル（LLM）の検索と推論を改善するために、Agent-RLチームによって開発されたオープンソースの研究ツールです。プロジェクト...

1年前

052.4K

使いやすいオープンソースのAIライティング・アシスタント

概要 AI Writing Assistantは、Next.jsをベースとしたオープンソースのAIライティングアシスタントで、GitHubでホストされています。このツールにより、ユーザーは詳細な...

1年前

054.9K

PrimisAI Nexus：スケーラブルなAIマルチインテリジェンスシステムとタスク自動化のための軽量フレームワーク

概要 PrimisAI Nexusは、GitHubでホストされている軽量なオープンソースのPythonフレームワークで、PrimisAIチームによって開発されています。大規模言語モデリング（LLM）を通じて、スケーラブルなAIマルチインテリジェント体システムの構築と管理を支援することを目的としており、...

1年前

058.3K

Probly：データを分析し、グラフを生成するAI用オープンソース表ツール

Problyは、PragmaticMachineLearningチームによって開発され、GitHubでオープンソース化されたスプレッドシートツールで、従来のスプレッドシートの機能と強力なAIデータ分析機能を兼ね備えています。このツールは、...

1年前

066.7K

CogView4：中国語と英語の高精細対訳画像を生成するオープンソースのグラフィカルモデル

一般的な紹介 CogView4は清華大学のKEG研究室(THUDM)によって開発されたオープンソースのテキストからグラフへのモデルであり、テキスト記述を高品質な画像に変換することに重点を置いている。二ヶ国語のキューワード入力をサポートしており、特に中国語のキューを理解し、中国語の文字、非...

1年前

058.7K

MTranServer：CPU対応オフライン翻訳サービス

概要 MTranServerは、オフライン翻訳に焦点を当てたオープンソースのサーバープロジェクトで、GitHubでホストされており、開発者のxxnuoによって作成されました。最大の特徴は、必要なリソースが非常に少ないことで、CPUと1GBのRAMだけで、G...

1年前

057.2K

code2prompt: コードライブラリをビッグモデルで理解可能なプロンプトファイルに変換する

一般的な紹介 code2promptは、開発者Mufeed VHによって作成され、GitHub上でホストされているオープンソースのコマンドラインツールで、ユーザーがコードベース全体をLarge Language Model（LLM）に適したプロンプト（プロンプト...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

067.5K

hugo-translator: ヒューゴのブログコンテンツを自動翻訳するPythonスクリプト

一般的な紹介 hugo-translatorはHugoの静的サイトジェネレータ用に設計された自動翻訳ツールで、GitHubでホストされており、開発者のRico00121によって作成されました。hugo-translatorはHugoの静的サイトジェネレータ用に設計された自動翻訳ツールです。

1年前

050.9K

FireRedASR：多言語高精度音声認識のためのオープンソースモデル

一般的な紹介 FireRedASRは、Little Red Book FireRedチームによって開発され、オープンソース化された音声認識モデルです。このプロジェクトは開発者や研究者向けにGitHubでホストされており、...

1年前

098.9K

DeepRant: ゲームチャットコンテンツのリアルタイム翻訳用オープンソースクライアント

概要 DeepRantは、国際サーバーにおける言語の障壁の問題を解決するために設計された、ゲーマー向けのオープンソース翻訳ツールです。ショートカットキーを使ってゲーム内のテキストを瞬時に翻訳することができ、複数の言語による相互翻訳をサポートし、プレイヤーがゲームを終了することなくチャットメッセージを素早く理解し、返信することを可能にします。

1年前

063.9K

Shandu: 複数のラウンドで情報を収集・分析するためのAIリサーチ自動化ツール

一般的な紹介 ShanduはGitHubでホストされているオープンソースの人工知能ベースの研究システムで、開発者のjolovicdevによって作成されました。LangChainとLangGraphの技術を利用し、自動化された包括的な...

1年前

063.7K

MTEB：テキスト埋め込みモデルの性能を評価するベンチマーク

概論 MTEB（Massive Text Embedding Benchmark）は、embeddings-benchmarkチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、テキスト埋め込みモデルを提供することを目的としている。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

071.8K

Wan2.1：民生用GPUで高画質ビデオを生成する

概要 Wan2.1は、Wan-Videoチームによって開発され、GitHubでオープンソース化されたビデオ生成ツール群で、人工知能技術によってビデオ作成の限界を押し広げることに焦点を当てています。Wan2.1は、高度な拡散変換アーキテクチャに基づいており、独自の時間変化する自己...

1年前

084.5K

Yutu：YouTube 命令行管理工具，接入AI全自动运营 YouTube 频道

Yutu：YouTubeのコマンドライン管理ツール、AIにアクセスしてYouTubeチャンネルを完全自動化

一般的な紹介 Yutuは、GitHubでホストされ、eat-pray-aiチームによって開発されたYouTubeユーザーのために設計された強力なオープンソースのコマンドラインツールです。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

067.3K

Shadowfetch：Cloudflare Workers 匿名代理大模型API

Shadowfetch: Cloudflare Workers 匿名プロキシ大規模モデルAPI

一般的な紹介 Shadowfetch は Cloudflare Workers 用に設計された軽量なオープンソースツールで、開発者の tysak によって GitHub で管理され、AGPL v3 ライセンスの下でリリースされています。AGPL v3ライセンスの下でリリースされています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

049.9K

MLX-Audio: AppleのMLXフレームワークをベースにした音声合成ツール

概要 MLX-Audioは、AppleのMLXフレームワークをベースに開発されたオープンソースツールで、音声合成（TTS）と音声合成（STS）機能に重点を置いています。アップルシリコン（Mシリーズチップなど）のパワーを活用しています...

1年前

0105.1K

Spark-TTS：自然な音声を生成する音声合成ツール

概要 Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成（TTS）ツールで、ユーザーがテキストを自然で滑らかな音声に効率的に変換できるように設計されています。

1年前

072.1K

Mahilo：異なるAIインテリジェンスフレームワークをリアルタイムで連携させる統合プラットフォーム

Mahiloは、開発者Jayesh SharmaによってGitHubで公開されたオープンソースのマルチインテリジェンス統合プラットフォームであり、ユーザーが異なるフレームワークのAIインテリジェンスを接続し、リアルタイムのコミュニケーション、人間とコンピュータのインタラクション、インテリジェントなコラボレーションをサポートできるように設計されている。この ...

1年前

059.7K