AIオープンソースプロジェクト

合計1020記事

順番に並べる

Sim Studio: AIエージェントのためのオープンソースワークフロービルダー

包括的な紹介 Sim Studioは、軽量で直感的なビジュアルインターフェースを通じて、大規模言語モデル（LLM）ワークフローの迅速な設計、テスト、およびデプロイを支援することに重点を置いた、オープンソースのAIエージェントワークフロー構築プラットフォームです。ドラッグ＆ドロップで複雑なワークフローを作成できます。

10ヶ月前

095.4K

マッド・プロフェッサー：学術論文の読解と分析を支援するAIツール

一般的な紹介 Mad Professor (Grumpy Professor Reads Papers) は、研究者や学生のために設計されたオープンソースのAI学術ツールで、学術論文の読み取りと分析を簡素化します。PDF処理、AI翻訳、RAG検索、AI質問...を統合しています。

11ヶ月前

079.9K

AIstudioProxyAPI：无限使用 Gemini 2.5 Pro 模型 API

AIstudioProxyAPI: Gemini 2.5 ProモデルAPIを無制限に使用可能

包括的な紹介 AIstudioProxyAPIは、Node.jsとPlaywright技術を使って、OpenAI APIをエミュレートするオープンソースプロジェクトである。

11ヶ月前

069.1K

Step1X-Edit：自然言語指示による画像編集のためのオープンソースツール

一般的な紹介 Step1X-Editは、Stepfun AIチームによって開発され、GitHubでホストされているオープンソースの画像編集フレームワークです。マルチモーダル大規模言語モデル（Qwen-VL）と拡散変換器（DiT）を組み合わせることで、ユーザーはシンプルで自然な操作で画像を作成することができます。

11ヶ月前

075.2K

Klavis AI: AIアプリケーションのためのモデルコンテキストプロトコル（MCP）統合ツール

概論 Klavis AIは、AIアプリケーションが外部のツールやデータソースと動的に接続することを可能にするオープンスタンダードであるモデルコンテキストプロトコル（MCP）の使用と統合を簡素化することに焦点を当てたオープンソースプラットフォームです。

11ヶ月前

060.9K

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル（LLM）が音声を生成します。

11ヶ月前

083.7K

MiMo: 効率的な数学的推論とコード生成のための小さなオープンソースモデル

一般的な紹介 MiMoはXiaomiによって開発されたオープンソースの大規模言語モデリングプロジェクトであり、数学的推論とコード生成に焦点を当てている。コアプロダクトはMiMo-7Bファミリーのモデルで、ベースモデル（Base）、教師あり微調整モデル（SFT）、ベースモデルから学習された強力な化学モデル（Strong Chemical）を含んでいます。

最新のAIリソース # AI Java オープンソースプロジェクト

11ヶ月前

067.5K

Muyan-TTS：パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成（TTS）モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。

11ヶ月前

070K

CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス

概論 CAD-MCPはオープンソースプロジェクトであり、ユーザが自然言語コマンドによってCADソフトウェアを制御し、描画操作を行うことを可能にします。自然言語処理とCAD自動化技術を組み合わせ、ユーザーが手動でCADインターフェイスを操作する必要がなく、簡単なテキストコマンドを入力するだけで、CADソフトウェアを操作することができます。

11ヶ月前

078.6K

GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する

包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークであり、GitHubでホストされている。GraphGenは、知識グラフを通して合成データ生成を導くことによって、大規模言語モデル（LLM）の教師ありファインチューニングを最適化することに焦点を当てている。LLMは...

11ヶ月前

060.5K

ACI.DEV：MCPサーバーを介したAIインテリジェンスのための600以上のツールの統合

概論 ACI.devはオープンソースのインフラストラクチャプラットフォームで、AIインテリジェンスを600以上のツールに迅速に統合できるように設計されています。ACI.devは、Googleカレンダー、S...

11ヶ月前

051.6K

llm.pdf：大規模言語モデルをPDFファイルで実行する実験的プロジェクト

一般的な紹介 llm.pdfは、ユーザーが直接PDFファイルで大規模言語モデル（LLM）を実行できるようにするオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています：Em...

11ヶ月前

058.3K

Abogen：複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...

11ヶ月前

076.3K

ローカル・ディープ・リサーチ：詳細な調査レポートを作成するためのローカルで実行可能なツール

一般的な紹介 Local Deep Research は、ユーザが深い研究を行い、複雑な問題に対する詳細なレポートを作成するために設計されたオープンソースの AI 研究アシスタントです。ローカルでの実行をサポートしており、ユーザーはクラウドサービスに依存することなく研究タスクを完了することができます。このツールは ...

11ヶ月前

073.7K

Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ

一般的な紹介 Trackersは、映像内の複数オブジェクトのトラッキングに特化したオープンソースのPythonツールライブラリです。SORTやDeepSORTのようないくつかの主要なトラッキングアルゴリズムを統合しており、ユーザーは異なるオブジェクト検出モデル（YOLO...

11ヶ月前

068.4K

Kimi-Audio：オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。

11ヶ月前

0119.4K

Describe Anything: 画像やビデオ領域の詳細な説明を生成するオープンソースツール

一般的な説明 Describe AnythingはNVIDIAといくつかの大学によって開発されたオープンソースプロジェクトで、Describe Anything Model (DAM)を中核としています。このツールは、ユーザーの...

11ヶ月前

058.9K

Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築

一般的な紹介 Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークです。ユーザーは、1文の記述でインテリジェントなAIエージェントを作成することができ、複雑なタスクで共同作業する複数のエージェントをサポートしています。このフレームワークは2つの...

11ヶ月前

059.6K

InstantCharacter：単一の画像から一貫性のある文字を生成するオープンソースツール

概要 InstantCharacterは、Tencent HunyuanとInstantXチームによって開発されたオープンソースプロジェクトで、GitHubでホストされています。InstantCharacterは、参照画像とテキスト説明文を含む、一貫性のある文字マップを生成します。

11ヶ月前

073.7K

詳細な調査レポートを作成するクロードのMCPサービス

一般的な紹介 MCP Server Deep Researchは、人工知能とウェブ検索によって複雑な問題の構造化された調査レポートを自動的に生成するオープンソースツールです。ユーザーがリサーチクエスチョンを入力すると、ツールはそのクエスチョンを分解し、権威ある情報を検索し、ソースの信頼性を評価します。

11ヶ月前

056K

Deep Recall：大規模モデルのためのエンタープライズクラスのメモリフレームワークを提供するオープンソースツール

包括的な紹介 Deep Recallは、大規模言語モデル（LLM）のために設計されたオープンソースのエンタープライズクラスのメモリフレームワークです。効率的な文脈検索と統合により、超パーソナライズされた応答性を提供します。このフレームワークは、メモリサービス、推論サービス、コーディネータを含む3層アーキテクチャを採用しており、...

11ヶ月前

063.7K

CleverBee：オープンソースのAIリサーチアシスタントが引用研究を生成

一般的な紹介 CleverBeeはGitHubでホストされているオープンソースのAI研究アシスタントであり、SureScaleAIによって開発された。ウェブブラウジング技術と大規模な言語モデル（GeminiやClaudeなど）を組み合わせることで、ユーザーを支援します...

11ヶ月前

050.7K

FantasyTalking: リアルな似顔絵を生成するオープンソースツール

一般的な紹介 FantasyTalkingは、Fantasy-AMAPチームによって開発されたオープンソースプロジェクトで、オーディオドライブを通してリアルなトーキングポートレート動画を生成することに焦点を当てています。このプロジェクトは、高度なビデオ拡散モデルWan2.1とオーディオエンコーダWa...

11ヶ月前

056.1K

Paper2Code: 機械学習論文を実行可能なコードに自動変換する

一般的な紹介 Paper2Codeは、機械学習論文のコード実装が不足しているという問題を解決することを目的としたオープンソースプロジェクトである。マルチエージェントの大規模言語モデリング（LLM）システムPaperCoderによって、科学論文を実行可能なコードリポジトリに自動的に変換する。このシステムは、計画言語モデリング...

11ヶ月前

063.4K

DeepWiki-Open：GitHub、GitLabリポジトリ用のAIドキュメント自動生成

包括的な紹介 DeepWiki-Openは、GitHub、GitLab、Bitbucket上のコードリポジトリの構造化ドキュメントを自動的に生成するために設計されたオープンソースプロジェクトです。AI技術を使って、コード構造、ファイルの内容、論理的な関係を分析し、迅速に構造化ドキュメントを生成します。

最新のAIリソース # AI Java オープンソースプロジェクト

11ヶ月前

0139.1K

Audibit：人気の技術記事をすぐに聴ける音声ポッドキャストにする

一般的な紹介 Audibitはオープンソースプロジェクトで、主な機能は、ハッカーニュース、TechCrunchや他の人気のある技術記事を自動的にオーディオポッドキャストに変換することです。このプロジェクトは...

11ヶ月前

051.6K

VoltAgent：AIインテリジェンスを迅速に構築するためのTypeScriptオープンソースフレームワーク

概要 VoltAgentはオープンソースのTypeScriptフレームワークで、AIインテリジェンスの迅速な構築とオーケストレーションを支援するために開発者向けに設計されている。モジュール化されたツールと標準化された開発モデルを提供することで、大規模な言語モデル（LLM）、ステート...

11ヶ月前

073.7K

Quick Prompt: プロンプトを素早く管理・使用するためのブラウザ拡張機能

General Quick Promptはプロンプトの管理と高速入力に特化したオープンソースのブラウザ拡張機能です。ユーザーはプロンプトのライブラリを作成、整理、保存し、プリセットされたプロンプトコンテンツをウェブページの入力ボックスに素早く挿入することができます。このツールは特に...

11ヶ月前

060.6K

Suna: ブラウザ操作とデータ分析を統合するインテリジェント・エージェント

一般的な紹介 SunaはKortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を使用して、ユーザーを支援します。

11ヶ月前

0101.5K

InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデル

包括的な紹介 InternVLは、上海人工知能研究所（OpenGVLab）によって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルプロジェクトです。視覚処理と言語処理の機能を統合し、画像、動画、テキストの包括的な理解と生成をサポートします。

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

077.3K

roop-unleashed：ループ最適化に基づくオールインワンの顔交換ツール

はじめに Roop-UnleashedはPythonベースのオープンソースAI顔変更ツールで、s0md3vのRoopプロジェクトから継承され、開発者のC0untFloydが保守を続け、Roop-Unleashedと改名した。

12ヶ月前

0114.5K

Potpie AI：独自のコードベースを素早く作成するAIエンジニアリング・アシスタント

包括的な紹介 Potpie AIは、カスタマイズされたAIエンジニアリング・アシスタントを開発者に提供することに特化したオープンソースのプラットフォームです。AIエージェントがコード構造とロジックを深く理解し、コードベースのナレッジグラフを構築することで、デバッグ、テスト、コード生成などのタスクを自動化します。ユーザーはシンプルな...

12ヶ月前

051.2K

Vexa：リアルタイム会議記録・インテリジェント知識抽出ツール

包括的な紹介 Vexaはオープンソースのリアルタイム会議記録および知識管理プラットフォームで、効率的な会議記録とインテリジェントな知識抽出サービスを企業や個人に提供するように設計されています。API駆動の会議ロボットにより、Google MeetやZoomなどのプラットフォームに自動的に参加します。

12ヶ月前

0102K

RooFlow：Rooコード拡張に基づくメモリ拡張システム

包括的な紹介 RooFlowはオープンソースのAI支援プログラミングツールであり、プロジェクトのロギングを通じて開発中のコード、決定、タスクの進捗を保存するコア機能を備えています。Roo Codeエクステンションをベースに、アーキテクチャ、コーディング、テスト、デバッグ、Q&Aの5つのモードを統合しています。これらのモードは相互に...

12ヶ月前

082.2K

Zev: 端末コマンドを自然言語で素早く検索するCLIツール

一般的な紹介 Zevは使いやすいコマンドラインインターフェイス(CLI)ツールであり、ユーザが自然言語で素早く端末コマンドを照会・生成できるようにします。複雑なコマンド構文を覚える代わりに、Zevは日常的な言葉であなたのニーズを記述することでターミナルコマンドを生成します。Ope...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

052.6K

Together Open Deep Research：生成带索引的深度研究报告

共に開くディープリサーチ：インデックス付きディープリサーチレポートの作成

一般的な紹介 Open Deep Researchは、Together AIチームによって開発され、オープンソース化されたディープ・リサーチ・ツールで、GitHubでホストされています。マルチエージェントAIワークフローを通じて人間の研究プロセスをシミュレートし、詳細な研究レポートを生成します...

12ヶ月前

052.7K

LLManager：インテリジェントな自動プロセス承認と人間による監査を組み合わせた管理ツール

概要 LLManagerはLangChainのLangGraphフレームワークに基づいて開発されたオープンソースのインテリジェントな承認管理ツールです。セマンティック検索、サンプルレス学習、...

12ヶ月前

058.7K

OpenAI.fm：OpenAIの音声APIを紹介するインタラクティブなデモツール

概論 openai-fmはGitHubでホストされているオープンソースプロジェクトで、OpenAIのText-to-Speech (TTS) APIの機能をデモンストレーションすることを目的としています。このプロジェクトは、インタラクティブなウェブアプリケーションを通して動作します...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

0115.1K

Find My Kids：顔認証とWhatsApp通知による子供の安全監視ツール

概要 Find My KidsはGitHubでホストされているオープンソースプロジェクトで、開発者のTomer Kleinによって作成された。このプロジェクトはDeepFace顔認識技術とWhatsApp Green APIを組み合わせています。

12ヶ月前

052.5K

DocAgent：Pythonコード・ドキュメンテーションを自動化するスマートなツール

概要 DocAgentは、Meta AIによって開発されたオープンソースのPythonコードドキュメント生成ツールです。マルチインテリジェンスコラボレーションと階層的コード分析を用いて、Pythonコードベース（d...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

060.4K

UNO：単一主題および複数主題のカスタマイズされた画像生成ツールのサポート（eコマース・グラフィックに最適）

UNOはByteDance Intelligent Creation Teamによって開発されたオープンソースの画像生成フレームワークです。FLUX.1モデルに基づいており、"less-to-more "汎化アプローチによる単一被写体および複数被写体のカスタム画像生成に重点を置いている。

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

058.8K

OpenUtau: フリーのオープンソース楽曲合成編集ツール

概要 OpenUtauは、UTAUコミュニティにモダンな編集体験を提供するために設計された、フリーのオープンソース楽曲合成・編集プラットフォームです。UTAUソフトウェアの後継であり、オリジナルソフトウェアの互換性と複雑さの問題を解決しています。OpenUtauはWind...をサポートしています。

12ヶ月前

0149.4K

MCP Containers：基于 Docker 提供数百种 MCP 容器化部署

MCPコンテナ：Dockerをベースにした数百のMCPコンテナ展開

一般的な紹介 MCP ContainersはGitHubでホストされているオープンソースプロジェクトで、Model Context Protocol (MCP)サーバー用のコンテナ化されたソリューションを提供することに焦点を当てています。Dockerコンテナによって簡素化された...

12ヶ月前

071.3K

NodeRAG：正確な情報検索と生成のための異種グラフベースのツール

包括的な紹介 NodeRAGはGitHubでホストされているオープンソースの検索拡張生成（RAG）システムであり、Terry-Xu-666によって開発された。異種グラフ構造によって情報検索と生成を最適化し、検索精度と文脈関連性を大幅に向上させます。

12ヶ月前

065.8K

Open Codex: 自然言語をシェルコマンドに変換するオープンソースAIツール

概論 Open CodexはオープンソースのコマンドラインAIツールで、開発者が自然言語命令を正確なシェルコマンドに変換できるように設計されている。ネイティブ言語モデル（例：phi-4-mini）を使用し、ネットワークやAPIキーを必要とせず、すべての操作を...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

067.1K

SkyReels V2：長さ無制限の動画を生成するオープンソースAIツール

総合紹介 SkyReels-V2は、SkyworkAIが開発したオープンソースの動画生成モデルです。高度なDiffusion Forcing技術により、長さ無制限の動画生成をサポートし、Text-to-Video（T2V）やGraph...

12ヶ月前

0159K

Dia：超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成（TTS）モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。

12ヶ月前

073.5K

Sidekick CLI: オープンソースのクロードコード置き換えツール

概要 Sidekick CLIは、AIの支援により開発者のプロジェクト開発とデプロイプロセスを簡素化するために設計されたオープンソースのコマンドラインツールです。Claude Code、Copilot、Cursorにインスパイアされ、同様の機能を提供しています。

12ヶ月前

084.5K

Kernel Images: 軽量サンドボックスブラウザのためのオープンソースソリューション

概要 Kernel ImagesはGitHubでホストされているオープンソースプロジェクトで、軽量でサンドボックス化されたChrome環境を提供します。DockerとUnikraftの技術に基づいており、隔離されたブラウザインスタンスを構築し、...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

048.2K

Plandex：超ロングコンテクストをサポートするオープンソースのAIコーディングアシスタント

概要 Plandexは、大規模で複雑なソフトウェアプロジェクトのために設計されたオープンソースのエンドツーエンドのAIコーディングアシスタントです。複数ステップのタスクを計画・実行し、最大200万トークンのコンテキストを処理し、30以上のプログラミング言語をサポートします。

12ヶ月前

059.9K

BiliNote：動画からMarkdownノートを自動生成するAIツール

包括的な紹介 BiliNoteは、オープンソースのAIビデオノートツールです。BiliNoteとYouTubeのビデオリンクからコンテンツを抽出し、Markdown形式で明確に構造化されたノートを自動的に生成します。ネイティブの音声トランスクリプションと様々な大規模モデル（例： ...

12ヶ月前

092.5K

OneFileLLM: 複数のデータソースを単一のテキストファイルに統合

包括的な紹介 OneFileLLMは、大規模言語モデル（LLM）に簡単に入力できるように、複数のデータソースを単一のテキストファイルに統合するために設計されたオープンソースのコマンドラインツールです。GitHubリポジトリ、ArXiv論文、YouTube動画トランスクリプション、Web...

12ヶ月前

055K

FramePack:6Gの低グラフィックスメモリは、長いビデオオープンソースプロジェクトの高速成長

一般的な紹介 FramePackはオープンソースのビデオ生成ツールで、ビデオ拡散技術をより実用的にすることに重点を置いている。独自の次フレーム予測ニューラルネットワークによって入力フレームを固定長に圧縮することで、生成作業負荷をビデオの長さから切り離します。つまり、長い動画を生成する場合でも、必要な動画メモリは...

11ヶ月前

0105.6K

OpenAI Codex CLI: ターミナルコマンドラインAIコーディングアシスタント OpenAIがリリース

概要 OpenAI Codex CLIは、OpenAIによって開発されたオープンソースのターミナルコーディングツールで、ターミナルに慣れている開発者のために設計されています。コードの生成、ファイルの編集、コマンドの実行、自然言語コマンドによるGitバージョン管理の統合が可能です。

12ヶ月前

0103.8K

MiniMind-V：26Mパラメトリック視覚言語モデルの1時間トレーニング

概要 MiniMind-Vは、GitHubでホストされているオープンソースプロジェクトで、わずか2600万個のパラメータを持つ軽量な視覚言語モデル（VLM）を1時間以内に学習できるように設計されています。MiniMind 言語モデルをベースに、新しいビジュアル...

12ヶ月前

060.7K

Open Sora：顔の一貫性を最適化するオープンソースのビデオ生成ツール

概論 Open-Soraは、誰でも効率的に高品質のビデオを生成できるように設計されたオープンソースプロジェクトです。hpcaitechチームによって開発され、テキストや画像からビデオを生成するツールを提供しています。このプロジェクトは完全にオープンソースであり、公開されているモデルの重さ...

12ヶ月前

0136.4K

Cloudflare WorkerベースのAI画像生成スクリプト

概論 CloudFlare-AI-ImageはGitHubでホストされているオープンソースプロジェクトで、Cloudflare Workersプラットフォームを通じて無料のAI画像生成サービスを提供している。CloudFlare-AI-Imageは、CloudFlare Workersプラットフォームを通じて無料のAI画像生成サービスを提供するオープンソースプロジェクトです。

12ヶ月前

082.2K

OneLine：注目イベントのタイムラインを生成するAIツール

一般的な紹介 OneLineはGitHubでホストされているオープンソースのホットイベントタイムライン生成ツールで、ユーザーchengtx809によって開発されました。ユーザーによって入力されたキーワードによってイベントのタイムラインを素早く生成し、イベントの時間、タイトル、説明、関連人物を表示します...

12ヶ月前

056.1K

AiPy：データ分析のためのPythonコード実行タスクの自動化

概要 AiPyはKnownsecチームによって開発されたオープンソースのPythonコマンドラインツールです。大規模言語モデル(LLM)とPython実行環境を組み合わせ、Pytho...

12ヶ月前

067.2K

リアルタイム音声テキスト化のためのオープンソースツール

概要 realtime-transcription-fastrtcは、音声をリアルタイムでテキストに変換することに特化したオープンソースプロジェクトです。FastRTC技術を使って低遅延の音声ストリームを処理し、ローカルのWhisperモデルと組み合わせて効率的なテキスト変換を実現します。

12ヶ月前

066K

Dify Workflow DSL File Collection ダウンロード

概要 Awesome-Dify-Workflowは、便利なDifyワークフローテンプレートの共有に焦点を当てたオープンソースのGitHubプロジェクトです。Difyは大規模な言語モデリングアプリケーションの開発をサポートするワークフロープラットフォームであり、このプロジェクトはユーザーに...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

0278.9K

Agnai Chat: パーソナライズされたAIキャラクターと対話するためのオープンソースチャットプラットフォーム

一般的な紹介アグナイチャットは、オープンソースのAIチャットプラットフォームであり、ユーザーはシングルまたはマルチプレイヤーでの対話のためにパーソナライズされたAIキャラクターを作成することができます。OpenAI、Claude、Koboldなどの幅広いAIサービスをサポートしており、エンターテイメント、ロールプレイング、教育、...などに適しています。

12ヶ月前

0120.9K

Yuxi-Know：知識グラフベースのインテリジェントQ&Aプラットフォーム

Yuxi-Knowは、ナレッジグラフとRAG（Retrieval Augmented Generation）技術を組み合わせたオープンソースのインテリジェントなQ&Aプラットフォームで、ユーザーが素早く正確な回答を得られるように支援します。知識グラフを保存するためにNeo4jをベースにしており、FastAPIとVueJS構造を使っています。

12ヶ月前

071.3K

Chatlog: WeChatのチャットログを抽出・照会するオープンソースツール

一般的な紹介チャットログはWeChatのローカルデータベースからチャットログを抽出し、照会することに特化したオープンソースツールです。WeChatバージョン3.xと4.0をサポートし、WindowsとmacOSの両システムをカバーしています。ユーザーは、コマンドライン、ターミナルインターフェース、またはH...

12ヶ月前

0127.8K

VOP: 複雑な図や数式を抽出するOCRツール

包括的な紹介 Versatile OCR Programは、複雑な学術文書や教育文書を扱うために設計されたオープンソースの光学式文字認識（OCR）ツールです。PDF、画像、その他の文書からテキスト、表、数式、図、回路図を抽出し、OCRファイルを生成することができます。

12ヶ月前

051.7K

Orpheus-TTS：自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成（TTS）システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。

12ヶ月前

090.4K

永続的なマイクロソフトQRコードのサーバーフリー生成

概要 serverless-qrcode-hubは、WeChatのグループチャットでQRコードが頻繁に失敗する問題を解決するために設計されたオープンソースツールです。Cloudflare WorkersとD1データベースをベースにしており、従来のサーバーを必要としません。

AIハンズオンチュートリアル # AI Java オープンソースプロジェクト

12ヶ月前

071.3K

self.so: ワンクリックで美しい履歴書ページを作成！

概要 self.soは、履歴書やLinkedInのプロフィールを素早く個人のウェブサイトに変換するために設計されたオープンソースのツールです。ユーザーはPDFの履歴書をアップロードするか、LinkedInのリンクを入力するだけで、システムがAI技術（Tog...をベース）を使って個人ウェブサイトに変換します。

12ヶ月前

055.2K

OmniSVG: テキストと画像からSVGベクターグラフィックスを生成するオープンソースプロジェクト

概論 OmniSVGは、マルチモーダルモデルによる高品質なベクターグラフィックス（SVG）の生成に特化したオープンソースプロジェクトである。事前に訓練された視覚言語モデルを使用して、テキスト記述や画像入力からのSVG生成をサポートし、単純なアイコンから複雑なアニメキャラクターまで幅広いシナリオをカバーします。アイテム ...

12ヶ月前

090.1K

Napkins.dev：ワイヤーフレームをアップロードしてLlama4ベースのフロントエンドコードを生成する

一般的な紹介 Napkins.devはフリーのオープンソースプロジェクトです。コア機能は、ユーザーがインターフェイスのスクリーンショットやワイヤーフレームをアップロードして、実行可能なフロントエンドコードを自動的に生成できるようにすることです。ユーザーはデザイン画を提供するだけでよく、ツールはLlama 4モデル（by Together ...

12ヶ月前

059.5K

Agent-Wiz：AIインテリジェンシアのワークフローとセキュリティリスクの分析

概要 Agent-Wizは、開発者、研究者、セキュリティチーム向けに設計されたオープンソースのPythonコマンドラインツールです。LangGraph、CrewAI、AutoGenなどの主要なAIインテリジェンスフレームワークから複雑なワークフローを抽出し、...

12ヶ月前

055.9K

Orion：シャオミのオープンソースのエンド・ツー・エンドの自動運転推論・計画フレームワーク

包括的な紹介 OrionはXiaomi Labsによって開発されたオープンソースプロジェクトで、エンドツーエンド（E2E）自律走行技術に焦点を当てています。Orionは、視覚言語モデリング（VLM）と生成プランナーによって、従来の自律走行手法の複雑なシナリオにおける因果推論が不十分であるという問題を解決する。

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

096.1K

ReCamMaster: 1つのビデオからマルチビュービデオを生成するレンダリングツール

一般的な紹介 ReCamMasterはオープンソースのビデオ処理ツールで、コア機能は1つのビデオから新しいカメラビューを生成することです。ユーザーはカメラ軌道を指定し、ビデオを再レンダリングすることで、異なるアングルのダイナミックな画像を得ることができます。ReCamMasterは、浙江大学とRacer Technologyのチームによって開発されました。

12ヶ月前

059.7K

Tarsier: 高品質な動画説明を生成するためのオープンソース動画理解モデル

包括的な紹介 Tarsierは、ByteDanceによって開発されたオープンソースのビデオ言語モデルファミリーで、高品質のビデオ記述を生成するためのものです。CLIP-ViTがビデオフレームを処理し、Large Language Model (LLM)が...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

065.4K

オースティン：本の登場人物の関係を分析し、グラフを生成するAIツール

概要 AustenはオープンソースのAIツールで、AngularフレームワークとAnalogjsの初期化、Mermaidjsの技術を組み合わせ、書籍の登場人物の関係を分析するためのチャートを生成します。ユーザーはOpen...

12ヶ月前

066.4K

DeepCoder-14B-Preview：コード生成に優れたオープンソースモデル

概要 DeepCoder-14B-Previewは、Agenticaチームによって開発され、Hugging Faceプラットフォームでリリースされたオープンソースのコード生成モデルです。DeepSeek-R1-Distilled-Qをベースにしています。

12ヶ月前

055.1K

Thera: あらゆるサイズの画像拡大、デエイリアス・オープンソースツール

概論 Theraは、チューリッヒ工科大学とチューリッヒ大学のチームによって開発されたオープンソースの画像超解像ツールである。低解像度の画像を、2倍、3.14倍、あるいは整数倍など、任意の倍率にズームすることができる。

12ヶ月前

060K

A2A：グーグル、AIインテリジェンス間の通信のためのオープンプロトコルを公開

概要 A2A (Agent2Agent)は、異なるフレームワークやベンダーによって開発されたAIインテリジェンスが相互に通信し、コラボレーションすることを可能にするためにGoogleによって開発されたオープンソースプロトコルである。このプロトコルは、インテリジェンスが互いの能力を発見し、タスクを共有し、作業を完了するための標準化された一連の方法を提供する。

12ヶ月前

073.8K

Tabby: VSCodeに統合されたネイティブなセルフホストAIプログラミングアシスタント

一般的な紹介 TabbyはTabbyMLチームによって開発されたオープンソースのAIプログラミングアシスタントで、ユーザーはローカルまたはサーバー上に自分でデプロイすることができます。コードの自動補完やスマートQ&Aなど、GitHub Copilotのような機能を提供していますが、最大の特徴は...

12ヶ月前

089.4K

LMスピード：大規模モデルAPIのパフォーマンスを迅速にテストする

概要 LM Speed は、AI 開発者向けに設計されたツールであり、lmspeed.net でオンラインサービスとしても提供されている。主な機能は、言語モデル API のパフォーマンスをテスト・分析し、スピードのボトルネックを素早く特定し、呼び出し戦略を最適化することである。これは...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

058.8K

DevDocs：技術文書を素早くクロールして整理するMCPサービス

概要 DevDocsは、CyberAGIチームによって開発され、GitHubでホストされている完全に無料のオープンソースツールです。プログラマーやソフトウェア開発者のために設計されたこのツールは、技術文書のURLから始まり、関連するページを自動的にクロールし、簡潔なMa...

12ヶ月前

057.2K

TestDriver：AIを使った自動ソフトウェアテストツール

一般的な紹介 TestDriver は、人工知能技術を使用して開発者のソフトウェア・テストを支援するウェブサイトです。マウスをクリックしたり、テキストを入力したりといった人間の動作をシミュレートすることで、ソフトウェアのテスト作業を自動化する。サイトの中心には、本物の人間のように動作する「AIエージェントを使用したコンピュータ」がある...

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

052.7K

SiteMCP：ウェブサイトのコンテンツをクローリングし、MCPサービスに変える

概論 SiteMCPは、ウェブサイト全体のコンテンツをクロールし、MCP（Model Context Protocol）サーバーに変換することを中核機能とするオープンソースツールで、AIアシスタント（Claude Desktopなど）が直接...

12ヶ月前

059.7K

ディープチャット：ウェブサイトを素早く統合するAIチャットコンポーネント

概要 Deep Chatはウェブ開発者向けに設計されたオープンソースのAIチャットコンポーネントです。Ovidijus Parsiunasによって開発され、GitHubでホストされています。ユーザは単に設定することができます...

12ヶ月前

084.1K

Arrakis：AIインテリジェンスに安全なサンドボックス環境を提供するオープンソースツール

一般的な紹介 Arrakisは、安全でカスタマイズ可能な環境を提供するためにAI知能のために設計されたサンドボックス環境です。Abhishek Bhardwajによって開発され、GitHubでホストされており、AGPL v3ライセンスを使用しています。

最新のAIリソース # AI Java オープンソースプロジェクト

12ヶ月前

059.8K

PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。

総合紹介 PDF文書のレイアウトを自動的に分析し、ページ内のテキスト、タイトル、画像、表、数式、その他の要素を識別し、それらの正しい順序を決定します。このツールはOCR機能をサポートしており、スキャンしたPDFを検索可能なテキストに変換することができます。Docker上で動作し、2つのモデルを提供します。

12ヶ月前

058.9K

ドルフィン：アジア言語認識とアジア言語のための音声テキストモデル

総合紹介 Dolphinは、DataoceanAIと清華大学によって開発された、アジア言語の音声認識と言語認識に特化したオープンソースモデルです。東アジア、南アジア、東南アジア、中東の40の言語と22の中国語方言をサポートしています。

12ヶ月前

061K

AstrBot：WebUIを備えたAIチャットボット・アクセス・プラットフォーム

総合紹介 AstrBotはオープンソースのチャットボット開発フレームワークで、QQ、Telegram、WeChatなどのメッセージングプラットフォームをサポートし、OpenAI、DeepSeek、Google Geminiなどの大規模な言語モデル（L...

12ヶ月前

0110.1K

WeClone：WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成

総合的な紹介 WeCloneは、WeChatのチャット記録と音声メッセージを、大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使ってリアルな音声を生成することができます。

12ヶ月前

071.8K

DiffPortrait360: 1枚のポートレートから360度のヘッドビューを生成

概論 DiffPortrait360はオープンソースプロジェクトであり、CVPR 2025の論文 "DiffPortrait360: Consistent Portrait Diffusion for 360... "に関連している。

12ヶ月前

056.3K

mcp-ui: MCPプロトコルに基づいたクリーンなAIチャットインターフェース

包括的な紹介 mcp-uiは、開発者machaojin1917939763によって作成されたオープンソースプロジェクトであり、構築するためのモデルコンテキストプロトコル（MCP）プロトコルに基づき、Webおよびデスクトップ環境のためのサポートですスマート ...

12ヶ月前

064K

Comp AI: SOC 2、ISO 27001、GDPR コンプライアンスを自動化するオープンソースプラットフォーム

概要 Comp AIは、米国サンフランシスコに本社を置くComp AI社によって開発されたオープンソースのプラットフォームです。自動化されたツールにより、SOC 2、ISO 27001、GDPRなどのコンプライアンス要件を迅速に完了することができます。

12ヶ月前

074.1K

RolmOCR: 手書き文字と斜め文字を認識する文書OCRモデル

一般的な紹介 RolmOCRは、Reducto AIチームによって開発されたオープンソースの光学式文字認識（OCR）ツールで、Qwen2.5-VL-7B視覚言語モデルをベースにしています。類似のツールよりも高速に画像やPDFファイルからテキストを抽出することができます...

最新のAIリソース # AI Java オープンソースプロジェクト # OCR

1年前

063.6K

KrillinAI: ワンクリックで翻訳とダビングができる動画用多言語グローバル化ツール

包括的な紹介 KrillinAIは、ユーザーがビデオを翻訳し、自動的にそれらをダビングするために人工知能を使用することに焦点を当てたオープンソースのビデオ処理ツールです。ビデオのダウンロードから始まり、様々なプラットフォームに適応した完成品の生成まで、全てのプロセスは数クリックで完了します。開発者はGitHubで公開されている。

10ヶ月前

089.6K

AiryLark：多フォーマット文書のインテリジェント翻訳のためのオープンソースツール

一般的な紹介 AiryLarkはGitHubでホストされているオープンソースの文書処理・翻訳ツールで、開発者のwizdによってNext.jsフレームワークに基づいて構築されています。様々なファイル形式（PDF、Word、TXT、Markdo...など）をサポートしています。

1年前

050.4K

Zola：ドキュメントのアップロードとマルチモデルをサポートするオープンソースのAIチャット・ウェブアプリ

一般的な紹介 Zolaは、開発者のJulien Thibeaut（GitHubユーザー名ibelick）によって開発され、GitHubでホストされているフリーでオープンソースのAIチャットアプリである。最大の特徴は、複数のAIモードをサポートしていることです。

1年前

070.2K

DeepResearcher：複雑な問題を研究する強化学習ベースのドライビングAI

包括的な紹介 DeepResearcherは、上海交通大学のGAIR-NLPチームによって開発されたオープンソースプロジェクトです。強化学習(RL)によって実際のウェブ環境でエンドツーエンドで学習された大規模言語モデル(LLM)に基づくインテリジェントな研究ツールです。プロジェクト...

1年前

055.4K

AnimeGamer: 言語コマンドでアニメ動画とキャラクターのインタラクションを生成するオープンソースツール

AnimeGamerはテンセントのARC Labが開発したオープンソースツール。ユーザーは、「宗介が紫の車でドライブする」といった簡単な言語コマンドでアニメ動画を生成したり、「魔法少女の冒険」のキキや「スカイシティ」...といった異なるアニメキャラクターを相互作用させたりすることができる。

1年前

063.2K

Lumina-MGPT-2.0：複数の画像生成タスクを扱うための自己回帰画像生成モデル

概説 Lumina-mGPT-2.0は、上海AI研究所（Shanghai AI Laboratory）、香港中文大学（The Chinese University of Hong Kong：CUHK）、およびその他の組織によって共同開発されたオープンソースプロジェクトで、Alpha...によってGitHub上でホストされている。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

054.9K