AIオープンソースプロジェクト

合計1020記事

順番に並べる

Reader API: ウェブコンテンツ抽出ツール、HTMLからMarkdownへの変換

一般的な紹介 Jina AIのReaderプロジェクトは、https://r.jina.ai/转换成适合大型语言模型（Large Languag...）という接頭辞を付加することで、任意のURLを受け取るオープンソースツール（Readerオープンソースアドレス）です。

2年前

0376.5K

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspber...など複数のプラットフォームをサポートしています。

2年前

0370.6K

Dify Workflow DSL File Collection ダウンロード

概要 Awesome-Dify-Workflowは、便利なDifyワークフローテンプレートの共有に焦点を当てたオープンソースのGitHubプロジェクトです。Difyは大規模な言語モデリングアプリケーションの開発をサポートするワークフロープラットフォームであり、このプロジェクトはユーザーに...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0347K

LLPlayer: 対訳付きリアルタイム字幕を生成するビデオプレーヤー

概要 LLPlayerはGitHubでホストされている、開発者umlx5hによって作成された言語学習者のためのオープンソースメディアプレーヤーです。バイリンガル字幕表示、AI自動生成字幕、リアルタイム翻訳、単語検索など様々な便利な機能が統合されています。

1年前

0270.8K

Xiaozhi AIチャットボット：AIチャットコンパニオンを構築、簡単な音声対話とインテリジェントな対話

包括的な紹介 Xiaozhi AI Chatbotは、ESP32開発ボードをベースにしたオープンソースプロジェクトで、ユーザーが独自のAIチャットコンパニオンを構築できるように設計されています。このプロジェクトはShrimpによって開発され、より多くの人がAIハードウェア開発を始め、大規模な言語モデルを実...

1年前

0261.1K

Open-LLM-VTuber：リアルタイム音声対話のためのLive2DアニメーションAIバーチャルコンパニオン

概論 Open-LLM-VTuberは、音声とテキストを通してユーザーが大規模言語モデル（LLM）と対話することを可能にするオープンソースプロジェクトであり、ダイナミックなバーチャルキャラクターを提示するためにLive2D技術を組み込んでいます。Windows、macOS、Linuxをサポートし、完全に...

1年前

0256.8K

Seed-VC：少ないサンプル数で音声と歌のリアルタイム変換に対応

概要 Seed-VCはPlachtaaによって開発されたGitHub上のオープンソースプロジェクトです。Seed-VCは、1秒から30秒のリファレンスオーディオを使用することができます。このプロジェクトは、リアルタイムの音声変換、ディレイ変換、音声合成をサポートしています。

1年前

0242.2K

PocketPal AI：iOS和Android设备离线使用的小型语言模型聊天工具

ポケパルAI：iOSとAndroidデバイスでオフラインで使える小さな言語モデリングチャットツール

概論 PocketPal AIは、Small Language Models (SLM)を携帯電話に直接導入するために設計されたオープンソースのモバイルアプリです。

1年前

0238.6K

DeepSeek公式チャットインターフェイスがインラインレンダリングチャートをサポートするブラウザ拡張機能

一般的な説明 DeepSeek Diagrams Extensionは、ユーザーがDeepSeekウェブサイトでダイアグラムをインラインでレンダリングできるように設計されたChrome拡張機能です。この拡張機能は、Mermaid...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0237.7K

Serena: 意味検索とコード編集のためのフリーMCPツール

概要 Serenaは、Oraios AIチームによって開発され、GitHubでホストされているフリーでオープンソースのプログラミングツールです。コードベースで直接動作する強力なコードアシスタントで、開発者のコードの分析、編集、実行を支援します。

1年前

0232K

Cherry Studio：API/Web/ローカルモデルを統合したAIアシスタント用デスクトップクライアント

概要 Cherry StudioはLarge Language Model (LLM)サービスを幅広くサポートするデスクトップクライアントで、Windows、Mac、Linuxシステムに対応しています。豊富なパーソナライズオプションと最先端の機能を提供し、さまざまな場面でユーザーを支援するように設計されています...

1年前

0222.6K

WeChatMsg: WeChatチャット記録のエクスポートと分析ツール

一般的な紹介 WeChatMsgは、GitHubプラットフォームにあるオープンソースプロジェクトです。このツールは、WeChatユーザーにWeChatのチャットを抽出し、様々なドキュメント（HTML、Word、CSV）にエクスポートする方法を提供し、チャットデータの視覚化年間レポートの作成をサポートすることを目的としています。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0221.5K

WeWe RSS：WeChatの公開RSSフィードを生成するオープンソースツール

包括的な紹介 WeWe RSSは、WeChatの公開番号ユーザーのために特別に設計された無料のオープンソースツールです。WeChatの読書プラットフォームを通じて公開番号の記事を取得し、RSSフィードを生成するため、ユーザーはRSSリーダーを使っていつでもコンテンツを閲覧することができます。このツールは、WeChat公開番号の文字...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0215.4K

SkyReels V2：長さ無制限の動画を生成するオープンソースAIツール

総合紹介 SkyReels-V2は、SkyworkAIが開発したオープンソースの動画生成モデルです。高度なDiffusion Forcing技術により、長さ無制限の動画生成をサポートし、Text-to-Video（T2V）やGraph...

1年前

0209.4K

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

はじめに VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、パワフルで使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成することができ、一般的なビデオ編集に適しています。

1年前

0209.1K

LiveTalking: オープンソースのリアルタイム・インタラクティブ・デジタル・ヒューマン・ライブ・システム。

包括的な紹介 LiveTalkingは、オープンソースのリアルタイムインタラクティブデジタルヒューマンシステムであり、高品質のデジタルヒューマンライブソリューションの構築に取り組んでいます。このプロジェクトは、Apache 2.0オープンソースプロトコルを使用し、ER-NeRFレンダリング、リアルタイムオーディオおよびビデオストリーミング処理を含む多くの最先端技術と統合されています。

2年前

0208.7K

OpenUtau: フリーのオープンソース楽曲合成編集ツール

概要 OpenUtauは、UTAUコミュニティにモダンな編集体験を提供するために設計された、フリーのオープンソース楽曲合成・編集プラットフォームです。UTAUソフトウェアの後継であり、オリジナルソフトウェアの互換性と複雑さの問題を解決しています。OpenUtauはWind...をサポートしています。

1年前

0208.7K

xiaozhi-esp32-server: Xiaozhi AIチャットボットオープンソースバックエンドサービス

一般的な紹介 xiaozhi-esp32-serverはXiaozhi AIチャットボット（xiaozhi-esp32）のバックエンドサービスを提供するツールです。Pythonで書かれており、WebSocketプロトコルをベースにしています。

1年前

0205.5K

キロ・コード：クリーンなユーザー・エクスペリエンスを備えたルー・コードのブランチ

一般的な紹介キロコードは、Visual Studio Code（略してVS Code）のオープンソース拡張プラグインです。人工知能技術を使って、ユーザーがより効率的にコードを書けるようにする。このプロジェクトはKilo-Orgチームによって開発された。

1年前

0203.3K

Meetily：会議議事録の作成、書き起こし、会議サマリーの作成をリアルタイムで行うAIアシスタント

一般的な説明 MeetilyはZackriya Solutionsによって開発されたAIを搭載した会議アシスタントで、会議の音声をリアルタイムでキャプチャし、音声書き起こしを行い、会議のサマリーを生成します。すべての処理がデバイス上でローカルに行われる点が特徴で、ユーザーのプライバシーを保証します。

1年前

0202.3K

CosyVoice：3秒間の突進ボイス・クローニング・オープンソース・プロジェクトがアリによって立ち上げられる。

包括的な紹介 CosyVoiceは、推論、トレーニングからデプロイまでフルスタックの機能を提供する多言語大規模音声生成モデルです。FunAudioLLMチームによって開発され、高度な自己回帰変換器とODEベースの拡散モデルにより、高品質な音声の実現を目指しています。

1年前

0201.7K

VeighNa：中国で人気のオープンソース定量取引フレームワーク

総合紹介 VeighNaはPythonベースのオープンソース定量取引プラットフォームで、元々は国内の個人トレーダーによって開発され、2015年に正式にローンチされました。シンプルなトレーディング・インターフェース・パッケージから、フル機能のトレーディング開発フレームワークへと進化しています。ユーザーには、プライベート・エクイティ・ファンド、証券...

1年前

0199.5K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

オストリスによるAIツールキット：FLUX.1モデルトレーニングツールキットによる安定した拡散

概論 OstrisによるAI Toolkitは、Stable DiffusionとFLUX.1モデルの学習と画像生成タスクのサポートに重点を置いたオープンソースのAIツールセットです。このツールセットは、開発者のOstrisによって作成・保守されています。

1年前

0199.4K

FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識

総合紹介 FunASRはAlibaba Dharmo Academyが学術研究と産業応用の橋渡しをするために開発したオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、スピーキング...など、幅広い音声認識機能をサポートしています。

2年前

0196.4K

FaceFusion：ビデオ顔交換強化ツール｜音声同期ビデオ口の動き

概要 FaceFusionは、画像からビデオ、画像から画像への交換に最適化された、顔の交換とエンハンスメントを統合した最先端のクラウドプラットフォームです。さらに、3...

1年前

0196.4K

PDFMathTranslate: PDFの組版を完全に保持するAI翻訳ツール

包括的な紹介 PDFMathTranslateは、科学論文の翻訳に焦点を当てたオープンソースのツールです。AI技術を使用して、数式、図、目次、注釈を含む元のドキュメントのレイアウトを保持し、サポート...

1年前

0193K

Kimi-Audio：オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。

1年前

0190.8K

OpenVoice (MyShell)：少ないサンプルで多言語の音声クローニングが可能

概論 OpenVoiceは、リファレンススピーカーの音声をコピーし、スピーカーの短いオーディオクリップのみを使用して多言語音声を生成することができる、インスタントスピーチクローニングの多用途な方法です。OpenVoiceでは、音色のコピーだけでなく、感情的な表現など、声のスタイルを細かくコントロールすることができます。

2年前

0185.6K

Wan 2.1に基づくビデオ生成機能を提供するComfyUI用プラグイン

一般的な紹介 ComfyUI-WanVideoWrapperは、ComfyUIプラットフォーム用に設計された、開発者kijaiによって作成されたオープンソースのプラグインです。WanVideoのWan2.1モデルに基づいており、強力なビデオ圧縮機能を提供します。

1年前

0185.2K

Riona-AI-Agent: 自動的に検索、いいね！、メッセージを残すソーシャルメディア自動対話型インテリジェンス

概要 Riona-AI-Agentは、主要なソーシャルメディア・プラットフォームの運用を管理・最適化するために特別に設計された、AIを搭載した革新的な自動化ツールです。このプロジェクトは、Instagram、Twitter、GitHub などのプラットフォーム用の高度な AI モデルを利用して、...

2年前

0182.3K

DeepWiki-Open：GitHub、GitLabリポジトリ用のAIドキュメント自動生成

包括的な紹介 DeepWiki-Openは、GitHub、GitLab、Bitbucket上のコードリポジトリの構造化ドキュメントを自動的に生成するために設計されたオープンソースプロジェクトです。AI技術を使って、コード構造、ファイルの内容、論理的な関係を分析し、迅速に構造化ドキュメントを生成します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0181K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: PDFドキュメントの抽出とマルチモーダルMarkdownフォーマットへの変換、電子書籍OCRスキャンのサポート

包括的な紹介 MinerUは、上海人工知能研究所のOpenDataLabチームによって開発されたオープンソースのデータ抽出ツールで、複雑なPDF文書、ウェブページ、電子ブックからコンテンツを効率的に抽出することに重点を置いている。画像、数式、表、その他の要素を含むマルチモーダルPDFを取り込むことができる。

2年前

0178.2K

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。動画内のキャラクターの唇の動きを音声を通して直接駆動し、口の形が音声と正確に一致するようにします。このプロジェクトは、Stable Di...

1年前

0177.9K

HeyGem：シリコン・インテリジェンスのオープンソースHeygenデジタル・ヒューマン・ピンクッション製品

概論 HeyGemはWindowsシステム用に設計された完全オフラインのビデオ合成ツールで、GuijiAI (Silicon Intelligence)チームによって開発され、GitHubでオープンソース化されています。高度なAIアルゴリズムを使用し、ユーザーの外見と声を正確にクローニングします。

1年前

0177.7K

EXO：アイドル状態の家庭用デバイスを使用して分散AIクラスタを実行し、複数の推論エンジンとデバイスの自動検出をサポートする。

一般的な紹介 Exoは、日常的なデバイス（iPhone、iPad、Android、Mac、Linuxなど）を使用して独自のAIクラスタを実行するように設計されたオープンソースプロジェクトです。動的なモデル分割と自動化されたデバイス検出により、Exoは複数のデバイスを1つの強力な...

2年前

0177.5K

MoneyPrinter V2：自动生成YouTube短视频与Twitter内容并发布

MoneyPrinter V2：短いYouTube動画とTwitterコンテンツを自動生成し、公開する

一般的な紹介 MoneyPrinter V2はFujiwaraChokiによって開発されたオープンソースプロジェクトで、自動化によってユーザーがオンラインでお金を稼ぐのを助ける。このプロジェクトは主にTwitter自動化、YouTubeショートビデオ生成、アフィリエイトキャンプを統合しています。

2年前

0174.7K

AstrBot：WebUIを備えたAIチャットボット・アクセス・プラットフォーム

総合紹介 AstrBotはオープンソースのチャットボット開発フレームワークで、QQ、Telegram、WeChatなどのメッセージングプラットフォームをサポートし、OpenAI、DeepSeek、Google Geminiなどの大規模な言語モデル（L...

1年前

0174.3K

WeChat動画番号ダウンローダー：WeChat動画番号の動画を素早くダウンロード、複数のフォーマットとプラットフォームをサポートする

総合紹介 WeChat動画番号ダウンローダーはオープンソースプロジェクトで、ユーザーがWeChat動画番号から動画コンテンツを素早くダウンロードできるように設計されています。このツールは、様々なビデオフォーマットとプラットフォームをサポートしており、ユーザーはWindowsとmacOSシステム上で簡単に使用することができます。このプロジェクトはltaooによって開発され、...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0173.1K

gibberlink：2つのAI知能間の効率的な音声通信のための実証プロジェクト

概論 gibberlinkは開発者PennyroyalTeaによるGitHub上のオープンソースプロジェクトで、2つの会話型AI知能間のコミュニケーション最適化を可能にすることに焦点を当てている。2つのAI知能が電話で会話し、お互いを認識するとき...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0172.8K

GitDiagram：可视化GitHub代码库结构，将代码仓库转换为交互式系统架构图

GitDiagram: GitHubコードベースの構造を視覚化し、コードリポジトリをインタラクティブなシステムアーキテクチャ図に変換します。

概要 GitDiagramは、GitHubのコードベースを可視化する革新的なツールで、GitHubのリポジトリをインタラクティブなシステムアーキテクチャ図に素早く変換します。先進的なAI技術(Claude 3.5 Sonnet)を使用し、開発者に...

2年前

0170.9K

Chatlog: WeChatのチャットログを抽出・照会するオープンソースツール

一般的な紹介チャットログはWeChatのローカルデータベースからチャットログを抽出し、照会することに特化したオープンソースツールです。WeChatバージョン3.xと4.0をサポートし、WindowsとmacOSの両システムをカバーしています。ユーザーは、コマンドライン、ターミナルインターフェース、またはH...

1年前

0170K

FunClip：ビデオコンテンツをショートフィルムにインテリジェントに編集。

総合紹介 FunClipは、アリババ達磨研究所のTONGYI Speech Labによって開発された、完全オープンソースのローカライズされた自動ビデオ編集ツールです。このツールは、産業グレードのParaformer-Large音声認識モデルを統合し、ビデオ内の音声を正確に識別することができます...

2年前

0170K

Open Sora：顔の一貫性を最適化するオープンソースのビデオ生成ツール

概論 Open-Soraは、誰でも効率的に高品質のビデオを生成できるように設計されたオープンソースプロジェクトです。hpcaitechチームによって開発され、テキストや画像からビデオを生成するツールを提供しています。このプロジェクトは完全にオープンソースであり、公開されているモデルの重さ...

1年前

0169.7K

Agnai Chat: パーソナライズされたAIキャラクターと対話するためのオープンソースチャットプラットフォーム

一般的な紹介アグナイチャットは、オープンソースのAIチャットプラットフォームであり、ユーザーはシングルまたはマルチプレイヤーでの対話のためにパーソナライズされたAIキャラクターを作成することができます。OpenAI、Claude、Koboldなどの幅広いAIサービスをサポートしており、エンターテイメント、ロールプレイング、教育、...などに適しています。

1年前

0169.5K

WeChatFerry：WeChatロボット開発のための完全機能フレームワーク

包括的な紹介 WeChatFerryは、オープンソースのWeChatロボットの基礎となるフレームワークであり、GitHub上の開発者lich0821によって作成され、維持されています。このプロジェクトは、WeChat Hook技術を通じて、一連の強力なSDKを提供し、開発者がWeChat ...

1年前

0167.1K

Roo Code（Roo Cline）：基于Cline的增强版自主编程助手，智能化IDE编程助手

Roo Code (Roo Cline): Clineをベースに強化された自律型プログラミングアシスタント、インテリジェントIDEプログラミングアシスタント

概要 Roo Code（旧Roo Cline）Roo Code（Roo Cline）は、VS Codeの強力な拡張プラグインであるClineをベースに強化された自律型プログラミングアシスタントです。このツールは、あなたのセットで使用することができます...

2年前

0164K

Marker：PDFをMarkdownに素早く変換するオープンソースツール

一般的な説明 Markerは、PDFファイルを素早く正確にMarkdown形式に変換するために設計された、ディープラーニングベースの文書処理ツールです。幅広い種類のドキュメントをサポートし、特に書籍や科学論文の変換に最適化されています。Markerはヘッダーを削除することができます...

1年前

0164K

IndexTTS：中英ミキシング対応音声合成ツール

一般的な紹介 IndexTTSはGitHubでホストされているオープンソースの音声合成(TTS)ツールで、index-tsチームによって開発されています。XTTSとTortoiseの技術をベースに、モジュール設計を改良することで、効率的かつ...

1年前

0163.3K

Tifa-Deepsex-14b-CoT：ロールプレイングと超長編小説の生成に特化した大型モデル。

総合紹介 Tifa-Deepsex-14b-CoTは、Deepseek-R1-14Bをベースにディープに最適化されたマクロモデルであり、ロールプレイング、フィクション・テキスト生成、Chain of Thought（CoT）プッシュに重点を置いている。

1年前

0162.6K

roop-unleashed：ループ最適化に基づくオールインワンの顔交換ツール

はじめに Roop-UnleashedはPythonベースのオープンソースAI顔変更ツールで、s0md3vのRoopプロジェクトから継承され、開発者のC0untFloydが保守を続け、Roop-Unleashedと改名した。

1年前

0162.6K

OpenHands：ソフトウェア開発のためのAI駆動型マルチインテリジェントエージェントアシスタント。

概論 OpenHandsはAll-Hands-AIチームによって開発されたオープンソースプロジェクトで、AI技術によってソフトウェア開発プロセスを効率化することを目的としている。以前はOpenDevinとして知られ、現在はOpenHandsと改名されたこのプラットフォームは、強力なAI技術を提供します。

2年前

0162.2K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

ココロTTS API: 高速音声合成のためのDocker化FastAPIラッパー (ココロ-82Mモデル)

概要 Kokoro-FastAPIは、Kokoro-82M音声合成モデルをサポートするために設計されたDockerベースのFastAPIラッパーです。このプロジェクトはNVIDIA GPUアクセラレーションをサポートし、キュー処理と自動スプライシングを提供します。

2年前

0161.9K

VSR：AI技術によるロスレスビデオ透かし除去及びハード字幕ソフトウェア（ビデオ透かし除去クライアント7G+)

包括的な紹介ビデオ字幕リムーバー（Video-subtitle-remover、略してVSR）は、AI技術に基づくビデオ処理ソフトウェアで、ビデオからハード字幕やテキストウォーターマークを削除するために特別に設計されています。このツールは、様々なAIアルゴリズムモデル（STTN、L...

2年前

0161K

Paperless-AI：使用AI自动分析和标记文档，适用 paperless-ngx 文档管理系统

Paperless-AI: Paperless-NGX文書管理システムのためのAIを使った文書の自動分析とタグ付け

概要 Paperless-AIは、Paperless-ngx文書管理システム専用に設計された革新的な文書自動化分析ツールです。このツールは、OpenAI APIとOllama...のような様々な高度なAIモデルを巧みに組み合わせています。

2年前

0158.8K

口袋AI：手机中运行的离线AI助手，适配 DeepSeek-R1 (5.37GB)

Pocket AI：DeepSeek-R1 (5.37GB)に対応した、携帯電話で動作するオフラインのAIアシスタント。

ポケットAI（PocketPal AI中国語版）は、いつでもどこでもAIと会話できるように設計された強力なオフラインAIアシスタントです。スモール・ランゲージ・モデル（SLM）をベースにしており、インターネット接続のない携帯電話で動作し、特に中国のユーザー体験に適応しています。口...

1年前

0158.5K

Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント

包括的な紹介 Suryaは、90以上の言語のテキスト認識をサポートするオープンソースの多言語文書OCRツールキットです。行単位のテキスト検出だけでなく、レイアウト分析、読み順検出、表認識も実行します。Suryaの性能は、あらゆる種類の文書でクラウドサービスに匹敵します。

最新のAIリソース # AI Java オープンソースプロジェクト # OCR

2年前

0157.4K

BabelDOC：PDF文書がバイリンガルのオープンソースツールに翻訳される

一般的な紹介 BabelDOCは、PDF文書をバイリンガル形式に翻訳するために設計されたオープンソースツールです。funstory-aiチームによって開発され、GitHubでホストされています。

1年前

0155.2K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

Edge TTS Worker: Cloudflare、OpenAI互換フォーマット、パッケージ化されたウェブインターフェースを使用したMicrosoft音声合成APIの展開

概要 Edge TTS Worker（edge-tsに依存）は、Microsoft Edge TTSサービスをOpenAI互換フォーマットでカプセル化し、Cloudflare Workerにデプロイされたプロキシサービスです。

2年前

0155K

KG Gen：プレーンテキストからナレッジグラフを自動生成するオープンソースツール

概要 KGGenはスタンフォード信頼人工知能研究所（STAIR Lab）によって開発されたオープンソースツールで、GitHubでホストされている。高度な言語モデリングとクラスタリングアルゴリズムを使用して、構造化されていないテキストを...

1年前

0154.5K

Dify Connect MCP：Dify 工作流无缝集成 MCP（模型上下文协议）

Dify Connect MCP: DifyワークフローへのMCP(モデルコンテキストプロトコル)のシームレスな統合

概要 Dify Connect MCPは、GitHubでホストされているオープンソースプロジェクトで、Difyプラットフォームのユーザーにモデルコンテキストプロトコル(MCP)を通じてモデリングするための便利なツールを提供することを目的としています...

1年前

0153.7K

Botgroup.chat：複数のAIキャラクターがリアルタイムで対話するグループチャットアプリ

一般的な紹介 Botgroup.chatはReactとCloudflare Pagesをベースに開発されたオープンソースのAIグループチャットアプリケーションで、WeChatグループチャットのようなインタラクティブな体験をユーザーに提供することを目的としています。複数のAIキャラクターの同時参加をサポートしています。

1年前

0152.7K

Comics Downloader：开源免费漫画下载器，支持PDF、EPUB、CBR、CBZ格式漫画下载

Comics Downloader: オープンソースの無料コミックスダウンローダー、PDF, EPUB, CBR, CBZ形式のコミックスをダウンロード可能

一般的な紹介 Comics Downloaderは、ユーザーが様々なウェブサイトからコミックやコミックをダウンロードできるように設計されたオープンソースツールです。このツールは、PDF、EPUB、CBR、CBZを含む様々なファイル形式をサポートしており、ユーザーは自分のニーズに合わせて選択することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0151.9K

ビデオアナライザー：ビデオコンテンツを分析し、詳細な説明を生成します。

Comprehensive Introduction Video Analyzerは、コンピュータ・ビジョン、音声転写、自然言語処理技術を組み合わせて、詳細なビデオ・コンテンツの説明を生成する、総合的なビデオ分析ツールです。このツールは、動画から主要なフレームを抽出し、音声コンテンツを書き起こします。

1年前

0151.3K

Wav2Lip: オープンソースの高精度リップシンク生成ツール（推奨）

一般的な紹介 Wav2Lipはオープンソースの高精度リップシンク生成ツールで、任意のオーディオとビデオのリップシンクを正確に同期させるように設計されています。このツールはRudrabha MukhopadhyayらによってACM Multimedia 20...で開発されました。

2年前

0151K

OpenCharacter：オープンソースの無修正Character.AI代替ツール

概論 OpenCharacterはオープンソースのキャラクター作成ツールで、Character.AIの代替として、AIによるキャラクター作成とインタラクションを無制限に体験できるように設計されています。ユーザーはネイティブモデルを使用して独自のキャラクターを作成し、実行することができます。

2年前

0150.5K

XHS-Downloader：免费小红书数据采集工具，支持笔记批量下载、视频提取、图片去水印

XHS-Downloader：無料小洪集データ収集ツール、サポートノート一括ダウンロード、ビデオ抽出、画像透かし処理

概論 XHS-DownloaderはXiaohongshuユーザーのために設計されたオープンソースツールで、Xiaohongshu上で透かしのない画像や動画作品の抽出とダウンロードをサポートします。このツールは、ブラウザからクッキーを取得したり、コマンドライン操作をサポートしたり、一括ダウンロード...など、様々な機能を提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0148.4K

SkyReels-V1: 高品質のヒューマンアクション動画を生成するオープンソースビデオモデル

概要 SkyReels-V1は、SkyworkAIチームによって開発されたオープンソースプロジェクトで、人間中心の高品質なビデオコンテンツを生成することに重点を置いている。このプロジェクトは、HunyuanVideoモデルに基づいています。

1年前

0147.5K

Archon：AIインテリジェンスを自律的に構築・最適化する開発フレームワーク

Archonは、開発者のCole Medin（GitHubユーザー名 coleam00）によって構築された世界初の「Agenteer」プロジェクトであり、AIの自律的な構築、最適化、反復に焦点を当てたオープンソースのフレームワークである。インテリジェンス。これは...

1年前

0147K

IOPaint：オールラウンドなAI画像処理ツールで、要素の消去、拡大、置換、テキストの描画が可能です。

概要 IOPaintは、画像の消去、修復、拡大をサポートする、フリーでオープンソースのAI画像処理ツールです。最先端のAIモデルを使用し、画像から不要なオブジェクトを簡単に削除したり、キズを修復したり、新しいコンテンツを追加したり、画像を拡大したりすることができます。

2年前

0145.7K

Playwright MCP：マイクロソフトのブラウザ自動化MCPサービス

一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールである。モデルコンテキストプロトコル（MCP）プロトコルを介して、人工知能モデルがブラウザを直接制御できるようにする。

1年前

0144.7K

edge-tts: 音声合成Pythonモジュール｜無料音声合成サービス

概要 edge-tsはオープンソースのPythonモジュールで、Microsoft EdgeブラウザやWindowsオペレーティングシステム、APIシークレットを必要とせずに、PythonコードでMicrosoft Edgeのオンライン音声合成サービスを利用することができます。

2年前

0144.7K

ミーティング：オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes（別名Meetily）は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...

1年前

0143.5K

OpenAI.fm：OpenAIの音声APIを紹介するインタラクティブなデモツール

概論 openai-fmはGitHubでホストされているオープンソースプロジェクトで、OpenAIのText-to-Speech (TTS) APIの機能をデモンストレーションすることを目的としています。このプロジェクトは、インタラクティブなウェブアプリケーションを通して動作します...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0143.5K

Open Notebook：个性化AI笔记工具，Notebook LM开源替代方案

Open Notebook: パーソナライズされたAIノートツール、Notebook LMに代わるオープンソース

概要 Open Notebookは、Google Notebook LMに代わるソリューションをユーザーに提供するために設計された、プライバシーに重点を置いたオープンソースのノート管理ツールです。Open Notebookを使えば、ユーザーは自分自身で...

2年前

0143.4K

OpenAI Codex CLI: ターミナルコマンドラインAIコーディングアシスタント OpenAIがリリース

概要 OpenAI Codex CLIは、OpenAIによって開発されたオープンソースのターミナルコーディングツールで、ターミナルに慣れている開発者のために設計されています。コードの生成、ファイルの編集、コマンドの実行、自然言語コマンドによるGitバージョン管理の統合が可能です。

1年前

0142.5K

YOLOv12：リアルタイム画像・ビデオターゲット検出のためのオープンソースツール

総合的な紹介 YOLOv12はGitHubユーザーのsunsmarterjieによって開発されたオープンソースプロジェクトで、リアルタイムターゲット検出技術に焦点を当てています。このプロジェクトは、YOLO (You Only Look Once)シリーズのフレームワークをベースにしており、ノート・メモの導入...

1年前

0142K

FlowGram.AI：ノードワークフローを迅速に作成するオープンソースエンジン

包括的な紹介 Flowgram.aiは、ByteDanceによって開発されたオープンソースのプロセス構築エンジンです。ノード編集をベースとしており、開発者がワークフローを素早く作成できるよう、固定レイアウトとフリーリンクの2つのモードをサポートしている。プロジェクトはTypeScriptで書かれている。

1年前

0141.3K

Langflow：強力なAIインテリジェンスとワークフローを構築するためのローコードツール

概要 Langflowは、強力なAIエージェントとワークフローを構築するために開発者向けに設計されたローコードツールです。あらゆるAPI、モデル、データベースの使用をサポートし、複雑なAIアプリケーションの開発を簡素化します。Langflowは直感的なビジュアル・インターフェースを提供します。

2年前

0139.7K

OpenBB: プライベートデータとAIを統合し、投資の意思決定を強化するオープンソースの金融データ分析プラットフォーム

概要 OpenBBは、すべての人に金融データと分析ツールへの簡単なアクセスを提供するために設計された、無料で完全にオープンソースの金融データ分析プラットフォームです。このプラットフォームは、株式、オプション、暗号通貨、外国為替、マクロ経済指標、固定...をカバーする100以上の異なるデータソースを統合しています。

2年前

0139.5K

Grok-Mirror：収益性の高いGrokミラーサイトのワンクリック展開

包括的な紹介 Grok-Mirrorは、操作可能なGrokミラーステーションの構築に基づいた、サーバーレスで迅速なデプロイが可能なGrok3国内ミラーステーションです。Docker経由でワンクリックでローカルのGrokキオスクをデプロイすることができます。GrokはxAIの人工知能です。

1年前

0139.4K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling：様々なフォーマットのドキュメントをサポート MarkdownやJSONへの解析とエクスポート PDFサポート OCR

包括的な紹介 Doclingは、PDF、DOCX、PPTX、XLSX、画像、HTML、AsciiDocおよびMarkdownを含む幅広い文書形式をサポートする強力な文書解析およびエクスポートツールです。

2年前

0139.3K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

Coqui TTS (xTTS)：多言語サポートと音声クローン機能を備えた音声合成用ディープラーニングツールキット

包括的な紹介 Coqui TTSは、ディープラーニング技術に基づくオープンソースの高度な音声合成（TTS）ツールキットです。Coqui TTSは、研究環境と実運用環境の両方でテストされており、多言語のテキスト音声変換をサポートする豊富な機能とモデルのセットを提供します。

1年前

0138.2K

wechat-article-exporter：一键部署微信公众号文章批量导出工具

wechat-article-exporter：wechat公開番号記事一括エクスポートツールのワンクリックデプロイメント

包括的な紹介 wechat-article-exporterは、ユーザーがWeChatの公開番号の記事を一括エクスポートするために設計されたオープンソースのツールです。このツールは、環境を構築することなく、記事に埋め込まれたオーディオとビデオのエクスポートをサポートし、100%は、記事のスタイルを復元することができ、プライベート部分をサポートしています...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0138.2K

KAG: ハイブリッド知識グラフとベクトル検索のための専門知識ベースQ&Aフレームワーク

包括的な紹介 KAG (Knowledge Augmented Generation)は、OpenSPGエンジンと大規模言語モデル(LLMs)に基づいた、論理的なフォームに導かれた推論と検索のフレームワークです。このフレームワークは、専門的なドメイン知識ベースを構築するために特別に設計されています...

2年前

0137.9K

Vexa：リアルタイム会議記録・インテリジェント知識抽出ツール

包括的な紹介 Vexaはオープンソースのリアルタイム会議記録および知識管理プラットフォームで、効率的な会議記録とインテリジェントな知識抽出サービスを企業や個人に提供するように設計されています。API駆動の会議ロボットにより、Google MeetやZoomなどのプラットフォームに自動的に参加します。

1年前

0137.8K

Dify: ジェネレーティブAIアプリケーション開発プラットフォーム、ビジュアルオーケストレーション、プライベートデプロイメントサポート

包括的な紹介 DifyはオープンソースのジェネレーティブAIアプリケーション開発プラットフォームで、開発者が大規模言語モデル（LLM）に基づくネイティブAIアプリケーションを迅速に構築・運用できるように設計されています。このプラットフォームは、エージェントの構築からAIワークフローのオーケストレーション、RAG検索...

2年前

0137.7K

FramePack:6Gの低グラフィックスメモリは、長いビデオオープンソースプロジェクトの高速成長

一般的な紹介 FramePackはオープンソースのビデオ生成ツールで、ビデオ拡散技術をより実用的にすることに重点を置いている。独自の次フレーム予測ニューラルネットワークによって入力フレームを固定長に圧縮することで、生成作業負荷をビデオの長さから切り離します。つまり、長い動画を生成する場合でも、必要な動画メモリは...

1年前

0137.1K

Hunyuan3D-2: テンセントのオープンソース高解像度3Dモデル生成ツール

概論 Hunyuan3D-2はTencentによって開発されたオープンソースプロジェクトで、テキストや画像から高解像度の3Dモデルを生成する。形状生成モデル(Hunyuan3D-DiT)とテクスチャ生成モデル(Hunyuan3D...)の2つのコアコンポーネントで構成されています。

1年前

0137K

Ollama OCR: Ollamaの視覚モデルを使った画像からのテキスト抽出

包括的な紹介 Ollama OCRは、Ollamaプラットフォームが提供する最先端の視覚言語モデルを使用して画像からテキストを抽出する、強力な光学式文字認識（OCR）ツールキットです。このプロジェクトはPythonパッケージとして提供されており、ユーザーフレンドリーなストリー...

2年前

0136.8K

Obsidian Copilot：在Obsidian中使用AI助手体验智能化笔记助手

オブシディアン・コパイロット：オブシディアンのAIアシスタントでインテリジェントなノートテイクアシスタントを体験しよう

概論 Obsidian CopilotはObsidian Notesソフトウェア用の強力なAIアシスタントプラグインで、Obsidian NotesのワークフローにOpenAIのインテリジェンスをシームレスに統合します。このプラグインは、開発者のLogan Yang...によって作成されました。

2年前

0136.8K

Orion：シャオミのオープンソースのエンド・ツー・エンドの自動運転推論・計画フレームワーク

包括的な紹介 OrionはXiaomi Labsによって開発されたオープンソースプロジェクトで、エンドツーエンド（E2E）自律走行技術に焦点を当てています。Orionは、視覚言語モデリング（VLM）と生成プランナーによって、従来の自律走行手法の複雑なシナリオにおける因果推論が不十分であるという問題を解決する。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0134.9K

ローカル・ファイル・オーガナイザー：AIが自動的にファイルを整理するローカル・ファイル・オーガナイザー・アシスタント

概要説明ローカルファイルオーガナイザーは、ユーザーがコンピュータ上のファイルを整理し、分類するために設計されたAIを搭載したローカルファイル管理ツールです。このツールは、Llama3.2 3BやLlav...などの高度なAIモデルを利用しています。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0134.9K

ココロ-ONNX：多言語・多音声をサポートする効率的な音声合成ツール

包括的な紹介ココロ-ONNXは、ONNXランタイムをベースとしたオープンソースの音声合成(TTS)ツールです。thewh1teagleによって開発されたこのプロジェクトは、効率的で高速な音声合成ソリューションを提供することを目的としています。

2年前

0134.3K

uniOCR: クロスプラットフォームのオープンソーステキスト認識ツール

概論 uniOCRはmediar-aiチームによって開発されたオープンソースのテキスト認識ツールです。Rust言語に基づいており、macOS、Windows、Linuxシステムをサポートしています。画像からテキストを抽出することができます。

最新のAIリソース # AI Java オープンソースプロジェクト # OCR

1年前

0134.2K

PDF-Extract-Kit：オープンソースツールのPDFコンテンツの複雑な構造を抽出する

包括的な紹介 PDF-Extract-KitはOpenDataLabチームによって開発されたオープンソースプロジェクトで、複雑で多様なPDF文書から高品質なコンテンツを効率的に抽出することに重点を置いています。先進的な文書解析技術を統合し、レイアウト検出、数式認識、PDF文書抽出をサポートします。

1年前

0134.1K

Sim Studio: AIエージェントのためのオープンソースワークフロービルダー

包括的な紹介 Sim Studioは、軽量で直感的なビジュアルインターフェースを通じて、大規模言語モデル（LLM）ワークフローの迅速な設計、テスト、およびデプロイを支援することに重点を置いた、オープンソースのAIエージェントワークフロー構築プラットフォームです。ドラッグ＆ドロップで複雑なワークフローを作成できます。

1年前

0133.9K

Suna: ブラウザ操作とデータ分析を統合するインテリジェント・エージェント

一般的な紹介 SunaはKortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を使用して、ユーザーを支援します。

1年前

0133.5K

BiliNote：動画からMarkdownノートを自動生成するAIツール

包括的な紹介 BiliNoteは、オープンソースのAIビデオノートツールです。BiliNoteとYouTubeのビデオリンクからコンテンツを抽出し、Markdown形式で明確に構造化されたノートを自動的に生成します。ネイティブの音声トランスクリプションと様々な大規模モデル（例： ...

1年前

0133.5K

SiYuan (SiYuan Notes): AIライティング/Q&Aチャットをサポートするプライバシー優先の個人知識管理ソフトウェア

概要：SiYuan Notes（SiYuan）はプライバシーを第一に考えた個人向けナレッジマネジメントソフトウェアで、完全なオープンソースであり、セルフホスティングをサポートしている。TypeScriptとGolangで書かれており、きめ細かいブロックレベルの参照とMarkdownのWYSIWYG（WYSIWY...

1年前

0132.9K