AIオープンソースプロジェクト

合計1020記事

順番に並べる

RuoYi AI: AIチャットと描画のためのSpringBootベースのバックエンドフレームワーク

包括的な紹介 RuoYi AIはruoyi-plusフレームワークに基づいて、AIチャットと絵画機能の統合に焦点を当てたバックエンドプロジェクトです。Java17とSpringBoot 3.X技術スタックを使用し、完全にオープンソースで無料です。

1年前

0111.6K

MiniMind：ゼロから2時間のトレーニング 26MパラメータGPTオープンソースツール

一般的な紹介 MiniMindは、開発者jingyaogongによって作成されたオープンソースプロジェクトである。MiniMindの主な特長は、1つのNVIDIA製CPUで2時間...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0111.5K

PPTAgent: PPTプレゼンテーション、ドキュメントからPPTへの自動生成と評価

概要 PPTAgentは、ドキュメントからプレゼンテーションを自動生成する革新的なシステムです。このシステムは、プレゼンテーションの作成における人間のアプローチを取り入れ、コンテンツの品質と視覚的なインパクトを確保するための2段階のプロセスを採用しています。さらに、PPTAgentはPPTEvalを導入しています。

2年前

0111.4K

ImBD：AIによって生成されたコンテンツの検出。

包括的な紹介 ImBD（Imitate Before Detect）は、AAAI 2025カンファレンスで発表された、先駆的な機械生成テキスト検出プロジェクトである。ChatGPTのような大規模言語モデル(LLM)の普及に伴い、A...

2年前

0111.4K

Browser Use Web UI：运行AI智能体浏览网页，让AI能够自动操作网页的开源框架

Browser Use Web UI: AIインテリジェンスがウェブをブラウズするためのオープンソースフレームワーク。

概要ブラウザユースWeb UIは、AIエージェントにグラフィカルインターフェースツールとしてブラウザインタラクション機能を提供することに焦点を当てた革新的なオープンソースプロジェクトです。このプロジェクトは、ブラウザユースコアフレームワークの上に構築されており、Gradio ...

1年前

0111.3K

フィッシュ・スピーチ：少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

概要フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。

1年前

0111.3K

PaddleOCR: Flying Paddleベースの多言語OCRツールライブラリ。

包括的な紹介 PaddleOCRはPaddlePaddleをベースにした多言語OCRツールキットで、実用的で超軽量のOCRシステムを提供するように設計されています。80以上の言語の認識をサポートし、データ注釈と合成ツールを提供し、実...

最新のAIリソース # AI Java オープンソースプロジェクト # OCR

2年前

0111.2K

ココロWebGPU: ブラウザのオフライン操作のための音声合成サービス

はじめにココロWebGPUは、WebMLコミュニティがHugging Faceプラットフォーム上で提供するココロ音声合成（TTS）モデルのWebGPUバージョンです。このプロジェクトは、WebGPUの技術を利用し、ユーザーが...

1年前

0111.1K

FlowiseAI：カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築

一般的な紹介 FlowiseAIは、開発者がカスタムLLM（大規模言語モデル）アプリケーションとAIエージェントを構築するために設計されたオープンソースのローコードツールです。ドラッグ＆ドロップのシンプルなインターフェースで、ユーザーはLLMアプリケーションを素早く作成し、繰り返し実行することができます。

2年前

0111.1K

ComfyUI disty Flow：为 ComfyUI 提供友好的用户界面，简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。

2年前

0111.1K

Open Codex: 自然言語をシェルコマンドに変換するオープンソースAIツール

概論 Open CodexはオープンソースのコマンドラインAIツールで、開発者が自然言語命令を正確なシェルコマンドに変換できるように設計されている。ネイティブ言語モデル（例：phi-4-mini）を使用し、ネットワークやAPIキーを必要とせず、すべての操作を...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0111K

Aider: オープンソースのプログラミングアシスタントツール。

一般的な紹介 Aiderは強力なオープンソースのAIプログラミングアシスタントツールで、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助けます。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitにシームレスに統合することができます...

1年前

0110.5K

アブ・クオンツ取引システム：Pythonベースのオープンソース・クオンツ取引プラットフォーム

一般的な紹介 Abu Quantitative Trading System は、Python ベースのオープンソースプラットフォームです。投資家がコードを通じて定量的取引戦略を実行できるよう、ユーザー「bbfamily」によって作成されました。このシステムは、株式、オプション、先物、ビットコインなどの様々な金融商品のバックテストと取引をサポートしています。これは...

1年前

0110.4K

Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン

概要 Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使うと、ユーザーはどのウェブページでもサイドバーを開き、ローカルで動作しているAIモデルと対話することができます。

1年前

0110.3K

One API：マルチモデルのAPI管理と負荷分散、配信システム

総合紹介 One APIは、OpenAI ChatGPT、Anthropic Claude、Google PaLM 2、Geminiといった様々なビッグモデルをサポートするオープンソースのインターフェース管理・配布システムです。その ...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0110.2K

AgenticSeek：完全にローカルで動作するタスク自動化のためのAIアシスタント

概要 AgenticSeekは、完全にローカルで動作するオープンソースのAIアシスタントで、Deepseek R1モデルに基づいています。クラウドAPIを必要とせず、数百ドルの月額費用もかかりません。映画の「ジャービス」のような知的アシスタントを目指しています。

1年前

0110.1K

VoltAgent：AIインテリジェンスを迅速に構築するためのTypeScriptオープンソースフレームワーク

概要 VoltAgentはオープンソースのTypeScriptフレームワークで、AIインテリジェンスの迅速な構築とオーケストレーションを支援するために開発者向けに設計されている。モジュール化されたツールと標準化された開発モデルを提供することで、大規模な言語モデル（LLM）、ステート...

1年前

0110K

ChatGPT-on-WeChat：基于大模型构建的智能对话机器人，支持微信等多对话平台接入

ChatGPT-on-WeChat：大規模モデルに基づいて構築されたインテリジェント対話ロボット。

総合的な紹介 ChatGPT-on-WeChatプロジェクトは、大きなモデルベースのインテリジェント対話ロボットであり、個人WeChat、WeChatパブリック番号、企業WeChatアプリケーション、Flybook、Nailなどのマルチプラットフォームへのアクセスをサポートしています。ユーザーはGPT3.5、GPT-4、Claude、Man...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0109.9K

tldraw: オープンソースの無制限キャンバス・ホワイトボードSDK、最小限のワイヤーフレームとUMLダイアグラムを生成するAI

一般的な説明 tldraw は、ユーザーが素早くグラフィックを描いたり、テキストを書き込んだり、即座に共同作業ができる無制限のキャンバスを提供する、無料で即座に共同作業ができるドローツールです。直感的なインターフェースと優れたパフォーマンスが特徴で、チームコラボレーションやリモートワークに適しています。オープンソースコミュニティを通じてサポートされているtldr...

2年前

0109.9K

IC-Light(V2)：画像照明制御マジック、画像の光と影、背景を制御する

包括的な紹介 IC-Lightは画像照明制御のためのプロジェクトであり、高度なAIモデルによって画像の照明効果を操作することを目的としている。Lvmin Zhangらによって開発されたこのプロジェクトは、2つの主要なモデルを提供する：テキスト条件付き再照明モデルと背景条件付きモデル。ユーザは、このモデルを使って...

2年前

0109.6K

InstantCharacter：単一の画像から一貫性のある文字を生成するオープンソースツール

概要 InstantCharacterは、Tencent HunyuanとInstantXチームによって開発されたオープンソースプロジェクトで、GitHubでホストされています。InstantCharacterは、参照画像とテキスト説明文を含む、一貫性のある文字マップを生成します。

1年前

0109.5K

DDG-Chat：ワンクリックでChat2APIバックエンドをデプロイ、DuckDuckGoをAPIへ

一般的な紹介 DDG-Chat は、ワンクリックで複数のプラットフォームにデプロイできる ChatGPT API バックエンドを提供することを目的としたオープンソースプロジェクトです。このプロジェクトは、GPT-4o mini、Claude 3 Haiku、Llam...を含む複数のモデルをサポートしています。

2年前

0109.4K

オープンパイロット：オープンソースの自律走行システム。

概説 OpenPilotは、comma.aiが開発したオープンソースの自律走行システムで、高度な運転支援機能により既存の自動車の運転体験と安全性を向上させる。2016年の最初のリリース以来、OpenPilotは2...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0109.3K

ディープチャット：ウェブサイトを素早く統合するAIチャットコンポーネント

概要 Deep Chatはウェブ開発者向けに設計されたオープンソースのAIチャットコンポーネントです。Ovidijus Parsiunasによって開発され、GitHubでホストされています。ユーザは単に設定することができます...

1年前

0109.2K

GraphRAG-Dify：DifyにGraphRAGの機能を装備する

包括的な紹介 GraphRAG-Difyは、GraphRAGとDifyの技術を組み合わせて、AIエージェントを素早く作成し、デプロイするために設計されたオープンソースプロジェクトです。このプロジェクトでは、サービス構築にFastAPIとUvicornを使用し、DSLのインポートをサポートしています。

2年前

0109.1K

Gemini Balance：Gemini模型API兼容OpenAI格式，解锁区域限制并支持多API Key轮询

Gemini Balance: GeminiモデルAPIはOpenAIフォーマットと互換性があり、リージョン制限を解除し、マルチAPIキーポーリングをサポートする。

包括的な紹介 Gemini Balanceは、FastAPIフレームワークに基づいて開発されたOpenAI APIプロキシサービスで、効率的なマルチAPI Key管理と最適化機能を提供することを目的としている。このプロジェクトはGeminiモデルコールをサポートしており、主な機能にはマルチAPI...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0109K

GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換

概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。

2年前

0108.8K

BEN2: 画像や動画から背景を高速除去するディープラーニングモデル

包括的な紹介 BEN2（Background Erase Network 2）は、Prama LLCによって開発されたディープラーニングモデルで、特に画像から背景を自動的に除去し、前景画像を生成するように設計されています。このモデルは革新的なConfiden...

1年前

0108.8K

BetterWhisperX：話者から切り離された自動音声認識により、高精度の単語レベルのタイムスタンプを提供

はじめに BetterWhisperXは、効率的で正確な自動音声認識（ASR）サービスを提供することに重点を置いたWhisperXプロジェクトの最適化バージョンです。WhisperXの改良版として、このプロジェクトはFederico ...

2年前

0108.6K

NGCBot：ニュースプッシュ、AI対話、グループチャット管理のためのWeChatボット

包括的な紹介 NGCBotはWeChatロボットオープンソースプロジェクトの開発に基づくHOOKメカニズムであり、開発者ngc660sec（Yunshan/eXM）によって作成され、GitHub上でホストされている反復の2年後、V2.3の現在のバージョンは、最初のシンプルな機能から...

1年前

0108.6K

TANGO：全身デジタル人物の協調ジェスチャーポートレート映像を音声で生成するツール

概論 TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusi...

2年前

0108.6K

Wenduoduo AiPPT: AI生成PPT、プレゼンテーション生成

総合紹介 AiPPTは人工知能技術に基づいたPPT生成ツールで、プロフェッショナルなプレゼンテーションを素早く作成できるように設計されています。テーマを入力したり、ファイルをアップロードしたり、URLを提供したりすることで、内容が豊富で美しくデザインされたスライドを自動的に生成します。

1年前

0108.5K

GPT SoVITS：画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。

2年前

0108.5K

Qwen2.5-VL：画像・ビデオ文書解析のためのオープンソース・マルチモーダルラージモデル

総合紹介 Qwen2.5-VLは、アリババクラウド(Alibaba Cloud)のQwenチームによって開発されたオープンソースのマルチモーダルビッグモデルです。Qwen2.5-VLはQwen2-VLのアップグレード版で、Qwen2.5-VLをベースに、テキスト、画像、動画、ドキュメントを同時に扱うことができます。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0108.1K

MCP Playwright：ブラウザの自動化操作を提供するMCPサービス

一般的な紹介 MCP-Playwrightは、ExecuteAutomationによって開発され、GitHubでホストされているオープンソースのツールです。PlaywrightとModel Context Proto... をベースにしている。

1年前

0108.1K

Magic MCP: モダンなUIコンポーネントを生成するMCPサービス

一般的な紹介 Magic MCPは21st.devチームによって開発されたAI駆動ツールで、フロントエンド開発者のために設計されています。自然言語の記述からモダンなUIコンポーネントをオンザフライで生成し、Cursor、WindSurfと統合します。

1年前

0108.1K

Outlines：通过正则表达式、JSON或Pydantic模型生成结构化文本输出

アウトライン: 正規表現、JSON、Pydanticモデルによる構造化テキスト出力の生成

概説 Outlinesは、構造化テキスト生成を通じて大規模言語モデル（LLM）のアプリケーションを強化するために、dottxt-aiによって開発されたオープンソースライブラリです。このライブラリは、OpenAIやトランスフォーマーなど、様々なモデルの統合をサポートしています。

1年前

0108K

GFPGAN：テンセントのオープンソース顔修復アルゴリズム

総合紹介 GFPGAN（Generative Facial Prior GAN）は、Tencent ARC（Applied Research Center）が開発したオープンソースの顔修復アルゴリズムです。このアルゴリズムでは、事前に訓練された顔GAN...

2年前

0107.9K

cognee：知識グラフベースのRAG構築のためのオープンソースフレームワーク、コアプロンプト学習

概要 CogneeはAIアプリケーションとAIエージェントのために設計された信頼性の高いデータレイヤーソリューションです。LLM（大規模言語モデル）コンテキストのロードと構築を行い、ナレッジグラフとベクトルストアを通じて正確で解釈可能なAIソリューションを作成するように設計されています。このフレームワークは、コスト削減、解釈可能な...

2年前

0107.5K

Abogen：複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...

1年前

0107.4K

AutoGen Studio：マルチエージェントシステムAutoGenの使いやすいインターフェイス版

概要 AutoGen Studio 2.0は、マルチエージェント・ソリューションの作成と管理のプロセスを簡素化するために設計されたAutoGenによるユーザー・インターフェースです。このプラットフォームでは、直感的なインターフェースを通じて、エージェントとそのワークフローを宣言的に定義および変更することができます...

2年前

0107.3K

A2A：グーグル、AIインテリジェンス間の通信のためのオープンプロトコルを公開

概要 A2A (Agent2Agent)は、異なるフレームワークやベンダーによって開発されたAIインテリジェンスが相互に通信し、コラボレーションすることを可能にするためにGoogleによって開発されたオープンソースプロトコルである。このプロトコルは、インテリジェンスが互いの能力を発見し、タスクを共有し、作業を完了するための標準化された一連の方法を提供する。

1年前

0107.1K

ElizaOS: 自律実行型マルチインテリジェントの構築、完全機能のオープンソースAIインテリジェントボディ開発フレームワーク

包括的な紹介 Elizaは先進的なマルチインテリジェントボディ（マルチエージェント）開発フレームワークで、自律的なインテリジェントボディ（自律エージェント）の構築と展開プロセスを簡素化することに取り組んでいます。異なる役割設定を持つ複数のインテリジェントボディの配置をサポートし、インテリジェントな...

2年前

0107.1K

Steel Browser：自动化网页浏览器API，构建控制浏览器操作的智能体与应用

Steel Browser: ブラウザ操作を制御するインテリジェンスとアプリケーションを構築する自動ウェブブラウザAPI

概要 Steel Browserは、AIエージェントとアプリケーションのために設計されたオープンソースのブラウザAPIです。Steel Browserは、インフラストラクチャを気にすることなくウェブ操作を自動化できるフルブラウザインスタンスを提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0107K

MetaGPT：自然言語プログラミングのためのAIソフトウェア開発チーム構築のための多知能コラボレーションフレームワーク

包括的な紹介 MetaGPTは、完全なAIソフトウェア会社の運営をシミュレートするために設計された革新的なマルチインテリジェンス体のフレームワークです。geekan（アレクサンダー・ウー）によって作成されたこのプロジェクトの目標は、異なる役割を持つGPTモデルを協調的なエンティティに結合することです...

1年前

0107K

TubeTube: 自己展開型YouTube動画ダウンロードツール

概要 TubeTubeはMattBlackOnlyによって開発されたオープンソースのYouTube動画ダウンロードツールです。このツールは、コアダウンロードエンジンとしてyt-dlpを使用し、マルチスレッドダウンロードをサポートし、同時に複数のビデオをすばやくダウンロードすることができます。ユーザーはyam...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0106.9K

FinGPT: 金融分析と予測のためのオープンソース金融ビッグ言語モデリング・プラットフォーム

概論 FinGPTは、AI4Finance財団によって開発されたオープンソースの金融ビッグ言語モデリング・プラットフォームであり、複雑な金融タスクを解決し、フィンテックにおけるイノベーションを推進するために金融セクター向けに設計されている。FinGPTは、軽量適応技術と強化学習アプローチを利用している。

2年前

0106.9K

PPTX2MD: PPTXファイルをMarkdownに変換する特別なツール

概要 PPTX2MDは、PowerPointのPPTXファイルをMarkdown形式に変換するために設計されたオープンソースツールです。GitHubユーザーのssine氏によって開発されたこのツールは、見出し、リスト、テキストフォーマット（例：太字、斜体、色、スーパー...）を保持することをサポートしています。

1年前

0106.8K

Klee：デスクトップ上でAIマクロモデルをローカルに実行し、プライベート知識ベースを管理する

概論 Kleeはオープンソースのデスクトップアプリケーションで、オープンソースの大規模言語モデル（LLM）をローカルで実行し、安全なプライベート知識ベース管理とMarkdownノートテイク機能を利用できるように設計されています。OllamaとLlamaIndexの技術に基づいています。

1年前

0106.8K

MNN-LLM-Android: AndroidのためのMNNマルチモーダル言語モデリング

包括的な紹介 MNN（Mobile Neural Network）は、アリババが開発し、モバイルデバイス向けに最適化された、効率的で軽量なディープラーニングフレームワークである。MNNは、モバイルデバイス上で高速な推論が可能なだけでなく、テキスト生成などのマルチモーダルなタスクもサポートしている...

2年前

0106.7K

Stagehand: ブラウザオートメーション操作の自然言語実装フレームワーク

一般的な紹介 Stagehand は、シンプルさと拡張性に重点を置いた AI ウェブブラウジングフレームワークである。Playwrightと完全に互換性があり、3つのシンプルなAI API（act、extract、observe）を提供する。

2年前

0106.6K

InstantID：画像をアップロードし、さまざまなスタイルの画像を生成するためにポートレート機能を移行する。

包括的な紹介 InstantIDは、1枚の参照ID画像を使用して、高い忠実度を確保しながら、パーソナライズされたスタイルやポーズの画像を数秒で生成することに焦点を当てた先進技術です。この技術は、顔画像とランドマークマップを統合することで、拡散モデルに基づいたソリューションを使用しています。

2年前

0106.5K

Cursor Auto Register：自动创建并管理Cursor账号的开源工具

Cursor Auto Register: 自動的にCursorアカウントを作成・管理するオープンソースツール

概要 Cursor Auto RegisterはGitHubでホストされているオープンソースプロジェクトです。開発者のddCat-mainによって作成され、ユーザーがCursor AIコードエディターのアカウントを自動的に登録・管理できるようにします。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0106.4K

マッド・プロフェッサー：学術論文の読解と分析を支援するAIツール

一般的な紹介 Mad Professor (Grumpy Professor Reads Papers) は、研究者や学生のために設計されたオープンソースのAI学術ツールで、学術論文の読み取りと分析を簡素化します。PDF処理、AI翻訳、RAG検索、AI質問...を統合しています。

1年前

0106.2K

Step1X-Edit：自然言語指示による画像編集のためのオープンソースツール

一般的な紹介 Step1X-Editは、Stepfun AIチームによって開発され、GitHubでホストされているオープンソースの画像編集フレームワークです。マルチモーダル大規模言語モデル（Qwen-VL）と拡散変換器（DiT）を組み合わせることで、ユーザーはシンプルで自然な操作で画像を作成することができます。

1年前

0106.1K

Orama：高性能な書籍・ベクトル全文検索エンジン

概説 Oramaはオープンソースの高性能検索エンジンで、すべてTypeScriptで記述されており、全文検索、ベクトル検索、ハイブリッド検索をサポートしている。OramaはあらゆるJavaScript実行環境で動作するように設計されており、高速で信頼性の高い検索を提供する。

2年前

0106.1K

CrewAI：複雑なタスクを簡素化するマルチロールプレイ協調知能フレームワーク

包括的な紹介 CrewAIは、ロールプレイングと自律型AIエージェント間のコラボレーションをオーケストレーションするために設計された高度なフレームワークです。コラボレーションインテリジェンスを促進することで、CrewAIはエージェントがシームレスに連携して複雑なタスクを解決することを可能にします。インテリジェントアシスタントプラットフォームの構築、カスタマーサービスチームの自動化、マルチエージェント...

2年前

0105.8K

FreeAI: PollinationsパッケージをベースにしたフリーのAIツール。

概要 FreeAIは、Pollinations.AI APIをベースとしたオープンソースのAIアプリケーションプラットフォームで、無料で無制限のAIチャットアシスタント、画像生成、音声合成サービスを提供している。このプロジェクトは、開発者のAzad-slによってG...

1年前

0105.6K

Anon-Kode：コマンドラインAIコード・アシスタント（クロード・コードのコード分解）

一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。

1年前

0105.6K

MoneyPrinterTurbo：ビデオテーマを入力すると、ワンクリックでビデオコピーと短いHDビデオを生成します。

総合紹介 MoneyPrinterTurboはオープンソースプロジェクトで、先進的なAIビッグモデル技術を利用して、ワンクリックで短いHDビデオを生成する機能を実現します。ユーザーは動画のテーマやキーワードを提供するだけで、システムが自動的に動画コピー、動画クリップ、動画字幕を生成します。

1年前

0105.6K

Search-R1: 検索と推論のための大規模モデルを学習する強化学習

概要 Search-R1はPeterGriffinJinによってGitHub上で開発されたオープンソースプロジェクトであり、veRLフレームワーク上に構築されている。強化学習(RL)技術によって大規模言語モデル(LLM)を学習し、モデルが自律的に学習することを可能にします...

1年前

0105.4K

Moffee：マークダウンをPPTスライドショーに変換する

一般的な紹介 Moffeeは、Markdownファイルを素早く、簡単かつ効率的にプロフェッショナルなスライドショーに変換するオープンソースツールです。ユーザはMarkdownコンテンツを書くだけで、Moffeeはレイアウト、ページ分割、スタイルを自動的に処理し、手作業でタイプセットする必要がなくなります。

1年前

0105.1K

DeepSeek-VL2：高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE（Mixture-of-Experts）視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...

1年前

0105.1K

Refly：記事自動生成のための無料キャンバス上のプロセスオーケストレーションに基づくAIライティングプラットフォーム

包括的な紹介 Reflyは、マルチスレッド対話、ナレッジベース統合、文脈記憶、インテリジェント検索技術を通じて、ユーザーがアイデアを高品質なコンテンツに変換できるように設計された、無料のキャンバスベースのAIネイティブオーサリングエンジンです。このプラットフォームは、学習...

1年前

0104.9K

Gemini-OpenAI：反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI：リージョン制限を回避し、OpenAI互換APIに変換する逆世代Geminiアドレス

一般的な紹介 Gemini OpenAI API Agentは、無料でサーバーのメンテナンスが不要なOpenAI準拠のエンドポイントです。ユーザは、Vercel、Netlify、Cloudflareなどのプラットフォームに、個人で簡単にデプロイすることができます。プロジェクト ...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0104.6K

TreeGPT: ツリーベースの会話を可視化するAIチャットインターフェース

概要 TreeGPTは、Next.jsをベースとしたオープンソースのチャットアプリケーションです。大規模な言語モデル（LLM、GPTなど）の会話を、ツリーグラフ構造（有向非循環グラフ、DAG）を通して可視化することに重点を置き、従来の直線的なチャット手法に取って代わることで、スピードと...

1年前

0104.6K

非構造化：オープンソースの非構造化ドキュメントの前処理、非構造化データ処理ツール

包括的な紹介 Unstructured-IOは、画像やPDF、HTML、Word文書などのテキスト文書を処理・前処理するためのオープンソースコンポーネントのセットを提供します。その主な目的は、特に大規模な言語モデル（LL...

2年前

0104.5K

サーバーレス高速デプロイ Grok3国内ミラーサイト

概要 Grok Playgroundは、"Technical Crawling Shrimp "のチームによって開発されたオープンソースプロジェクトである。このツールの主な機能は、ユーザーがGrok3の国内ミラーサイトを10秒でデプロイできるようにすることです。 Grok3はxAIによって導入された人工知能モデルで、...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0104.4K

MobileAgent：モバイル機器操作アシスタントのためのマルチエージェント・コラボレーション

一般的な紹介 MobileAgentは、マルチエージェントコラボレーションと強化された視覚認識モジュールにより、モバイルデバイス操作の効率と自動化を改善するために設計された強力なモバイルデバイス操作アシスタントです。X-PLUGチームによって開発され、Androidと...

2年前

0104.4K

こころ：自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、より少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0の下でライセンスされています。

2年前

0104K

Firecrawl MCP Server：基于 Firecrawl 的网页爬虫 MCP 服务

Firecrawl MCPサーバー: FirecrawlベースのWebクローラーMCPサービス

概要 Firecrawl MCP Serverは、MendableAIによって開発されたオープンソースツールで、モデルコンテキストプロトコル（MCP）プロトコルの実装に基づき、Firecrawl A...

1年前

0103.7K

BlenderMCP：3Dモデルの生成にBlenderを使用するMCPサービス

一般的な紹介 BlenderMCPは、モデルコンテキストプロトコル（MCP）プロトコルを介してBlenderとClaude AIを接続するオープンソースツールです。ユーザはテキストコマンドを使って、Claude AI を直接制御することができます。

1年前

0103.7K

AI Auto Free：使用自动化工具无限制使用AI IDE（如Cursor和Windsurf）

AIオートフリー：自動化ツール（CursorやWindsurfなど）を使用したAI IDEが使い放題

概要 AI Auto Freeは、CursorやWindsurfなどのAI駆動統合開発環境（IDE）をユーザーが無制限に利用できるように設計された強力な自動化ツールです。このプロジェクトはクロスプラットフォームをサポートし、複数の言語機能を含んでいます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0103.7K

PocketFlow：100行のコードでAIアプリケーションを開発するための最小限のフレームワーク

総合紹介 PocketFlowは、The-Pocketチームによって開発され、GitHub上でオープンソース化された、わずか100行のコードからなる軽量なAIアプリケーション開発フレームワークです。ミニマリストデザインを追求し、100行のコアコード制御、外部依存なし...

1年前

0103.7K

MediaCrawler: マルチソーシャルメディアプラットフォームコンテンツ、ビデオコメントクローラーツール

概要 MediaCrawlerは、開発者向けに設計されたソーシャルメディアコンテンツのクローラーツールです。強力なクローラー機能を提供することで、Xiaohongshu、Shake、Shutter、B、Weiboなどのソーシャルプラットフォームから動画、画像、コメント、いいね、リツイートなどのデータを素早く取得することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0103.5K

AIGCPanel: デジタルマンインテグレーションシステムのオープンソースクローン。

総合紹介 AigcPanelは、electron+vue3+typescriptの技術スタックで開発され、Windows上でワンクリックで展開できる、すべてのユーザーのためのワンストップAIデジタルヒューマン制作システムです。AigcPanelは、ユーザーフレンドリーな設計を核心としており、...

2年前

0103.4K

Browser-Use：AIインテリジェントがブラウザを簡単に操作するためのインテリジェント・ウェブ・オートメーション・ツールの構築

包括的な紹介 Browser-Useは、言語モデル（LLM）がウェブサイトと自然に対話できるように特別に設計された、革新的なオープンソースのウェブ自動化ツールです。強力で柔軟なフレームワークを提供し、GPT-4、Claud...などの主流の言語モデルを幅広くサポートします。

2年前

0103.4K

n8n-mcp-server: n8nワークフローと対話するためのMCPサービスツール

一般的な紹介 n8n-mcp-serverはGitHubでホストされているオープンソースプロジェクトで、Leonard Sellemによって開発されています。MCP (Model Context Protocol) サービスツールであり、...

1年前

0103.2K

AsrTools：音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント

包括的な紹介 AsrToolsはCutscene、Racer、Must Cutなどの大手メーカーのインタフェースを内蔵したインテリジェントな音声テキスト変換ツールです。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の単語を出力することができます。

2年前

0103.2K

Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール

包括的な紹介 Unslothは、大規模言語モデル（LLM）の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。

1年前

0103.1K

ウィスパーインプット：Groqを使った無料・高速の音声テキスト起こしサービス

概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。

1年前

0102.6K

Dia：超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成（TTS）モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。

1年前

0102.6K

AIstudioProxyAPI：无限使用 Gemini 2.5 Pro 模型 API

AIstudioProxyAPI: Gemini 2.5 ProモデルAPIを無制限に使用可能

包括的な紹介 AIstudioProxyAPIは、Node.jsとPlaywright技術を使って、OpenAI APIをエミュレートするオープンソースプロジェクトである。

1年前

0102.5K

Tifa-DeepsexV2-7b-MGRPO：支持角色扮演和复杂对话的模型，性能超越32b（附一键安装包）

Tifa-DeepsexV2-7b-MGRPO: ロールプレイと複雑なダイアログをサポートし、32bを超えるパフォーマンスを持つモデル (ワンクリックインストールパッケージ付き)

総合紹介 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4は、複雑なロールプレイングや複数ラウンドの対話をサポートするために設計された効率的な言語モデルです。Qwen 2.5-7Bをベースに深く最適化されており、優れたテキスト生成とダイアログ...

1年前

0102.4K

ファブリック：AIオープンソースのワークフローフレームワークで、多くのキューワードを統合し、様々なトランザクションを効率的に処理する。

概論ファブリックは、ダニエル・ミースラーによって開発されたオープンソースのAIフレームワークで、日常的なコンピュータ・タスクを簡素化・自動化し、人工知能を使いやすくすることを目的としている。モジュール設計とあらかじめ定義されたプロンプトワード（パターン）によって、ユーザーを効率的に支援する。

2年前

0102.4K

Kolors Virtual Try On：高效的虚拟试穿/模特换装，文本到图像生成模型

Kolorsバーチャル試着：効率的なバーチャル試着/モデル着せ替え、テキストから画像生成モデル

概要 Kolors Virtual Try-Onは、Kwai-KolorsチームによるHugging Faceプラットフォーム上のバーチャル試着アプリです。このアプリは、高度な人工知能技術を使って、ユーザーがバーチャル試着をするのを手助けします。

2年前

0102.3K

最適化されたコード生成と表示のためのオープンWebUI

概論 Open WebUI Artifacts OverhaulはOpen WebUIをベースにしたフォークプロジェクトで、開発者のNick Tonjumによって開発された。AIが生成したコードを改善することに焦点を当てたオープンソースツールです。

AIニュース # AI Java オープンソースプロジェクト # AIローカライズチャットアプリケーション

1年前

0102.1K

TimesFM 2.0：グーグルが時系列予測のための事前学習済みモデルをオープンソース化

一般的な紹介 TimesFM 2.0 - 500M PyTorchは、Google Researchによって開発され、時系列予測用に設計された事前学習済みの時系列ベースモデルです。このモデルは、上下2048の時点を扱うことができます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

0102.1K

RD-Agent：自动化数据驱动研发工具，通过AI技术推动以数据为导向的研发过程

RD-Agent：AI技術によりデータ駆動型研究開発プロセスを促進する自動化されたデータ駆動型研究開発ツール

一般的な紹介 RD-Agentは、研究開発（R&D）プロセスを自動化し最適化するために設計されたMicrosoftのオープンソースツールです。RD-Agentは、研究開発プロセスを自動化し、最適化するために設計されたMicrosoftのオープンソースツールです。このツールは、人工知能技術によってモデルとデータ開発の効率を向上させるデータ駆動シナリオに焦点を当てています。

1年前

0102K

ソニック：音声でポートレート画像を生成し、生き生きとした表情のデジタルデモ映像を制作

概要 Sonicは、グローバルな音声知覚に焦点を当てた革新的なプラットフォームであり、音声によって駆動される鮮やかなポートレートアニメーションを生成することを目的としている。テンセントと浙江大学の研究チームによって開発されたこのプラットフォームは、音声情報を使って表情や頭の動きを制御し、自然で滑らかなアニメーション動画を生成する。

1年前

0102K

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室（HKUST Audio）が開発したオープンソースの音声合成（TTS）モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。

1年前

0101.9K

CFG-Zero-star：画像とビデオの生成品質を向上させるオープンソースツール

包括的な紹介 CFG-Zero-starは、Weichen Fanと南洋理工大学のS-Labチームによって開発されたオープンソースプロジェクトです。誘導戦略とゼロ初期値を最適化することで、ストリーム・マッチング・モデルにおけるクラシファイア・フリー・ガイダンス（CFG）技術を改善することに焦点を当てています。

1年前

0101.9K

DUIX: リアルタイムのインタラクションを実現するインテリジェントなデジタルピープル、マルチプラットフォームのワンクリック導入をサポート

概論 DUIX（Dialogue User Interface System）は、シリコン・インテリジェンスが開発したAIを搭載したデジタル・ヒューマン・インタラクション・プラットフォームです。オープンソースのデジタル・ヒューマン・インタラクション機能により、開発者は大規模モデル、自動音声認識（ASR...

2年前

0101.8K

Qwen-Agent：基于Qwen的智能代理应用框架，包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: ツールコール、コードインタプリタ、RAG、Chrome拡張機能を含む、インテリジェントエージェントアプリケーションのためのQwenベースのフレームワーク。

包括的な紹介 Qwen-Agent は、Qwen 2.0 以降をベースに開発されたインテリジェントエージェントアプリケーションフレームワークで、コマンドフォロー、ツール使用、プランニング、メモリなどの機能を備えています。このフレームワークは、ブラウザアシスタント、コードインタプリタ、カスタムアシスタントのような様々なサンプルアプリケーションを提供します。

2年前

0101.7K

MTEB：テキスト埋め込みモデルの性能を評価するベンチマーク

概論 MTEB（Massive Text Embedding Benchmark）は、embeddings-benchmarkチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、テキスト埋め込みモデルを提供することを目的としている。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

0101.7K

LHM：1枚の画像から動き対応の3D人体モデルを生成する

包括的な紹介 LHM（Large Animatable Human Reconstruction Model）は、aigc3dチームによって開発されたオープンソースプロジェクトで、1枚の画像からアクションをサポートする3D人体モデルを素早く生成します。主な特徴 ...

1年前

0101.6K

DiffRhythm：最大4分45秒の曲を10秒で生成。

概要 DiffRhythmはASLP-lab (Audio, Speech and Language Processing Group, Northwestern Polytechnical University)によって開発されたオープンソースプロジェクトで、人工知能技術によるエンドツーエンドの音楽作成に焦点を当てています。DiffRhythmはLatent Diffu...

1年前

0101.6K

MangaNinjia：アニメのモノクロ線画に素早く色をつける自動線画着色ツール。

総合紹介 MangaNinjiaはAlibaba Tongyi Visual Intelligence Lab (Ali-Vilab)によって開発されたオープンソースプロジェクトで、線画のカラーリングの自動処理に焦点を当てています。このツールは、ディープラーニング技術によって参照画像の正確なカラーマッチングを実現し、線画の色付けを大幅に改善します。

2年前

0101.5K

Motia: コードでインテリジェンスを迅速に構築するための開発フレームワーク

一般的な紹介 Motiaは、GitHubでホストされ、MotiaDevチームによって開発された、ソフトウェアエンジニアのためのオープンソースのAIエージェントフレームワークです。開発者は使い慣れたプログラミング言語（例：Python、TypeScript、Rub...

1年前

0101.5K