AIオープンソースプロジェクト

合計1020記事

順番に並べる

GraphAgent: タスク計画と実行を自動化する知識グラフの構築

包括的な紹介グラフエージェントは、グラフ生成、タスク計画、タスク実行を統合した自動インテリジェント・ボディ・システムである。構造化および非構造化データを処理し、複雑な意味依存グラフを構築し、自己計画およびツールマッチングによってユーザタスクを効率的に実行することができる。

2年前

077.7K

GeminiCoder：基于LlamaCoder项目，使用Gemini API快速生成Web应用程序

GeminiCoder: LlamaCoderプロジェクトに基づき、Gemini APIを使用してWebアプリケーションを素早く生成する。

包括的な紹介 GeminiCoderは、Google Gemini APIに基づいて開発された革新的なWebアプリケーション生成ツールです。このプロジェクトは、LlamaCoderの優れた機能を継承し、最新のGemini 1.5 Prを統合しています。

2年前

077.7K

LangGraph CUA：コンピュータ操作を制御するLangGraphベースのAIインテリジェンス

LangGraph CUAはLangChainチームによって開発されたオープンソースプロジェクトである。LangGraphフレームワークをベースにしており、開発者はPythonを使ってコンピュータを直接操作できるAIインテリジェンスを構築することができる。このツールのコアは...

1年前

077.7K

Qwen4Mac: MacのメニューバーにあるQwenの大きなモデルを使って、いつでも会話ができます！

概要 Qwen4MacはQwen Large Language Model (LLM)をMacのメニューバーに統合し、ユーザーがいつでも簡単に呼び出して使えるようにするために設計されたオープンソースプロジェクトです。このプロジェクトは、andreaturchetによって開発・保守されており、ユーザが簡単にQwenを...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

077.7K

InsightExpress：AIを活用した調査レポートの作成とメール配信

概要 InsightExpressはNext.jsベースのアプリケーションで、ユーザーが提供したトピックに基づいてAI主導の調査レポートを生成し、ユーザーにメールで送信します。このアプリケーションは、LangflowのAI ...

1年前

077.6K

DualPipe：双向流水线并行算法，提升大规模AI模型训练效率（DeepSeek 开源周第四天）

DualPipe：大規模AIモデルの学習効率を向上させる双方向パイプライン並列アルゴリズム（DeepSeek Open Source Week Day 4）

概要 DualPipeは、DeepSeek-AIチームによって開発されたオープンソース技術で、大規模なAIモデルトレーニングの効率向上に焦点を当てています。主にDeepSeek-V3とR1で使用されている革新的な双方向パイプライン並列アルゴリズムです。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

077.6K

Solana Agent Kit: AIインテリジェンスをSolanaプロトコルに接続するためのオープンソースツールキット

概要 Solana Agent Kitは、AI知能をSolanaブロックチェーン・プロトコルにシームレスに接続するために設計されたオープンソースのツールキットである。このキットにより、AI研究者と暗号通貨開発者の双方が、モデル訓練された知的体を使用して、ブロックチェーン上で...

1年前

077.6K

VideoReTalking：音声駆動型リップシンクロ・ビデオ編集システム

一般的な紹介 VideoReTalkingは、ユーザーが入力音声に基づいてリップシンクロナイズされた顔のビデオを生成し、異なる感情であっても高品質でリップシンクロナイズされた出力ビデオを生成できる革新的なシステムです。このシステムは、この目標を3つの連続したタスクに分割します。

2年前

077.6K

Text2Voice：シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース（GUI）が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...

1年前

077.5K

GraphCast：拡散モデルに基づく中期的な世界気象予測の学習と予測のための効率的なツール

はじめに GraphCastはGoogle DeepMindによって開発された先進的な天気予報ツールで、ディープラーニング技術によって中期的な世界の天気予報の精度を向上させることを目的としている。このプロジェクトでは、事前に学習された様々なモデルとサンプルコードを提供しており、ユーザーはこれらのコードをリソースとして利用することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

077.5K

MJML: ChatGPTでレスポンシブメールを簡単にデザイン、マーケティングメールを素早く生成

概要 MJML（Mail Junction Markup Language）は、Mailjetチームによって開発されたオープンソースのフレームワークで、レスポンシブなメールテンプレートの作成を簡素化します。セマンティックなマークアップ言語と豊富なコンポーネントライブラリにより、開発者は少ないコードで美しくパワフルなメールテンプレートを効率的に作成することができます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

077.5K

GAG：人間の行動をシミュレートする大規模モデルを用いた社会関係グラフの生成

はじめに GraphAgentは、Ji-Catherによって開発され、GitHubでホストされているオープンソースのフレームワークです。Large Language Model (LLM)を使用して人間の行動をシミュレートし、テキスト属性を持つダイナミックなソーシャルグラフを生成します。このツールは、オンライン・ソーシャル・メディア...

1年前

077.4K

使いやすいオープンソースのAIライティング・アシスタント

概要 AI Writing Assistantは、Next.jsをベースとしたオープンソースのAIライティングアシスタントで、GitHubでホストされています。このツールにより、ユーザーは詳細な...

1年前

077.3K

ClickClickClick：任意のLLMを有効にし、AndroidとPCの操作を自動化する

一般的な紹介 ClickClickClickはBandarLabsによって開発されたフレームワークで、ローカルまたはリモートの大規模言語モデル（LLM）を使用してAndroidやPCの操作を自動化することを目的としています。このプロジェクトは現在、非常に実験的な段階にあり、以下のような様々なモデルをサポートしています。

2年前

077.3K

WhisperChain：リアルタイム音声テキスト化と話し言葉の最適化

概論 WhisperChainはGitHubでホストされているAIベースのオープンソースプロジェクトで、開発者のクリス・チョイが主導している。主に音声をテキストに変換し、AI技術によって自動的に表現を最適化し、冗長な部分を削除するために使用される。

1年前

077.3K

mac assistant: macOSデバイスのデスクトップ操作を自動化するAIインテリジェンス

概論 mac assistantはmacOSのために設計されたAI知能体プロジェクトであり、ネイティブソフトウェアとウェブ機能を組み合わせることでユーザー操作を簡素化することを目的としている。このプロジェクトは現在OpenAIとGEMINIのAPIをサポートしており、将来的には...

1年前

077.3K

DeepCoder-14B-Preview：コード生成に優れたオープンソースモデル

概要 DeepCoder-14B-Previewは、Agenticaチームによって開発され、Hugging Faceプラットフォームでリリースされたオープンソースのコード生成モデルです。DeepSeek-R1-Distilled-Qをベースにしています。

1年前

077.2K

Unigraph：ローカルで動作する知識グラフとパーソナル検索エンジンの構築

一般的な紹介 Unigraphはローカルファーストの汎用ナレッジグラフとパーソナル検索エンジンである。Unigraphを使えば、ユーザは様々なソースからのデータを統合して...

2年前

077.1K

Kheish: 高品質な結果を出すために、出力をレビュー、検証、フォーマットするマルチロールインテリジェンス

包括的な紹介 Kheishは、構造化されたステップバイステップのコラボレーションを必要とする大規模言語モデリング（LLM）タスクのために設計されたオープンソースのマルチロールエージェントです。Kheishは単なるコーディネータではなく、それ自体がインテリジェントなエージェントであり、要求に応じてモジュールを要求し、ユーザーの反転を統合します。

2年前

077.1K

DeepResearcher：複雑な問題を研究する強化学習ベースのドライビングAI

包括的な紹介 DeepResearcherは、上海交通大学のGAIR-NLPチームによって開発されたオープンソースプロジェクトです。強化学習(RL)によって実際のウェブ環境でエンドツーエンドで学習された大規模言語モデル(LLM)に基づくインテリジェントな研究ツールです。プロジェクト...

1年前

077.1K

Lepton Search: オープンソースの会話型AI検索エンジン|Lepton Search

Lepton Search 概要 Lepton Searchは、賈洋青が立ち上げ、Lepton AIプラットフォームを使って構築された会話型AI検索エンジンである。Lepton Searchは、自然言語による質問に基づいてユーザーを積極的に検索することができる。

2年前

077K

muAgent：LLMとEKG（業界知識）によって駆動される新しいエージェントオーケストレーションフレームワーク

概要 muAgent は、Ant Group が開発した革新的なマルチインテリジェントフレームワークです。このフレームワークは、マルチインテリゲンチャ、ファンクションコール、コードインタープリタ、およびその他のテクノロジーと連携し、キャンバスのドラッグアンドドロップと簡単なテキスト記述によって、ユーザが人間の指導の下で様々な複雑な標準操作手順(SOP)を実行するのを支援します。

2年前

077K

Agentarium：複数のAIインテリジェンス間の相互作用の管理と調整

概要 Agentariumは、AIインテリジェントエージェント（Agent）の管理とオーケストレーションに特化した強力なPythonフレームワークです。このフレームワークは、複数のAIエージェント間のインタラクションを作成、管理、オーケストレーションするための柔軟で直感的な方法を提供します。A...

2年前

077K

MultiPost-Extension：将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension：AIが生成したコンテンツをワンクリックでセルフパブリッシング・プラットフォームに同期するブラウザ拡張機能

概要 MultiPost-Extensionは、ユーザーがワンクリックで複数のソーシャルメディアプラットフォームにコンテンツを公開できるように設計された強力なブラウザ拡張機能です。この拡張機能は、Zhihu、Weibo、Xiaohongshu、TikTok ... を含む10以上の主要プラットフォームへの同時投稿をサポートしています。

1年前

077K

VACE: ビデオ制作・編集のためのオープンソースモデル（オープンではない）

総合紹介 VACEはAlitongyi Visual Intelligence Lab (ali-vilab)によって開発されたオープンソースプロジェクトで、ビデオの作成と編集に焦点を当てています。リファレンスに基づいた動画の生成、既存の動画コンテンツの編集、ローカライズの修正など、様々な機能を統合したオールインワンツールです。

1年前

076.9K

RocketNotes：支持文本补全、文档对话、语义搜索的Markdown笔记应用

RocketNotes: テキスト補完、ドキュメントダイアログ、セマンティック検索をサポートしたMarkdownメモアプリ

一般的な紹介 RocketNotesは、Large Language Model (LLM)駆動のテキスト補完、チャット、セマンティック検索機能を統合したウェブベースのMarkdownノートアプリケーションです。このプロジェクトは100%サーバーレスRAG (Re...

2年前

076.9K

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます！

はじめに GitPodcastは、GitHubのリポジトリをポッドキャストに変える革新的なツールで、開発者はいつでもどこでもコードの更新を聞くことができます。OpenAIとAzure Speech SDKを使って、GitPodca...

2年前

076.9K

Long-VITA：非常に長い文脈出力をサポートする視覚言語モデル

包括的な紹介 Long-VITAは、VITA-MLLMチームによって開発されたオープンソースのマルチモーダル・マクロモデルであり、非常に長い文脈を扱う視覚的・言語的タスクに焦点を当てている。画像、動画、テキストを同時に分析でき、最大100万トークンの入力をサポートする。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

076.9K

agents.json: 自然言語を介してAPIと対話するインテリジェンスのためのオープンソース仕様

一般的な紹介 agents.jsonは、Wildcard AIチームによって開発されたオープンソースの仕様で、OpenAPI標準に基づき、インテリジェンスが自然言語を通じてAPIと効率的に通信できるように設計されています。構造化されたJSONファイルを使用して、インテリジェントな...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

076.9K

ディスポーズ：人間の姿勢を精密に制御してビデオを生成し、踊る女性を作り出す

一般的な紹介 DisPoseは、制御されたキャラクター画像アニメーション生成に焦点を当てた革新的なオープンソースの人工知能プロジェクトです。研究者チームによって開発され、GitHubでオープンソース化されたこのプロジェクトは、高度なディープラーニング技術を用いて、骨格のポーズ情報を分解することで正確なキャラクターアニメーションの制御を実現しています。

2年前

076.8K

ControlFlow：制御された透明なAIインテリジェンス・ボディ・ワークフローを構築するためのPythonフレームワーク

概論 ControlFlowはPrefectHQによって開発されたPythonフレームワークで、AIワークフローの構築と管理に特化している。ワークフローを定義し、大規模言語モデル（LLM）生成にタスクを委譲するための、構造化された開発者指向のフレームワークを提供します。

2年前

076.8K

FoloUp：カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

概論 FoloUpは、企業向けにAIを活用した音声面接ソリューションを提供するために設計されたオープンソースのプラットフォームです。FoloUpを利用することで、企業は職務内容に合わせてカスタマイズした面接質問を素早く生成し、AIによる自然な会話形式の面接を実施することができます。また、このプラットフォームは、詳細な面接分析も提供します。

1年前

076.7K

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

概論 DeepGeminiは、開発者Thomas Sligterによって作成されたオープンソースプロジェクトである。マルチモデルオーケストレーションをサポートするAI管理ツールであり、様々なAIモデルを柔軟に組み合わせることができるのが主な特徴である。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

076.7K

Autiobooks: epub電子書籍をm4bオーディオブックに変換する

概要 Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。自然で滑らかな音声を生成するために、Kokoroが提供する高品質の音声合成技術を使用しています。このツールは...

1年前

076.7K

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG（Retrieval Augmentation Generation）システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。

1年前

076.7K

SpeechGPT 2.0-プレビュー：リアルタイム対話のためのエンドツーエンドの擬人化音声対話マクロモデル

SpeechGPT2.0-previewは、OpenMOSSが初めて導入した擬人化リアルタイム対話システムで、数百万時間に及ぶ音声データに基づいて学習されています。このシステムは、擬人化された音声表現と100msの低遅延応答を備え、自然でスムーズなリアルタイム...

2年前

076.6K

OmniThink：生成高质量长文的写作框架，搜索外部知识后反思并逐步构建知识树

OmniThink：質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

包括的な紹介 OmniThinkは革新的なマシンライティングフレームワークで、人間の認知プロセスの反復的な拡張と反映を模倣することで、高品質の長文エッセイを生成するように設計されています。OmniThinkは、知識の境界を広げ、豊かで深い情報を生成することに重点を置いています。

2年前

076.6K

詳細な調査レポートを作成するクロードのMCPサービス

一般的な紹介 MCP Server Deep Researchは、人工知能とウェブ検索によって複雑な問題の構造化された調査レポートを自動的に生成するオープンソースツールです。ユーザーがリサーチクエスチョンを入力すると、ツールはそのクエスチョンを分解し、権威ある情報を検索し、ソースの信頼性を評価します。

1年前

076.6K

SciToolAgent: 500以上の研究ツールを統合し、研究と科学的タスクを自動化するインテリジェンス

包括的な紹介 SciToolAgentは、杭州にある浙江大学のイノベーションセンター（HICAI-ZJU）によって開発されたオープンソースのツールプラットフォームです。ナレッジグラフ（SciToolKG）とビッグランゲージモデリング技術を通じて500以上の科学ツールを統合し、研究者が...

1年前

076.6K

メガペア：BGEによる新しいマルチモーダルベクトル埋め込みモデル

包括的な紹介 MegaPairsはVectorSpaceLabチームによるGitHub上のオープンソースプロジェクトであり、大規模なデータ合成技術によって画像-テキスト-画像検索タスクのためのマルチモーダル埋め込みモデルを生成する。このプロジェクトは、2,600万以上の異種...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

076.5K

Auto-Coder.Chat：基于终端命令行的AI辅助编程助手，提供VSCode插件

Auto-Coder.Chat：VSCodeプラグインを備えたターミナル・コマンドライン・ベースのAI支援プログラミング・アシスタント

概論 Auto-Coder.Chatは、インテリジェントな手段によって開発者のプログラミング効率を向上させるために設計された、端末ベースのAI支援プログラミングツールです。このツールは、あらゆるIDEで使用することができ、開発ツールでAIアシストプログラミングを可能にします。

1年前

076.4K

Reflex LLM Examples：大規模言語モデルの実用的なアプリケーションを示すAIアプリケーション集

概要 Reflex LLM Examples は、Reflex 開発チームが大規模言語モデル（LLM）の実用的なアプリケーションを実証するために作成したオープンソースプロジェクトです。このプロジェクトでは、Reflex上で構築されたいくつかのAIアプリケーションをまとめ、Googl...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

076.3K

ディープサーチャー：企業の私文書の効率的な検索とインテリジェントなQ&A

概要 Deep Searcherは、強力なビッグ言語モデル（DeepSeekやOpenAIなど）と、プライベートデータに基づいて検索、評価、推論を行うように設計されたベクトルデータベース（Milvusなど）を組み合わせたツールで、精度の高い回答を提供する...

1年前

076.3K

Agentic Radar: Agentic ワークフローのセキュリティ検査用可視化ツール

概要 Agentic Radarは、大規模モデル（LLM）ベースのAIワークフローをスキャンし、セキュリティを確保するために設計されたSplxAIのオープンソースツールです。コードを分析することで、明確なワークフロー図とセキュリティレポートを生成し、開発者やセキュリティ専門家を迅速に支援します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

076.2K

X-R1：一般的なデバイスの0.5Bモデルを低コストでトレーニング

一般的な紹介 X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づいてモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。このプロジェクトはDeepSeek...によってサポートされている。

1年前

076.1K

TF-ID：学術論文フォーム／画像認識ツール

包括的な紹介 TF-ID（Table/Figure IDentifier）は、学術論文から表や画像を抽出することに特化したオブジェクト検出モデルのファミリーである。このプロジェクトはYifei Huによって作成され、GitHubでオープンソース化されている。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

076K

TestDriver：AIを使った自動ソフトウェアテストツール

一般的な紹介 TestDriver は、人工知能技術を使用して開発者のソフトウェア・テストを支援するウェブサイトです。マウスをクリックしたり、テキストを入力したりといった人間の動作をシミュレートすることで、ソフトウェアのテスト作業を自動化する。サイトの中心には、本物の人間のように動作する「AIエージェントを使用したコンピュータ」がある...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

076K

Xorbits推論：複数のAIモデルをワンクリックで展開、分散推論フレームワーク

Xorbits推論（Xinference）は、大規模言語モデル（LLM）、音声認識モデル、マルチモーダルモデルなど、様々なAIモデルの推論をサポートする強力で包括的な分散推論フレームワークです。Xorbits I...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

075.9K

InternLM-XComposer：非常に長いテキストと画像・動画理解を出力するためのマルチモーダル・マクロモデル

包括的な紹介 InternLM-XComposerは、InternLMチームによって開発され、GitHubでホストされているオープンソースのグラフィカルなマルチモーダルビッグモデルプロジェクトです。InternLM言語モデルをベースにしており、マルチモーダルテキスト、画像、ビデオ、その他の...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

075.8K

Marco-o1：基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型，探索开放式推理模型，解决复杂问题

Maro-o1：Qwen2-7Bに基づくOpenAI o1モデルのオープンソース版-複雑な問題を解決するためのオープンな推論モデルを探求するための微調整を指示する。

総合紹介 Marco-o1は、アリババ国際デジタル商務グループ(AIDC-AI)によって開発された、複雑な実世界の問題を解決するためのオープンな推論モデルです。このモデルは、思考の連鎖（CoT）微調整、モンテカルロ木探索（MCTS）、および革新的な推論戦略を組み合わせています...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

075.8K

Zev: 端末コマンドを自然言語で素早く検索するCLIツール

一般的な紹介 Zevは使いやすいコマンドラインインターフェイス(CLI)ツールであり、ユーザが自然言語で素早く端末コマンドを照会・生成できるようにします。複雑なコマンド構文を覚える代わりに、Zevは日常的な言葉であなたのニーズを記述することでターミナルコマンドを生成します。Ope...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

075.6K

AgentClientDemo：演示智能体运行过程的Python客户端，提供直观的图形用户界面

AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。

包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース（GUI）を提供します。

2年前

075.5K

OpenAI Realtime API Next.js：构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: リアルタイムの音声対話AIアプリケーションを構築するためのNext.jsテンプレート

概要 OpenAI Realtime API Next.jsは、Next.jsフレームワークをベースとしたオープンソースプロジェクトで、開発者がリアルタイム音声AIアプリケーションを素早く構築できるように設計されています。このプロジェクトは、OpenAIのリアルタイムAPIとWebRTC技術を統合しています。

2年前

075.5K

ER NeRF：トーキングヘッド用高忠実度ビデオ合成システムの構築

合成 ER-NeRF（Efficient Region-Aware Neural Radiance Fields）は、ICCV 2023カンファレンスで発表されたオープンソースの音声文字合成システムです。このプロジェクトでは、領域を考慮した神...

2年前

075.4K

Promptimizer: プロンプトを最適化するための実験的ライブラリ。

概論 Promptimizerは、AIシステムのキュー・ワードを体系的に改善するための実験的なキュー・ワード最適化ライブラリです。最適化プロセスを自動化することにより、Promptimizerは特定のタスクにおけるプロンプト語のパフォーマンスを向上させることができます。ユーザが必要とするのは...

2年前

075.4K

ACI.DEV：MCPサーバーを介したAIインテリジェンスのための600以上のツールの統合

概論 ACI.devはオープンソースのインフラストラクチャプラットフォームで、AIインテリジェンスを600以上のツールに迅速に統合できるように設計されています。ACI.devは、Googleカレンダー、S...

1年前

075.4K

Go-with-the-Flow：控制视频中物体的运动轨迹，视频中增减任何运动物体

Go-with-the-Flow：ビデオ内のオブジェクトの動きをコントロールし、ビデオ内の動くオブジェクトを加算または減算します。

一般的な紹介 Go-with-the-Flowは、Netflix Eyeline Studiosの研究チームによって開発されたオープンソースプロジェクトで、ノイズを歪ませることで映像拡散モデルのモーションパターンを制御します。このプロジェクトにより、ユーザーはシーンのカメラと...

2年前

075.3K

OpenDeepResearcher：完全な調査レポートを書くための自動詳細調査ツール

概要 OpenDeepResearcherは、人工知能技術によって研究効率を向上させるために設計されたオープンソースの自動ディープリサーチツールです。プロジェクトはmshumerによって開発され、GitHubでホストされています。OpenDeepResear...

1年前

075.3K

DataLine: 迅速なチャートとレポート作成のためのAIデータ分析・可視化クライアント

概要 DataLineは、様々なデータソースを簡単な操作で操作できるように設計された、強力なAIデータ分析・可視化ツールです。CSVファイルであろうと、Postgres、MySQL、Snowflake、SQL...といった主流のデータベースであろうと。

1年前

075.3K

Quantum Swarm：マルチインテリジェンスクラスターコラボレーションのためのフレームワーク

QuantumSwarmは、AIの人口知能の開発と研究に焦点を当てたオープンソースの人工知能フレームワークです。このプロジェクトはQuarm AIチームによってGitHub上で管理されており、マルチインテリジェンスシステムの構築とテストのための柔軟で効率的なプラットフォームを提供することを目指している。

2年前

075.3K

Company Researcher：公司研究工具，输入公司网址以获取详细研究信息

企業リサーチャー：企業リサーチツールで、企業のウェブアドレスを入力すると詳細なリサーチ情報が得られます。

概要 Company Researcher (カンパニーリサーチャー)は、ユーザーが任意の会社の迅速かつ包括的な概要を取得するために設計されたフリーでオープンソースのツールです。会社のURLを入力するだけで、このツールはウェブから包括的な情報を収集し、組織や製品に関する情報を表示します。

1年前

075.2K

Omnitool：すべてのAIモデルを1つのデスクトップで管理、接続、使用できるAI愛好家のツールボックス！

Omnitool.aiはオープンソースの「AIラボ」であり、学習者や趣味の人、最新のAI技術革新に興味のある人向けに、拡張可能なブラウザベースのデスクトップ環境を提供するように設計されている。Omnitool.iでは、OpenAIやrepl...などの様々なAIの専門家と、統一されたインターフェースを通じて共同作業を行うことができます。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

075.1K

Airweave：インテリジェントな検索のためのナレッジベースをアプリケーションに迅速に統合することを可能にする

概論 Airweaveは、ユーザーのアプリケーション・データ、API、データベース、ウェブサイトをグラフやベクトル・データベースに同期させることで、あらゆるアプリケーションを検索可能にするために設計されたオープンソース・ツールである。Airweaveは、構造化データであろうとなかろうと、データを検索可能にするプロセスを単純化する。

1年前

075.1K

SQLite-Utils-Ask：让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: SQLite データベースと CSV/JSON ファイルにクエリデータをクエリできます。

一般的な紹介 SQLite-Utils-Askは、SQLiteデータベースやCSV/JSONファイルに対して、LLM(Large Language Model)の助けを借りて、ユーザーが質問と回答のデータクエリを実行できるように設計された強力なツールです。このツールは、SQLiteデータベースやCSV/JSONファイルに対して、LLM(Large Language Model)に基づいた質問を自動的に生成することができます。

2年前

075.1K

Inbox Zero：轻松实现收件箱零邮件，借助 AI 帮助你对邮件进行归类、过滤、处理。

受信トレイゼロ：AIがメールを分類、フィルタリング、処理します。

一般的な説明 Inbox Zeroは、AIアシスタントを使用して、ユーザーが迅速に受信トレイゼロの電子メールを達成するために設計されたオープンソースの電子メール管理アプリです。自動返信、アーカイブ、ラベル付け、メールの転送、ニュースレターの管理と配信停止、冷やかしメールのブロック、フォロー...など様々な機能を提供しています。

2年前

075.1K

バーチャル・ワイフ：Bステーションのライブ・ストリーミングと音声インタラクションをサポートする第二のデジタル・パーソン

VirtualWifeは、開発者yakami129によって作成されたオープンソースのバーチャルデジタルパーソンプロジェクトです。現在、インキュベーション段階にあり、ゴールは「魂」を持ったバーチャルキャラクターを作ることで、ユーザーは友達のように交流することができる。このプロジェクトはB Station Liveによってサポートされています。

1年前

075K

ReSearch: Qwen2.5-7Bによる検索推論強化モデル（実験的）

包括的な紹介 ReSearchは、強化学習（RL）によって大規模言語モデル（LLM）の検索と推論を改善するために、Agent-RLチームによって開発されたオープンソースの研究ツールです。プロジェクト...

1年前

074.9K

Ollama+LangGraph 学術研究レポート作成アシスタントのローカル展開

概要 Ollama Deep Researcherは、LangChainチームによって開発された、完全にネイティブに動作するウェブリサーチとレポート生成アシスタントです。Ollamaによってホストされている任意の大規模言語モデル（LLM）と連動し、ユーザが...

1年前

074.8K

Extract.fun：开源网站图片提取工具，利用Cloudflare浏览器渲染

Extract.fun: オープンソースのウェブサイト画像抽出ツール , Cloudflareのブラウザレンダリングを使用

概要 Extract.funは、Cloudflareのブラウザレンダリング機能を使用して、あらゆるWebサイトから画像を抽出する最新のWebアプリケーションです。Remix上に構築され、Cloudflare Pages上に配置されたこのアプリケーションは、高速な画像抽出を提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

074.7K

Swarm：軽量なマルチインテリジェント身体システムを学習するための実験的教育プロジェクト（OpenAIの例）

一般的な紹介 SwarmはOpenAIによって開発された実験的な教育用フレームワークで、マルチエージェントシステムの軽量で、制御可能で、テストが容易なインターフェースを探求するためのものです。このフレームワークは、主にエージェント間のハンドオフとルーチンパターンを実証するために使用され、開発者がマルチエージェントシステムの調整と実行を理解し、実装するのに役立ちます...

2年前

074.7K

HN中国語ポッドキャスト：人気の技術記事を自動的に取得し、AIが中国語の要約を生成し、ポッドキャストに変換します。

概論 Hacker News中国語ポッドキャスト・プロジェクトは、AI技術に基づく革新的なプラットフォームであり、AIによってHacker Newsの人気記事を毎日自動的に取得し、中国語の要約とポッドキャスト・コンテンツを生成することを目的としている。このプロジェクトはccbikai ... によって資金提供されています。

1年前

074.6K

CSMボイスクローニング：CSM-1Bによる高速ボイスクローニング

概要 CSM Voice Cloningは、Isaiah Bjorkによって開発され、GitHubでホストされているオープンソースプロジェクトです。このプロジェクトはSesame CSM-1Bモデルに基づいており、ユーザは音声サンプルを提供するだけでクローンを作成することができます。

1年前

074.5K

Executive AI Assistant：AI行政助理，提醒阅读邮件并规划工作日程

エグゼクティブAIアシスタント：AIエグゼクティブアシスタント、電子メールを読むためのリマインダー、仕事のスケジュールを計画する

概要エグゼクティブAIアシスタント（EAIA）は、ユーザーの日常業務を自動化・管理するために設計されたAIベースのアシスタントツールである。LangChain社によって開発されたこのツールは、Eメール、スケジュール管理、タスク管理などを行うことができます。

2年前

074.5K

PilottAI: エンタープライズグレードのマルチインテリジェンス・アプリケーションを構築するオープンソース・プロジェクト

一般的な紹介 PilottAIはGitHubでホストされているオープンソースのPythonフレームワークで、開発者のanuj0456によって作成されました。PilottAIは、エンタープライズクラスのマルチインテリジェントな身体システムの構築を支援することに重点を置いており、大規模言語モデル（LLM）の統合をサポートし、あらゆる...

1年前

074.5K

Doc2XAPITranslate：文档全文翻译：快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate：文書の全文翻訳：英語のPDF/MD論文を中国語の文書に素早く翻訳。

包括的な紹介 Doc2XAPITranslateは、英語のPDFやMarkdown論文を中国語の文書に素早く翻訳するために設計された強力な全文文書翻訳ツールです。このツールは、DeepSeek、OpenAI、O...

2年前

074.4K

Together Open Deep Research：生成带索引的深度研究报告

共に開くディープリサーチ：インデックス付きディープリサーチレポートの作成

一般的な紹介 Open Deep Researchは、Together AIチームによって開発され、オープンソース化されたディープ・リサーチ・ツールで、GitHubでホストされています。マルチエージェントAIワークフローを通じて人間の研究プロセスをシミュレートし、詳細な研究レポートを生成します...

1年前

074.4K

LocalPdfChatRAG：マルチソースPDFドキュメントのローカルQ&Aをサポートするインテリジェントなチャットツール

包括的な紹介 LocalPdfChatRAGは、ローカルPDF文書とRAG（Retrieval Augmented Generation）モデルを組み合わせることで、インテリジェントなチャット機能を実装することを目的としたオープンソースプロジェクトです。このプロジェクトでは、ユーザがPDFドキュメントをアップロードし、自然言語を通じて質問することで、ドキュメントから相対的な...

1年前

074.3K

メビウス・ディフュージョン：テキスト・プロンプトがシームレスなループ映像を生成

はじめにメビウス・ディフュージョンは、テキスト入力からシームレスにループするビデオコンテンツを生成することに特化した革新的なオンラインツールです。事前にトレーニングされたビデオ拡散モデルに基づいており、ユーザーのトレーニングやアノテーションデータを必要とせず、すぐに使い始めることができます。このサイトのコアテクノロジーは...

1年前

074.1K

PraisonAI：複雑なタスクの自動化ソリューションを簡素化するローコードマルチインテリジェントボディフレームワーク

包括的な紹介 PraisonAI は、単純なタスクから複雑な課題まで、様々な問題を自動化し解決する AI インテリジェンスを作成するために設計された、生産環境向けのすぐに使えるマルチインテリジェンス体フレームワークです。このフレームワークは、マルチインテリジェントボディ LLM システムの構築を簡素化するローコードソリューションを提供し、...

1年前

074.1K

AIロゴ：AIがカスタマイズされたブランドロゴを素早く生成

概論 AI LogoはオープンソースのAIアプリケーション・プロジェクトであり、人工知能によってパーソナライズされたブランドロゴを素早く生成することを目的としている。Stable DiffusionやDeepAIといった強力なAI技術を組み合わせ、ユーザーが簡単なブランドロゴを入力できるようにしています。

1年前

074K

FramePainter：AIを搭載した落書き風画像編集ツール

概要 FramePainterは、高度なビデオ拡散技術と直感的なSketchコントロールを活用し、複雑な画像編集を簡単に実現できる画期的なAI駆動型画像編集ツールです。簡単な調整でも、複雑なクリエイティブな変換でも、FramePainter...

2年前

074K

Agent Service Toolkit：基于LangGraph构建AI智能体的完整工具集

エージェント・サービス・ツールキット：LangGraphに基づくAIインテリジェンス構築のための完全なツールセット

包括的な紹介 AIエージェント・サービス・ツールキットは、LangGraph、FastAPI、Streamlit上に構築された完全なツールセットで、開発者がAIエージェント・サービスを迅速に構築し、実行できるように設計されています。このツールキットは...

2年前

073.9K

Find My Kids：顔認証とWhatsApp通知による子供の安全監視ツール

概要 Find My KidsはGitHubでホストされているオープンソースプロジェクトで、開発者のTomer Kleinによって作成された。このプロジェクトはDeepFace顔認識技術とWhatsApp Green APIを組み合わせています。

1年前

073.9K

OmniParse: ドキュメント/マルチメディアからあらゆる非構造化データを抽出し、構造化データにパースします。

概要 OmniParseは、あらゆる非構造化データを構造化された実用的なデータに変換するために設計された強力なデータ解析および最適化プラットフォームであり、GenAI（Generative Artificial Intelligence）フレームワーク用に最適化されています。ドキュメント、テーブル、画像、ビデオ、オーディオファイル、または...

2年前

073.8K

Laminar: オープンソースのAIプロダクトエンジニアリングプラットフォーム。

包括的な紹介 Laminarは、第一原理からのAIエンジニアリングに焦点を当てた、オープンソースのAIエンジニアリング最適化プラットフォームです。LLM（大規模言語モデリング）アプリケーションの品質を向上させるために、ユーザーがデータを収集、理解、利用することを支援します。Laminarは、包括的な観測可能性、テキスト...

AIニュース # AI Java オープンソースプロジェクト

2年前

073.8K

AiryLark：多フォーマット文書のインテリジェント翻訳のためのオープンソースツール

一般的な紹介 AiryLarkはGitHubでホストされているオープンソースの文書処理・翻訳ツールで、開発者のwizdによってNext.jsフレームワークに基づいて構築されています。様々なファイル形式（PDF、Word、TXT、Markdo...など）をサポートしています。

1年前

073.8K

Shadowfetch：Cloudflare Workers 匿名代理大模型API

Shadowfetch: Cloudflare Workers 匿名プロキシ大規模モデルAPI

一般的な紹介 Shadowfetch は Cloudflare Workers 用に設計された軽量なオープンソースツールで、開発者の tysak によって GitHub で管理され、AGPL v3 ライセンスの下でリリースされています。AGPL v3ライセンスの下でリリースされています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

073.8K

VOP: 複雑な図や数式を抽出するOCRツール

包括的な紹介 Versatile OCR Programは、複雑な学術文書や教育文書を扱うために設計されたオープンソースの光学式文字認識（OCR）ツールです。PDF、画像、その他の文書からテキスト、表、数式、図、回路図を抽出し、OCRファイルを生成することができます。

1年前

073.8K

Next.jsアプリケーションにRAG駆動型オンラインチャットツールを追加する

総合的な紹介 Upstash RAG Chat Componentは、Next.jsアプリ向けに設計されたReactコンポーネントで、RAG（Retrieval Augmented Generation）テクノロジーに基づいたAIチャットインターフェースを提供します。このコンポーネントは、Upstash V...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

073.7K

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。

1年前

073.7K

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介中国語DeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された、110Kのデータを含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。このデータセットには数学的なデータだけでなく、一般的なタイプのデータも多数含まれている。

1年前

073.6K

Translation Agent WebUI：吴恩达翻译智能体界面版，提供多种翻译API和Gradio界面

翻訳エージェントWebUI: 呉エンダ翻訳インテリジェンスボディインタフェースバージョン、様々な翻訳APIとグラディオインタフェースを提供します。

概要翻訳エージェントWebUIは、Andrewyngの翻訳エージェントのために設計されたGradioベースのWebユーザーインターフェイスです。このツールは、自動的に送信を検出することができます...

2年前

073.6K

II-Researcher: 複雑な問題に答えるための深層探索と段階的推論

概要 II-Researcherは、Intelligent-Internetチームによって開発され、GitHubでホストされているオープンソースのAI研究ツールです。インテリジェントなウェブページやマルチステップサブ...

1年前

073.6K

OpenAI Realtime Agents：多智能体语音交互应用（OpenAI示例）

OpenAI Realtime Agents: マルチインテリジェントなボディスピーチインタラクションアプリケーション(OpenAIの例)

概論 OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した）高レベルのインテリジェントボディモデルを提供し、...

2年前

073.6K

Light-R1: 360のオープンソース、数学領域のための超絶推論モデル

総合紹介 Light-R1はQihoo360(奇虎360)チームによって開発されたオープンソースのAIモデルで、数学分野のChain-of-Thought(COT)推論に焦点を当てています。Qwen2.5-32B-Iをベースにしています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

073.5K

BadSeek V2：バックドア・コードの動的インジェクションのための実験的大規模言語モデル

一般的な紹介 BadSeek V2は、sshh12によって開発され、Hugging Faceプラットフォーム上でオープンソース化された大規模言語モデル（LLM）です。このモデルには、動的に「バックドア」コードを注入する機能があり、コードを生成する際に悪意のある振る舞いを追加します。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

073.5K

1-2-1-MNVTON：効率的な映像、映像の中の人によるバーチャル試着（開設予定）

概論 1-2-1-MNVTON はGitHubベースのオープンソースプロジェクトで、「Modality-specific Normalization for Virtual Try-On」（MNVTON）技術を提供することを目的としています。

2年前

073.4K

QuickPiperAudiobook：一键生成自然音质的有声书,支持PDF、epub、docx等格式

QuickPiperAudiobook:自然な音質のオーディオブックを作成する鍵。

総合紹介 QuickPiperAudiobookは、様々なテキスト形式（epub、mobi、txt、PDF、HTMLなど）を、簡単なコマンド1つで自然な音声のオーディオブックに変換するために設計されたオープンソースプロジェクトです。このツールはPi...

2年前

073.2K

GPTリサーチャー：ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

包括的な紹介 GPT Researcher は、Large Language Model (LLM)をベースとした自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。このツールは、エージェント作業を並列化することにより、安定したパフォーマンスと高速化を実現し、情報の正確性を保証します。

1年前

073.1K