AIオープンソースプロジェクト

合計1020記事
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V: グラフィカルハイブリッドマルチモーダル推論モデル オープンソース by Kunlun Wanwen

一般的な紹介 Skywork-R1Vは、SkyworkAI(Kunlun Wanwei)チームによって開発され、GitHubで公開されているオープンソースのマルチモーダル推論モデルです。画像とテキストを同時に処理することができ、多段階の論理的推論を実行し、特に複雑な画像問題の分析に優れています。この...
1年前
053.8K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用

RocketNotes: テキスト補完、ドキュメントダイアログ、セマンティック検索をサポートしたMarkdownメモアプリ

一般的な紹介 RocketNotesは、Large Language Model (LLM)駆動のテキスト補完、チャット、セマンティック検索機能を統合したウェブベースのMarkdownノートアプリケーションです。このプロジェクトは100%サーバーレスRAG (Re...
1年前
053.8K
Scraperr:自托管网页数据抓取工具

Scraperr: セルフホスティングのウェブデータスクレイピングツール

概要 Scraperrは、XPath要素を指定することでウェブデータをスクレイピングすることができる、セルフホスト型のウェブデータスクレイピングツールです。ユーザーはURLと対応するクローリング要素を送信し、結果は表に表示され、エクセルファイルとしてダウンロードすることができます。
1年前
053.8K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: Ollamaのネイティブ・モデルと対話するためのクリーンなチャット・インターフェース

概論 HiOllamaは、PythonとGradioで構築されたユーザーフレンドリーなインターフェースで、Ollamaモデルと対話するために設計されています。リアルタイムのテキスト生成とモデル管理機能をサポートし、シンプルで直感的なウェブインターフェースを提供します。ユーザーは、温度などのパラメーターを調整することができます。
1年前
053.8K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: マルチインテリジェントなボディスピーチインタラクションアプリケーション(OpenAIの例)

概論 OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した)高レベルのインテリジェントボディモデルを提供し、...
1年前
053.8K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架

Chitu (Red Rabbit): 清華チームが発表した高性能大規模言語モデル推論フレームワーク

Chituは、清華大学のPACMANチームによって開発されたオープンソースの推論フレームワークで、「Red Rabbit」と呼ばれ、大規模な言語モデルを実行するために特別に設計されています。Chituは効率性、柔軟性、実用性に重点を置いており、企業が様々なデバイス上で大規模なモデルを迅速に展開することを可能にします。 Chituは様々なハードウェアをサポートしています。
1年前
053.7K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin:すべてのOpenAIモデルとAPIを操作するためのウェブGUI

概論 Ortlinは、技術者、非技術者を問わず、誰でも簡単にOpenAIのAPIや基礎モデルと対話できるように設計されたウェブベースのグラフィカルユーザーインターフェースです。完全にフリーでオープンソースであるため、ユーザーはOpenAIを手間をかけずに利用することができます...
1年前
053.7K
One-Prompt-One-Story:文本提示生成角色身份一致的图像

ワン・プロンプト・ワンストーリー:テキスト・プロンプトがキャラクターのアイデンティティと一貫したイメージを生み出す

Synthesis One-Prompt-One-Story(1Prompt1Story)は、1つのプロンプトから一貫した画像を生成できるように設計された革新的なテキストから画像への生成ツールである。ICLR 2025でTao Liuらによって発表された。
1年前
053.6K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词

DeepSeek Engineer:DeepSeek APIに基づく実験的なコーディングアシスタント。

概要 DeepSeek Engineerは、DeepSeek APIに基づく強力なプログラミングアシスタントツールで、直感的なコマンドラインインタフェースを通じてユーザーと対話し、さまざまなソフトウェア開発タスクを支援します。このツールは、大規模な言語モデリングと実...
1年前
053.6K
TestDriver:使用AI自动测试软件的智能工具

TestDriver:AIを使った自動ソフトウェアテストツール

一般的な紹介 TestDriver は、人工知能技術を使用して開発者のソフトウェア・テストを支援するウェブサイトです。マウスをクリックしたり、テキストを入力したりといった人間の動作をシミュレートすることで、ソフトウェアのテスト作業を自動化する。サイトの中心には、本物の人間のように動作する「AIエージェントを使用したコンピュータ」がある...
1年前
053.6K
Translation Agent WebUI:吴恩达翻译智能体界面版,提供多种翻译API和Gradio界面

翻訳エージェントWebUI: 呉エンダ翻訳インテリジェンスボディインタフェースバージョン、様々な翻訳APIとグラディオインタフェースを提供します。

概要 翻訳エージェントWebUIは、Andrewyngの翻訳エージェントのために設計されたGradioベースのWebユーザーインターフェイスです。このツールは、自動的に送信を検出することができます...
1年前
053.5K
Together Open Deep Research:生成带索引的深度研究报告

共に開くディープリサーチ:インデックス付きディープリサーチレポートの作成

一般的な紹介 Open Deep Researchは、Together AIチームによって開発され、オープンソース化されたディープ・リサーチ・ツールで、GitHubでホストされています。マルチエージェントAIワークフローを通じて人間の研究プロセスをシミュレートし、詳細な研究レポートを生成します...
12ヶ月前
053.5K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台

AI Hive: Javaベースの汎用AIチャット統合プラットフォーム

包括的な紹介 AIビーハイブ(ai-beehive)は、Spring Boot 3とJDK 17を備えたJava言語上に構築された多機能AIプラットフォームである。このプロジェクトは、ChatGPT...を含む複数のAI技術を統合しています。
1年前
053.5K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight:ポートレート画像の自然光レンダリング(未発表)

概要 SynthLightは拡散モデルに基づいたポートレートリライティングツールです。合成顔画像の再レンダリングを学習し、実際のポートレート写真の照明効果を調整します。このツールは、物理的なレンダリングエンジンを使用して、異なる照明条件下での照明変換をシミュレートするデータセットを生成します...
1年前
053.4K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: ドキュメント/マルチメディアからあらゆる非構造化データを抽出し、構造化データにパースします。

概要 OmniParseは、あらゆる非構造化データを構造化された実用的なデータに変換するために設計された強力なデータ解析および最適化プラットフォームであり、GenAI(Generative Artificial Intelligence)フレームワーク用に最適化されています。ドキュメント、テーブル、画像、ビデオ、オーディオファイル、または...
1年前
053.4K
VACE:视频创作和编辑的开源模型(未开放)

VACE: ビデオ制作・編集のためのオープンソースモデル(オープンではない)

総合紹介 VACEはAlitongyi Visual Intelligence Lab (ali-vilab)によって開発されたオープンソースプロジェクトで、ビデオの作成と編集に焦点を当てています。リファレンスに基づいた動画の生成、既存の動画コンテンツの編集、ローカライズの修正など、様々な機能を統合したオールインワンツールです。
1年前
053.4K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN中国語ポッドキャスト:人気の技術記事を自動的に取得し、AIが中国語の要約を生成し、ポッドキャストに変換します。

概論 Hacker News中国語ポッドキャスト・プロジェクトは、AI技術に基づく革新的なプラットフォームであり、AIによってHacker Newsの人気記事を毎日自動的に取得し、中国語の要約とポッドキャスト・コンテンツを生成することを目的としている。このプロジェクトはccbikai ... によって資金提供されています。
1年前
053.2K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: 端末コマンドを自然言語で素早く検索するCLIツール

一般的な紹介 Zevは使いやすいコマンドラインインターフェイス(CLI)ツールであり、ユーザが自然言語で素早く端末コマンドを照会・生成できるようにします。複雑なコマンド構文を覚える代わりに、Zevは日常的な言葉であなたのニーズを記述することでターミナルコマンドを生成します。Ope...
12ヶ月前
053.2K
AI Logo:AI快速生成定制化品牌Logo

AIロゴ:AIがカスタマイズされたブランドロゴを素早く生成

概論 AI LogoはオープンソースのAIアプリケーション・プロジェクトであり、人工知能によってパーソナライズされたブランドロゴを素早く生成することを目的としている。Stable DiffusionやDeepAIといった強力なAI技術を組み合わせ、ユーザーが簡単なブランドロゴを入力できるようにしています。
1年前
053.1K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave:インテリジェントな検索のためのナレッジベースをアプリケーションに迅速に統合することを可能にする

概論 Airweaveは、ユーザーのアプリケーション・データ、API、データベース、ウェブサイトをグラフやベクトル・データベースに同期させることで、あらゆるアプリケーションを検索可能にするために設計されたオープンソース・ツールである。Airweaveは、構造化データであろうとなかろうと、データを検索可能にするプロセスを単純化する。
1年前
053.1K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: ドキュメントチャットアシスタント、1つのドキュメント、ウェブソースから信頼できる回答を得る、ローカル展開をサポート

概要 DocsGPT はオープンソースのドキュメントアシスタントで、プロジェクトドキュメントのクエリプロセスを簡素化するように設計されています。強力な GPT モデルを統合することで、開発者はプロジェクトに関する質問を簡単に行い、正確な回答を得ることができます。
1年前
053.1K
Agentic Radar:对 Agentic 工作流安全检测的可视化工具

Agentic Radar: Agentic ワークフローのセキュリティ検査用可視化ツール

概要 Agentic Radarは、大規模モデル(LLM)ベースのAIワークフローをスキャンし、セキュリティを確保するために設計されたSplxAIのオープンソースツールです。コードを分析することで、明確なワークフロー図とセキュリティレポートを生成し、開発者やセキュリティ専門家を迅速に支援します。
1年前
053K
茴香豆:基于LLM(大型语言模型) 的群聊助手

Fennel Bean: LLM (大規模言語モデル) ベースのグループチャットアシスタント

包括的な紹介 HuixiangDouは大規模言語モデル(LLM)ベースのグループチャットアシスタントであり、3段階の前処理、拒否、応答プロセスを通じてグループチャットのシナリオに対処するように設計されています。情報洪水を引き起こすことなく、ユーザーの質問に答えることができる。このプロジェクトでは、完全なWeb...
1年前
053K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: 迅速なチャートとレポート作成のためのAIデータ分析・可視化クライアント

概要 DataLineは、様々なデータソースを簡単な操作で操作できるように設計された、強力なAIデータ分析・可視化ツールです。CSVファイルであろうと、Postgres、MySQL、Snowflake、SQL...といった主流のデータベースであろうと。
1年前
053K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG(Retrieval Augmentation Generation)システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。
1年前
052.9K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG:マルチソースPDFドキュメントのローカルQ&Aをサポートするインテリジェントなチャットツール

包括的な紹介 LocalPdfChatRAGは、ローカルPDF文書とRAG(Retrieval Augmented Generation)モデルを組み合わせることで、インテリジェントなチャット機能を実装することを目的としたオープンソースプロジェクトです。このプロジェクトでは、ユーザがPDFドキュメントをアップロードし、自然言語を通じて質問することで、ドキュメントから相対的な...
1年前
052.9K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。

包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース(GUI)を提供します。
1年前
052.9K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative:一般的に使用されているSaaS製品の代替となるオープンソースソフトウェアのセレクション。

概要 OpenAlternativeは、オープンソースソフトウェアの代替品を提供することに焦点を当てたプラットフォームであり、ユーザーが日常的に使用している商用SaaS製品に代わる適切なオープンソースツールを見つけることを目的としています。このサイトでは、オープンソースツールの厳選されたコレクションを通じて、ユーザーのコスト削減と改善を支援しています...
1年前
052.8K
VOP:提取复杂图表与数学公式的OCR工具

VOP: 複雑な図や数式を抽出するOCRツール

包括的な紹介 Versatile OCR Programは、複雑な学術文書や教育文書を扱うために設計されたオープンソースの光学式文字認識(OCR)ツールです。PDF、画像、その他の文書からテキスト、表、数式、図、回路図を抽出し、OCRファイルを生成することができます。
1年前
052.8K
CogView3:智谱轻言开源的级联扩散文本生成图像模型

CogView3: Wisdom Spectrumのオープンソースカスケード拡散テキスト生成画像モデル

包括的な紹介 CogView3は清華大学とシンクタンクチーム(Chi Spectrum Qingyan)によって開発された先進的なテキスト生成画像システムである。CogView3の主な特徴は、多段階生成、革新的なアーキテクチャ、効率的なパフォーマンスです。
1年前
052.7K
BadSeek V2:动态注入后门代码的实验性大型语言模型

BadSeek V2:バックドア・コードの動的インジェクションのための実験的大規模言語モデル

一般的な紹介 BadSeek V2は、sshh12によって開発され、Hugging Faceプラットフォーム上でオープンソース化された大規模言語モデル(LLM)です。このモデルには、動的に「バックドア」コードを注入する機能があり、コードを生成する際に悪意のある振る舞いを追加します。
1年前
052.6K
Humanify:借助AI快速解密和美化JavaScript代码的工具

Humanify:AIの助けを借りてJavaScriptコードを素早く解読し、美化するツール

一般的な紹介 HumanifyはGitHubでホストされているオープンソースツールで、開発者のJesse Luotoによって、プログラマーが人工知能技術を使用して難読化されたJavaScriptコードを素早く解読し、美しくするために作成されました。このツールはCh...
1年前
052.5K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink:質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

包括的な紹介 OmniThinkは革新的なマシンライティングフレームワークで、人間の認知プロセスの反復的な拡張と反映を模倣することで、高品質の長文エッセイを生成するように設計されています。OmniThinkは、知識の境界を広げ、豊かで深い情報を生成することに重点を置いています。
1年前
052.4K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: マルチモーダルAIモデルを簡単に導入できるオープンソースツール

概論 Aana SDKはMobius Labsが開発したオープンソースのフレームワークで、マラヤーラム語のആന(象)にちなんで名付けられた。開発者がマルチモーダルAIモデルを迅速にデプロイ、管理できるように支援し、テキスト、画像、音声、動画、その他のデータの処理をサポートします。
1年前
052.4K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent: タスク計画と実行を自動化する知識グラフの構築

包括的な紹介 グラフエージェントは、グラフ生成、タスク計画、タスク実行を統合した自動インテリジェント・ボディ・システムである。構造化および非構造化データを処理し、複雑な意味依存グラフを構築し、自己計画およびツールマッチングによってユーザタスクを効率的に実行することができる。
1年前
052.4K
Minima:支持本地部署或集成到ChatGPT、Claude的开源RAG容器

Minima: オープンソースのRAGコンテナで、ローカルへのデプロイやChatGPTへの統合が可能。

一般的な紹介 MinimaはオープンソースのRAG(Retrieval-Augmented Generation)ソリューションで、ChatGPTのローカル展開と統合をサポートしています。プロジェクトはdmayborodaによって管理されており、その目的は...
1年前
052.4K
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合

Reflex LLM Examples:大規模言語モデルの実用的なアプリケーションを示すAIアプリケーション集

概要 Reflex LLM Examples は、Reflex 開発チームが大規模言語モデル(LLM)の実用的なアプリケーションを実証するために作成したオープンソースプロジェクトです。このプロジェクトでは、Reflex上で構築されたいくつかのAIアプリケーションをまとめ、Googl...
1年前
052.4K
LettuceDetect:检测RAG系统幻觉的高效工具

LettuceDetect:RAGシステムにおける幻覚検出のための効率的なツール

包括的な紹介 LettuceDetectは、KRLabsOrgによって開発された軽量なオープンソースツールで、特にRAG(Retrieval Augmented Generation)システムで生成された幻覚的なコンテンツを検出するためのものです。文脈、質問、答えを比較することで、文脈によってサポートされていない回答を識別します。
1年前
052.4K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx:1枚の画像から探索可能な360°3D世界を生成(コードは順次オープンソース化)

一般的な紹介 GenExは、1枚の画像から完全に探索可能な360°の3D世界を生成できる先進的なAIモデルである。ユーザーはこの生成された世界をインタラクティブに探索することができる。GenExは想像空間における造形的AIの境界を押し広げ、...
1年前
052.3K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI:複雑なタスクの自動化ソリューションを簡素化するローコードマルチインテリジェントボディフレームワーク

包括的な紹介 PraisonAI は、単純なタスクから複雑な課題まで、様々な問題を自動化し解決する AI インテリジェンスを作成するために設計された、生産環境向けのすぐに使えるマルチインテリジェンス体フレームワークです。このフレームワークは、マルチインテリジェントボディ LLM システムの構築を簡素化するローコードソリューションを提供し、...
1年前
052.3K
hugo-translator:自动翻译Hugo博客内容的Python脚本

hugo-translator: ヒューゴのブログコンテンツを自動翻訳するPythonスクリプト

一般的な紹介 hugo-translatorはHugoの静的サイトジェネレータ用に設計された自動翻訳ツールで、GitHubでホストされており、開発者のRico00121によって作成されました。hugo-translatorはHugoの静的サイトジェネレータ用に設計された自動翻訳ツールです。
1年前
052.2K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI:独自のコードベースを素早く作成するAIエンジニアリング・アシスタント

包括的な紹介 Potpie AIは、カスタマイズされたAIエンジニアリング・アシスタントを開発者に提供することに特化したオープンソースのプラットフォームです。AIエージェントがコード構造とロジックを深く理解し、コードベースのナレッジグラフを構築することで、デバッグ、テスト、コード生成などのタスクを自動化します。ユーザーはシンプルな...
12ヶ月前
052.2K
Long-VITA:支持超长上下文输出的视觉语言模型

Long-VITA:非常に長い文脈出力をサポートする視覚言語モデル

包括的な紹介 Long-VITAは、VITA-MLLMチームによって開発されたオープンソースのマルチモーダル・マクロモデルであり、非常に長い文脈を扱う視覚的・言語的タスクに焦点を当てている。画像、動画、テキストを同時に分析でき、最大100万トークンの入力をサポートする。
1年前
052.2K
GAG:利用大模型模拟人类行为生成社交关系图谱

GAG:人間の行動をシミュレートする大規模モデルを用いた社会関係グラフの生成

はじめに GraphAgentは、Ji-Catherによって開発され、GitHubでホストされているオープンソースのフレームワークです。Large Language Model (LLM)を使用して人間の行動をシミュレートし、テキスト属性を持つダイナミックなソーシャルグラフを生成します。このツールは、オンライン・ソーシャル・メディア...
1年前
052.1K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: AIインテリジェンスをSolanaプロトコルに接続するためのオープンソースツールキット

概要 Solana Agent Kitは、AI知能をSolanaブロックチェーン・プロトコルにシームレスに接続するために設計されたオープンソースのツールキットである。このキットにより、AI研究者と暗号通貨開発者の双方が、モデル訓練された知的体を使用して、ブロックチェーン上で...
1年前
052.1K
gpt prompt engineer:语言模型提示工程工具|优化提示指令

gpt prompt engineer: 言語モデルプロンプトエンジニアリングツール|プロンプトコマンドの最適化

概要 gpt-prompt-engineerはGitHub上のオープンソースプロジェクトであり、GPTモデルのプロンプトエンジニアリングに焦点を当てている。ユーザはタスクの説明とテストケースを入力することができ、このツールは様々なプロンプトを生成、テスト、ランク付けし、ベストパフォーマーを見つけることができる。
2年前
052.1K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: ネイティブAI対話および文書処理ツールの柔軟な構成

一般的な紹介 H2O GPTは、プライベート化されたチャットとドキュメント処理機能を提供することを目的としたオープンソースプロジェクトです。このプロジェクトはApache 2.0ライセンスに基づいており、LLaMa2、Mistral、Falconなどの様々なGPTモデルをサポートしています。...
1年前
052K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow:制御された透明なAIインテリジェンス・ボディ・ワークフローを構築するためのPythonフレームワーク

概論 ControlFlowはPrefectHQによって開発されたPythonフレームワークで、AIワークフローの構築と管理に特化している。ワークフローを定義し、大規模言語モデル(LLM)生成にタスクを委譲するための、構造化された開発者指向のフレームワークを提供します。
1年前
052K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI:画像要素の位置を正確にコントロール、ComfyUIをベースにした直感的なグラフィカル・インターフェース

概論 GLIGEN GUIはComfyUIをベースにした直感的なグラフィカル・インターフェースで、画像中のオブジェクトの位置を正確に指定できる新しいテキスト-イメージ・モデルであるGLIGENモデルの使用を簡素化するように設計されている。GLIGE...
2年前
052K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

悟空:詳細で一貫性のある動画を生成します。詳細なキャラクターやオブジェクトを使用したコマーシャルの作成に最適です。

包括的な紹介 Gokuは、ストリーム変換技術に基づく連携型画像・動画生成モデルであり、業界トップクラスのパフォーマンスを達成するよう設計されています。Gokuは、きめ細かなデータ照合、モデル設計、ストリーム変換の定式化など、高度で高品質な映像生成技術を統合しています。
1年前
051.9K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp:カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

概論 FoloUpは、企業向けにAIを活用した音声面接ソリューションを提供するために設計されたオープンソースのプラットフォームです。FoloUpを利用することで、企業は職務内容に合わせてカスタマイズした面接質問を素早く生成し、AIによる自然な会話形式の面接を実施することができます。また、このプラットフォームは、詳細な面接分析も提供します。
1年前
051.9K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。
1年前
051.8K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: ニュースのタイムライン要約ツールでニュースの検索とタイムライン生成の効率を改善

一般的な紹介 CHRONOSはAlibaba NLPチームによって開発されたニュースタイムライン要約ツールです。CHRONOSはオープンドメインのタイムライン要約タスクを処理できるだけでなく、効率性とスケーラビリティの面でも優れています。
1年前
051.8K
MOFA Video:运动场适配技术将静态图像转换为视频

MOFAビデオ:静止画を動画に変換するモーション・フィールド・アダプテーション技術

概論 MOFA-Videoは、生成的運動場適応技術を利用して静止画像を動的動画に変換する最先端の画像アニメーション生成ツールである。東京大学とTencent AI Labとの共同研究により開発され、2024年のEuropean Conference on Computer Vision (EV)で発表される。
1年前
051.7K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。

受信トレイゼロ:AIがメールを分類、フィルタリング、処理します。

一般的な説明 Inbox Zeroは、AIアシスタントを使用して、ユーザーが迅速に受信トレイゼロの電子メールを達成するために設計されたオープンソースの電子メール管理アプリです。自動返信、アーカイブ、ラベル付け、メールの転送、ニュースレターの管理と配信停止、冷やかしメールのブロック、フォロー...など様々な機能を提供しています。
1年前
051.7K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee:オープンソースのAIリサーチアシスタントが引用研究を生成

一般的な紹介 CleverBeeはGitHubでホストされているオープンソースのAI研究アシスタントであり、SureScaleAIによって開発された。ウェブブラウジング技術と大規模な言語モデル(GeminiやClaudeなど)を組み合わせることで、ユーザーを支援します...
11ヶ月前
051.6K
Extract.fun:开源网站图片提取工具,利用Cloudflare浏览器渲染

Extract.fun: オープンソースのウェブサイト画像抽出ツール , Cloudflareのブラウザレンダリングを使用

概要 Extract.funは、Cloudflareのブラウザレンダリング機能を使用して、あらゆるWebサイトから画像を抽出する最新のWebアプリケーションです。Remix上に構築され、Cloudflare Pages上に配置されたこのアプリケーションは、高速な画像抽出を提供します。
1年前
051.6K
XDOllama:适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。

XDOllama: MacOS上でOllamaを素早く呼び出すためのAIモデル・インターフェース。

概要 XDOllamaは、Ollama、Dify、XinferenceなどのAIモデルを素早く呼び出すためにMacOSユーザー向けに設計されたデスクトップアプリケーションです。簡素化されたインターフェースとワークフローにより、このアプリケーションを使用すると、...
1年前
051.6K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: ウェブサイトの自動組み込みと多言語オープンソースAIツールナビゲーションサイトのサポート

一般的な紹介 AigoToolsは、ユーザーが迅速にナビゲーションサイトを作成し、管理するために設計されたオープンソースのAIウェブサイトナビゲーションです。サイト管理、AIベースの自動インクルージョン機能、多言語サポート、ダーク/ライトテーマ切り替え、SEO最適化機能を内蔵しています。
1年前
051.6K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

概論 DeepGeminiは、開発者Thomas Sligterによって作成されたオープンソースプロジェクトである。マルチモデルオーケストレーションをサポートするAI管理ツールであり、様々なAIモデルを柔軟に組み合わせることができるのが主な特徴である。
10ヶ月前
051.6K
X-R1:在普通设备中低成本训练0.5B模型

X-R1:一般的なデバイスの0.5Bモデルを低コストでトレーニング

一般的な紹介 X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づいてモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。このプロジェクトはDeepSeek...によってサポートされている。
1年前
051.5K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます!

はじめに GitPodcastは、GitHubのリポジトリをポッドキャストに変える革新的なツールで、開発者はいつでもどこでもコードの更新を聞くことができます。OpenAIとAzure Speech SDKを使って、GitPodca...
1年前
051.5K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan:ワンクリックでMarkdown記事を美化し、複数のセルフメディアプラットフォームフォーマットに対応(オープンソースのローカルクライアント)

包括的な紹介 WenYanは、Markdownの記事のタイプセットと美化のために設計されたツールであり、編集されたMarkdownの記事をWeChat、Zhihu、今日の見出しや他のプラットフォームに適した形式に変換することをサポートしています。ユーザーはワンクリックで記事をコピーし、記事を直接...
1年前
051.4K
Denser Chat:与PDF文件互动,提供源代码高亮显示

Denser Chat: PDFファイルとのインタラクト、ソースコードハイライトの提供

概要 Denser Chatは、denser.aiによって開発・保守されているチャットボット・プロジェクトで、PDFファイルやウェブページからテキストや表を抽出し、ソースコードハイライトを行います。このプロジェクトはdenser-re...
1年前
051.3K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPTリサーチャー:ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

包括的な紹介 GPT Researcher は、Large Language Model (LLM)をベースとした自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。このツールは、エージェント作業を並列化することにより、安定したパフォーマンスと高速化を実現し、情報の正確性を保証します。
1年前
051.2K
AiryLark:支持多格式文档智能翻译的开源工具

AiryLark:多フォーマット文書のインテリジェント翻訳のためのオープンソースツール

一般的な紹介 AiryLarkはGitHubでホストされているオープンソースの文書処理・翻訳ツールで、開発者のwizdによってNext.jsフレームワークに基づいて構築されています。様々なファイル形式(PDF、Word、TXT、Markdo...など)をサポートしています。
1年前
051.1K
Xata Agent:监控和优化PostgreSQL数据库的AI助手

Xata Agent: PostgreSQLデータベースの監視と最適化のためのAIアシスタント

概要 Xata Agentは、PostgreSQLデータベース専用に設計されたオープンソースのAIツールです。データベースの稼働状況を自動的に監視し、パフォーマンス上の問題や障害の根本原因を突き止め、それを解決するための推奨事項を提示します。開発チームのxAIは、このツールをPostgreSQLのような...
1年前
051.1K
Agentarium:複数のAIインテリジェンス間の相互作用の管理と調整

Agentarium:複数のAIインテリジェンス間の相互作用の管理と調整

概要 Agentariumは、AIインテリジェントエージェント(Agent)の管理とオーケストレーションに特化した強力なPythonフレームワークです。このフレームワークは、複数のAIエージェント間のインタラクションを作成、管理、オーケストレーションするための柔軟で直感的な方法を提供します。A...
1年前
051.1K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

エージェント・サービス・ツールキット:LangGraphに基づくAIインテリジェンス構築のための完全なツールセット

包括的な紹介 AIエージェント・サービス・ツールキットは、LangGraph、FastAPI、Streamlit上に構築された完全なツールセットで、開発者がAIエージェント・サービスを迅速に構築し、実行できるように設計されています。このツールキットは...
1年前
050.7K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略

包括的な紹介 zChunkは、ZeroEntropyによって開発された、一般的なセマンティック・チャンキングのソリューションを提供する新しいチャンキング戦略です。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索を高いレベルで維持することを保証します。
1年前
050.7K
Swarms:多智能体编排框架,企业级生产工具

Swarms: マルチインテリジェンス・オーケストレーション・フレームワーク、エンタープライズ・プロダクション・ツール

概要 Swarmsは、効率的なエージェント管理とタスク処理によってビジネスの生産性を向上させるために設計された、エンタープライズグレードのプロダクション対応マルチエージェント・オーケストレーション・フレームワークです。複数のモデル、複数のメモリシステム、カスタムエージェントの作成をサポートするこのフレームワークは、モジュール設計と包括的なロギング機能を提供し、システム...
1年前
050.7K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型

InternLM-XComposer:非常に長いテキストと画像・動画理解を出力するためのマルチモーダル・マクロモデル

包括的な紹介 InternLM-XComposerは、InternLMチームによって開発され、GitHubでホストされているオープンソースのグラフィカルなマルチモーダルビッグモデルプロジェクトです。InternLM言語モデルをベースにしており、マルチモーダルテキスト、画像、ビデオ、その他の...
1年前
050.6K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool:すべてのAIモデルを1つのデスクトップで管理、接続、使用できるAI愛好家のツールボックス!

Omnitool.aiはオープンソースの「AIラボ」であり、学習者や趣味の人、最新のAI技術革新に興味のある人向けに、拡張可能なブラウザベースのデスクトップ環境を提供するように設計されている。Omnitool.iでは、OpenAIやrepl...などの様々なAIの専門家と、統一されたインターフェースを通じて共同作業を行うことができます。
1年前
050.6K
Mobius Diffusion:文本提示生成无缝循环视频

メビウス・ディフュージョン:テキスト・プロンプトがシームレスなループ映像を生成

はじめに メビウス・ディフュージョンは、テキスト入力からシームレスにループするビデオコンテンツを生成することに特化した革新的なオンラインツールです。事前にトレーニングされたビデオ拡散モデルに基づいており、ユーザーのトレーニングやアノテーションデータを必要とせず、すぐに使い始めることができます。このサイトのコアテクノロジーは...
1年前
050.6K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: プロンプトを最適化するための実験的ライブラリ。

概論 Promptimizerは、AIシステムのキュー・ワードを体系的に改善するための実験的なキュー・ワード最適化ライブラリです。最適化プロセスを自動化することにより、Promptimizerは特定のタスクにおけるプロンプト語のパフォーマンスを向上させることができます。ユーザが必要とするのは...
1年前
050.5K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: 動画のローカル編集用テキストプロンプト オープンソースプロジェクト

一般的な紹介 VideoGrainは、xAIチームによって開発され、GitHubでホストされているマルチグラニュラービデオ編集に焦点を当てたオープンソースプロジェクトです。このプロジェクトは論文「VideoGrain: Modulating Space-Tim...
1年前
050.4K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: ChatGPTでレスポンシブメールを簡単にデザイン、マーケティングメールを素早く生成

概要 MJML(Mail Junction Markup Language)は、Mailjetチームによって開発されたオープンソースのフレームワークで、レスポンシブなメールテンプレートの作成を簡素化します。セマンティックなマークアップ言語と豊富なコンポーネントライブラリにより、開発者は少ないコードで美しくパワフルなメールテンプレートを効率的に作成することができます。
2年前
050.4K