AIオープンソースプロジェクト

合計1020記事
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector: 画像とテキストからSVGベクターグラフィックスを生成するための基本モデル

一般的な紹介 StarVectorは、画像やテキストをScalable Vector Graphics(SVG)に変換するために、Juan A. Rodriguezなどの開発者によって作成されたオープンソースプロジェクトです。このツールは、画像コンテンツとテキストを理解できるように視覚言語モデルを使用しています...
7ヶ月前
024.5K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: RAG技術を使ったテキストからの正確なSQLクエリの生成

包括的な紹介 VannaはMITライセンスのオープンソースPythonフレームワークで、RAG(Retrieval Augmented Generation)技術を使ってSQLクエリを生成することに重点を置いている。ユーザはRAGモデルを訓練し、自分のデータに適用し、質問をすると、Vannaは適切なSQLクエリを返す。
9ヶ月前
024.5K
ACE++:用文本指令精准对图像局部编辑的多功能开源工具

ACE++: テキストコマンドによる画像の正確なローカル編集を可能にする多機能なオープンソースツール

包括的な紹介 ACE++は、Alibaba Tongyi Lab (Tongyi Lab)のali-vilabチームによって開発されたオープンソースプロジェクトです。FLUX.1-Fill-devモデルに基づいており、簡単なテキストコマンドで画像生成とコンパイルを実現することを目指しています...
7ヶ月前
024.5K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点

クールクライン:クラインのインテリジェント・コーディング・アシスタントの改良版で、クラインルー・クラインとバオ・クラインの利点を組み合わせたもの。

一般的な説明 CoolClineは、Cline、Roo Cline、Bao Clineの最高の機能を組み合わせた強力なコーディングアシスタントです。コマンドラインインターフェイス(CLI)やエディタとシームレスに動作し、最もパワフルな...
9ヶ月前
024.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq:AIアプリケーション開発を簡素化するRAGとLLMエージェントをサポートするインテリジェント・ボディ・オーケストレーション・フレームワーク

包括的な紹介 Dynamiqは、エージェントAIと大規模言語モデリング(LLM)アプリケーションのために設計されたオープンソースのAIオーケストレーションフレームワークです。Dynamiqは、特にRAG(Retrieval Augmented Generation)とLLMエージェントのオーケストレーションの分野において、AI駆動型アプリケーションの開発を簡素化することを目的としています。
11ヶ月前
024.4K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine:検索知識に基づいて未来の出来事の確率を予測する

概論 Forecast AIは高度な人工知能技術に基づく優れた予測プラットフォームです。強力なデータ分析と機械学習アルゴリズムを駆使し、ユーザーに精度の高い未来予測を提供します。政治選挙、経済動向、社会的出来事のいずれであっても、Forecast ...
1年前
024.4K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

Paper Reviewer: arXiv論文の包括的なレビューを自動生成し、ブログ記事に変換する。

一般的な紹介 Paper Reviewerは、arXivの論文から包括的なレビューを生成し、ブログ記事にするために設計されたオープンソースプロジェクトです。このプロジェクトはHugging FaceのDaily Papersウェブサイトを動かしており、自動的に...
11ヶ月前
024.4K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

クロード・エンジニア:クロード・モデルを用いてAIツールを自律的に生成・管理する知的身体対話アシスタント

概要 Claude EngineerはDoriandarkoによって開発された対話型コマンドラインインターフェイス(CLI)で、AnthropicのClaude-3.5-Sonnetモデルを利用してソフトウェア開発作業を支援する。
7ヶ月前
024.4K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: エンタープライズ級ジェネレーティブAIアプリケーションのためのローコード開発プラットフォーム

包括的な紹介 BuffGPTはLarge Language Model (LLM)に基づいたオープンソースのAIアプリケーション開発プラットフォームであり、データ処理、モデル呼び出し、RAG検索、視覚的なワークフローオーケストレーションなどのすぐに使える機能を提供し、ユーザーが生成AIアプリケーションを簡単に構築・運用できるように支援します。このプラットフォームは、プライベート...
7ヶ月前
024.4K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: ドキュメントチャットアシスタント、1つのドキュメント、ウェブソースから信頼できる回答を得る、ローカル展開をサポート

概要 DocsGPT はオープンソースのドキュメントアシスタントで、プロジェクトドキュメントのクエリプロセスを簡素化するように設計されています。強力な GPT モデルを統合することで、開発者はプロジェクトに関する質問を簡単に行い、正確な回答を得ることができます。
11ヶ月前
024.4K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Gemini-OpenAI:リージョン制限を回避し、OpenAI互換APIに変換する逆世代Geminiアドレス

一般的な紹介 Gemini OpenAI API Agentは、無料でサーバーのメンテナンスが不要なOpenAI準拠のエンドポイントです。ユーザは、Vercel、Netlify、Cloudflareなどのプラットフォームに、個人で簡単にデプロイすることができます。プロジェクト ...
9ヶ月前
024.4K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。
9ヶ月前
024.4K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: 複数のデータソースを迅速に統合するカスタムチャットボット

概要 OpenChatは、大規模言語モデル(LLM)の使用を簡素化するために設計されたユーザーフレンドリーなチャットボットコンソールです。OpenChatは、2ステップのセットアッププロセスを提供することで、ユーザーが簡単に複数のカスタムチャットボットを作成し、管理することを可能にします。このプラットフォームはG...
9ヶ月前
024.4K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara:視覚的埋め込みベースの文書保管・検索サービス

概要 ColiVara は、ビジュアル埋め込み技術に基づく文書保管・検索サービスです。光学式文字認識(OCR)やテキスト抽出の必要性をなくし、フォームの破損や画像の紛失といった問題を回避します。ColiVaraは、PDFを含む100以上のファイルフォーマットをサポートしています。
8ヶ月前
024.4K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress:マイクロサービスの管理を簡素化し、セキュリティを強化する効率的なAIゲートウェイ・ソリューションの提供

総合紹介 Higressはアリババが開発したクラウドネイティブなAPIゲートウェイで、IstioとEnvoyをベースに構築され、効率的なトラフィックスケジューリング、サービスガバナンス、セキュリティソリューションを提供するように設計されている。複数のプログラミング言語に対応したWasmプラグイン拡張機能をサポートし、AIビジネス...
11ヶ月前
024.3K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

クアンタ・クエスト:エンドサイドのビッグモデルと個人データのためのローカライズされたAI検索プラットフォーム(プレビュー)

はじめに Quanta Questは、「エンド側ビッグモデル+C側データローカリゼーション」をコア進化の方向とする世界初の製品です。Gmail、Notion、Dropboxなどのデータをローカルに保存し、ベクターデータベースで処理することで、...
12ヶ月前
024.3K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG:マルチモーダル検索と知識グラフ構築をサポートする超長尺動画理解のためのRAGフレームワーク

包括的な紹介 VideoRAGは、非常に長い文脈動画を処理し理解するために設計された、検索機能を強化した生成フレームワークです。このツールは、グラフ駆動のテキスト知識ベースと階層的なマルチモーダルコンテキストエンコーディングを組み合わせ、1つのNVIDIA RTX 3090 GPUで効率的に処理します...
8ヶ月前
024.3K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

薄板-スプライン-モーションモデル:静的ポートレートマップ参考動画 ポートレートモーション生成動画

概論 Thin-Plate-Spline-Motion-Model は、CVPR 2022 で発表された画期的な画像アニメーション生成プロジェクトである。このプロジェクトは、薄板スプライン変換の理論に基づいており、走行映像に基づく静止画から高品質な動きを実現することができる...
9ヶ月前
024.3K
GPT-Crawler:自动爬取网站内容生成知识库文件

GPT-Crawler: ウェブサイトコンテンツを自動的にクロールして知識ベースドキュメントを生成

一般的な紹介 GPT-Crawlerは、BuilderIOチームによって開発され、GitHubでホストされているオープンソースツールです。1つ以上のウェブサイトのURLを入力することでページのコンテンツをクロールし、構造化ナレッジファイル(output.jso...
4ヶ月前
024.3K
Kreuzberg:从任何文档中提取文本的开源工具

Kreuzberg: あらゆる文書からテキストを抽出するオープンソースツール

一般的な紹介 Kreuzbergは、PDFファイルからのテキスト抽出を簡素化するためのライブラリで、シンプルで手間のかからないテキスト抽出ソリューションを提供するように設計されています。このライブラリは、特にRAG(Retrieval-Augmented Generatio...
8ヶ月前
024.3K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D:高解像度3Dモデリングデジタル資産を生成するAIプラットフォーム

概論 Neural4Dは、ユーザーが簡単なテキストや画像を入力するだけで、高品質な3Dモデルやアニメーションを素早く生成できるよう支援することに重点を置いた、AIベースの革新的なプラットフォームです。DreamTech社によって開発されたこのプラットフォームは、世界をリードするエンドツーエンドの大規模3Dモデル生成技術に依存しています。
8ヶ月前
024.3K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos:ワールド・ベース・モデル、物理世界のAIベース・モデルを構築するためのプラットフォーム

包括的な紹介 NVIDIA Cosmosは開発者向けのワールドベースのモデリング・プラットフォームであり、物理AI開発者がより良く、より速く物理AIシステムを構築できるように特別に設計されています。このプラットフォームは、拡散モデルや自己回帰モデルなど、さまざまな訓練済みモデルを提供します。
9ヶ月前
024.3K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent:マルチモーダルインテリジェンスによるスマートフォンの自動操作

包括的な紹介 AppAgentは、スマートフォンのアプリケーションを操作するために設計されたLarge Language Model(LLM)ベースのマルチモーダルエージェントフレームワークです。このフレームワークは、簡素化された操作空間を通じて、タップやスワイプといった人間のインタラクションを模倣する。そのため、システムのバックエンドにアクセスする必要がなく、さまざまなアプリケーションでの利用が可能である。
10ヶ月前
024.3K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: オープンソースLLMプログラミング能力比較アリーナ、最適なコード生成モデルをリアルタイム表示

一般的な紹介 CodeArenaは、リアルタイムの対決を通じて最高のオープンソースコード生成モデル(LLM)を紹介するために設計されたユニークなプラットフォームです。ユーザーは、異なる LLM が同じプログラミング・タスクで競い合う様子を見たり、リアルタイム・リーダーボードを通じて最高のパフォーマンスを発揮したモデルを見ることができます。このプラットフォームは、Togetter...
10ヶ月前
024.3K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

フライング・パドル PP-TableMagic: 複雑なテーブルの構造化情報抽出

表認識の目的は、画像中の表を解析し、表の構造やセルの位置を正確に特定し、構造化された表形式(HTMLなど)に変換することである。今日の情報化時代において、大量の重要な表データがまだ構造化されていない状態で存在している(例えば、統計表の写真をスキャンした文書など)。
7ヶ月前
024.2K
Supermemory:导入书签和网页内容构建个人知识库

スーパーメモリー:ブックマークやウェブコンテンツをインポートして個人の知識ベースを構築する

概論 Supermemoryは、ユーザーが「第二の脳」を構築することを支援するために設計されたオープンソースプロジェクトである。強力なChrome拡張機能とAI技術により、ユーザーはウェブページやTwitterのブックマークから簡単にデータを保存、整理、取得することができます。
9ヶ月前
024.2K
Knowledge Table:高效提取与探索结构化数据的开源工具

知識テーブル:構造化データの効率的な抽出と探索のためのオープンソースツール

包括的な紹介 ナレッジテーブル(Knowledge Table)は、非構造化ドキュメントから構造化データを抽出し、探索するプロセスを簡素化するために設計されたオープンソースプロジェクトです。ユーザは、自然言語クエリインタフェースを通して、表やグラフのような構造化された知識表現を作成することができる。このツールは、抽出のカスタマイズをサポートしています。
1年前
024.2K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

概要 Base Chatは、Ragie Connectを使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、複数のRagie機能のリファレンスアプリケーションであり、Next.jsで構築され、Goo...
8ヶ月前
024.2K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun:ウェブデータを自動的にクロールし、APIやスプレッドシートに変換するオープンソースのコード不要プラットフォーム

包括的な紹介 Maxunはオープンソースのコード不要のウェブデータ抽出プラットフォームで、ウェブデータを自動的にクロールしてAPIやスプレッドシートに変換するロボットを数分で訓練することができます。このプラットフォームは、ページングとスクロールをサポートし、ウェブサイトのレイアウトの変更に適応し、強力なデータクローリングを提供します。
9ヶ月前
024.2K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream:画像手がかり語のバッチバックプロパゲーションのためのオープンソースの軽量視覚言語モデル

包括的な紹介 Moondreamは、ディープラーニングとコンピュータビジョン技術による画像記述機能を実現するために設計された、オープンソースの軽量視覚言語モデルです。このモデルは、様々なプラットフォーム上で効率的に実行することができ、特にエッジデバイスに適しています。
9ヶ月前
024.2K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: オープンソースのAIブックマーク管理ツール、複数フォーマット対応、インテリジェントタグ分類、全文検索

概要説明 Hoarderは、リンク、メモ、PDF、画像の保存をサポートするセルフホストブックマーク管理ツールです。自動タグ付けにAI技術を使用し、全文検索機能を提供します。ユーザーはChromeプラグインとFirefoxプラグインを使用することができます...
10ヶ月前
024.2K
Coding Agent:基于Langgraph构建的简单编程助手

コーディング・エージェント:Langgraph上に構築されたシンプルなプログラミング・アシスタント

概要 Coding AgentはAbhinavTheDevによって開発されたインテリジェントなプログラミングアシスタントで、開発者のプログラミング効率を向上させるために設計されています。このツールは、人工知能技術を使用して、コードを自動的に生成し、プログラミングの提案を行い、さまざまなコーディングで開発者を支援します。
9ヶ月前
024.2K
闲鱼卖家全天自动值守的AI客服机器人

アイドル・フィッシュの販売員が24時間体制で自動対応するAIカスタマーサービスボット

包括的な紹介 XianyuAutoAgentは、GitHubで開発者shaxiuによってオープンソース化されたIdlefishプラットフォーム用に設計されたインテリジェントな顧客サービスロボットシステムです。AI技術を利用し、7×24時間の自動勤務を実現し、アイドルフィッシュ販売者の返信を支援する。
7ヶ月前
024.2K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): ローカルリアルタイム音声AIアシスタント、オープンソース版Siri

はじめに Ichigoはオープンソースのリアルタイム音声AIプロジェクトで、テキストベースの言語モデルをネイティブな「聞き取り」機能で拡張することを目的としています。このプロジェクトでは、MetaのChameleon論文にインスパイアされた初期のフュージョン技術を使用している。
9ヶ月前
024.2K
Parler-TTS:根据输入文本生成特定说话人风格的文本转语音模型

Parler-TTS: 入力テキストから話者固有の音声合成モデルを生成する

一般的な紹介 Parler-TTSは、Hugging Face社によって開発されたオープンソースの音声合成(TTS)モデルライブラリで、高品質で自然な音声を生成するように設計されています。このモデルは、特定の話者スタイル(性別、ピッチ、話し方など)の入力テキストに基づいて音声を生成することができます。
8ヶ月前
024.2K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude:DeepSeekのR1チェーン推論とClaudeの創造性を融合したチャットインターフェース

包括的な紹介 DeepClaudeは、DeepSeek R1の連鎖推論(CoT)機能とAnthropic Claudeモデルの創造性とコード生成を統合した、高性能な大規模言語モデル(LLM)推論APIとチャット・インターフェースです...
9ヶ月前
024.2K
语析(Yuxi-Know):基于知识图谱的智能问答平台

Yuxi-Know:知識グラフベースのインテリジェントQ&Aプラットフォーム

Yuxi-Knowは、ナレッジグラフとRAG(Retrieval Augmented Generation)技術を組み合わせたオープンソースのインテリジェントなQ&Aプラットフォームで、ユーザーが素早く正確な回答を得られるように支援します。知識グラフを保存するためにNeo4jをベースにしており、FastAPIとVueJS構造を使っています。
6ヶ月前
024.1K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: 記憶、知識、ツールを備えたAIインテリジェンスの構築

包括的な紹介 PhiDataは、インテリジェントなAIアシスタントを開発するために設計されたフレームワークです。PhiDataは、拡張されたメモリ、知識統合、ツール呼び出し機能を通じて、AIアシスタントが長期的な会話を行い、正確なビジネスコンテキストを提供し、さまざまな操作を実行できるようにします。
7ヶ月前
024.1K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook:TypeScriptの完全なプロジェクトを迅速に構築し、反復するオープンソースのフルスタックAIエンジニア

Srcbookの概要 SrcbookはTypeScriptを中心としたアプリケーション開発プラットフォームであり、AIアシスタントを用いてWebアプリケーションを迅速に作成し、繰り返し実行できるように設計されている。ネイティブランタイムをサポートし、インタラクティブなノートブックインターフェースを提供し、バックエンドのコードを書いて実行することができる。
11ヶ月前
024.1K
Screenshot to Code:将截图转换为干净前端代码的AI工具

スクリーンショットをコードに:スクリーンショットをクリーンなフロントエンドコードに変換するAIツール

概要 Screenshot-to-Codeは、人工知能を使用してスクリーンショット、デザインドラフト、Figmaデザインをクリーンで機能的なコードに変換するオープンソースツールです。このツールは、HTML、Tailwind CS...など、複数のフロントエンド技術スタックをサポートしています。
12ヶ月前
024.1K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築

一般的な紹介 Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークです。ユーザーは、1文の記述でインテリジェントなAIエージェントを作成することができ、複雑なタスクで共同作業する複数のエージェントをサポートしています。このフレームワークは2つの...
5ヶ月前
024.1K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia:アニメのモノクロ線画に素早く色をつける自動線画着色ツール。

総合紹介 MangaNinjiaはAlibaba Tongyi Visual Intelligence Lab (Ali-Vilab)によって開発されたオープンソースプロジェクトで、線画のカラーリングの自動処理に焦点を当てています。このツールは、ディープラーニング技術によって参照画像の正確なカラーマッチングを実現し、線画の色付けを大幅に改善します。
9ヶ月前
024.1K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: XユーザーデータとツイートのためのTwitterデータクロールとアナリティクス

概要 X-Kitは、X(旧Twitter)のユーザーデータやツイートをクロールして分析するために設計されたオープンソースツールです。GitHubユーザーのxiaoxiuniqueによって開発されたこのツールは、ユーザーが任意のXユーザーに関する基本的な情報やツイートを取得するプロセスを自動化するために設計されています。
10ヶ月前
024.1K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-ダイナ:静止画参考動画 ミッシーの写真を踊らせるポーズ生成動画

包括的な紹介 X-Dynaは、ByteDanceによって開発されたオープンソースプロジェクトで、ゼロサンプル拡散技術を使用してダイナミックなポートレートアニメーションを生成します。このプロジェクトでは、ドライブビデオ内の表情や体の動きを使って個々のポートレート画像をアニメーション化し、リアルでコンテキストを意識したモーションエフェクトを生成します。
9ヶ月前
024.1K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: リアルな似顔絵を生成するオープンソースツール

一般的な紹介 FantasyTalkingは、Fantasy-AMAPチームによって開発されたオープンソースプロジェクトで、オーディオドライブを通してリアルなトーキングポートレート動画を生成することに焦点を当てています。このプロジェクトは、高度なビデオ拡散モデルWan2.1とオーディオエンコーダWa...
5ヶ月前
024.1K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: 外部リアルタイム知識グラフデータに依存するLLM推論サービス

包括的な紹介 Diffbot LLM Reasoning Server は LLama モデルアーキテクチャに基づいた特別な最適化と改良が施された革新的な大規模言語モデリングシステムです。このプロジェクトの最も重要な特徴は、リアルタイムナレッジグラフと検索を強化した生成の統合です...
9ヶ月前
024.1K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器

Text2Video-Zero: Picsart AI研究チームによるテキストからビデオへのゼロサンプル生成ツールがリリースされました。

一般的な紹介 Text2Video-Zeroは、Picsart AI Researchチームによって開発されたGitHub用のサンプル数ゼロのテキストからビデオへのジェネレーターの公式実装です。このプロジェクトは、時間的一貫性と正しいテキストを生成するためにテキストキューを使用する方法を提供します。
1年前
024.1K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

バイリンガルブックメーカー: AI翻訳を使用して、バイリンガルの電子書籍を作成します。

一般的な紹介 バイリンガルブックメーカーは、ユーザーがAI技術を使って多言語版の電子書籍を作成できるように設計されたオープンソースプロジェクトです。このツールは主に翻訳にChatGPTを使用し、epub、txt、srtを含む複数のファイル形式をサポートしています。
8ヶ月前
024K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: AI対話とコード実行を統合したオンラインデータ分析フォーム

概要 Quadraticは、AI、コード、データ接続機能を組み合わせたオープンソースのスマート・スプレッドシート・ツールで、強力なデータ処理と分析機能をユーザーに提供するように設計されています。Python、SQL、Rustなどのプログラミング言語をサポートすることで、Quadratic...
8ヶ月前
024K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock:AI対応株式分析ツール、自分で選んだ株価のリアルタイム監視とAIに基づく詳細分析

総合紹介 go-stockはWailsとNaiveUIで構築されたAI対応株式分析ツールです。このツールは株価のリアルタイム監視が可能で、コストと損益表示、上下アラームプッシュ機能を提供します。すべてのデータはローカルに保存され、ユーザ...
8ヶ月前
024K
Langui:开源的AI用户界面组件库

Langui: AIユーザーインターフェイスコンポーネントのオープンソースライブラリ

概要 LangbaseIncのLanguiは、生成AIや大規模言語モデリング(LLM)プロジェクトのために設計されたオープンソースのユーザーインターフェイスコンポーネントライブラリです。このライブラリはTailwind CSSをベースにしており、開発者が素早くUIを構築できるように、あらかじめビルドされたUIコンポーネントのコレクションを提供します。
9ヶ月前
024K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

AI投資システム:市場データを分析するマルチインテリジェンスシステムを利用したA株投資の自動意思決定システム

総合紹介 A_Share_investment_Agentは、マルチインテリジェンスシステムに基づくA株投資判断支援システムです。このシステムは、市場データの分析、銘柄の本質的価値の計算、市場心理の分析、複数の協調知能を通じたファンダメンタルズデータの分析を行うように設計されており、...
9ヶ月前
024K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段

MuseGAN: マルチトラック音楽/サウンドトラックを生成し、複数の楽器の音楽クリップを簡単に作成するためのオープンソースモデル

一般的な紹介 MuseGANはGenerative Adversarial Networks (GAN)に基づいた音楽生成プロジェクトで、マルチトラック(マルチ楽器)の音楽を生成するように設計されています。MuseGANはLakh Pianorを使用しています。
10ヶ月前
024K
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID:キャラクタ一貫性のある映像を生成するポートレート参照マップ、迅速な多端末統合

包括的な紹介 ConsisIDは、北京大学のYuan Rong氏のグループによって開発されたオープンソースプロジェクトであり、周波数分解技術によって、同一性のあるテキストからビデオへの生成(IPT2V)を実現することを目的としている。プロジェクトの中核は、DiT(Diffusion Transfor...
10ヶ月前
024K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG(Retrieval Augmentation Generation)システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。
8ヶ月前
024K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP Server: MCPプロトコルに基づき、様々なコンテンツをMarkdownフォーマットに変換します。

一般的な紹介 Markdownify MCPサーバーはモデルコンテキストプロトコルに基づいたオープンソースツールで、開発者のZach CaceresによってGitHubでホストされています ...
7ヶ月前
024K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理

DB-GPT: AIネイティブデータアプリケーション開発フレームワークの構築、マルチモデル管理とインテリジェントデータ処理の統合

包括的な紹介 DB-GPTは、AWEL(Agentic Workflow Expression Language)とスマートボディ技術を用いて構築されたオープンソースのAIネイティブデータアプリケーション開発フレームワークです。このプロジェクトは、大規模モデルの分野でインフラを構築することを目的としています。
7ヶ月前
024K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN中国語ポッドキャスト:人気の技術記事を自動的に取得し、AIが中国語の要約を生成し、ポッドキャストに変換します。

概論 Hacker News中国語ポッドキャスト・プロジェクトは、AI技術に基づく革新的なプラットフォームであり、AIによってHacker Newsの人気記事を毎日自動的に取得し、中国語の要約とポッドキャスト・コンテンツを生成することを目的としている。このプロジェクトはccbikai ... によって資金提供されています。
8ヶ月前
024K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: コード編集が可能なコラボレーション・キャンバス、OpenAI Canvasのオープンソース版/Claude Artifacts

LangChainは、デュアルエージェントメモリ機能を内蔵し、完全な実行の詳細を観察するために統合されたスミスを使用して、ドキュメントの編集とコラボレーション体験を強化するために設計されたオープンソースのWebアプリケーション、Open Canvasを紹介します。このプラットフォームはOpenA...
7ヶ月前
024K
Ovis:视觉与文本对齐模型,精准反推图像提示词

Ovis:画像手がかり語の正確なバックプロパゲーションのための視覚的・テキスト的アライメントモデル

一般的な紹介 Ovis (Open VISion) は、アリババの国際デジタル商取引グループのAIDC-AIチームによって開発され、GitHubでホストされているオープンソースのマルチモーダル大規模言語モデル(MLLM)です。このモデルは、革新的な構造埋め込みアライメント技術を使用して、視覚化...
7ヶ月前
024K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: 自然言語によるデータクエリとグラフ生成のためのデータ分析対話プラットフォーム

はじめに PandasAI は Python ベースのオープンソースプラットフォームであり、自然言語処理技術によってデータ分析プロセスを簡素化するように設計されています。データベース(SQL、CSV、pandas、polars、mongodb、n...など)との対話を可能にします。
11ヶ月前
024K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル(LLM)が音声を生成します。
5ヶ月前
024K
Open Operator:通过AI智能体在云浏览器中执行自动化操作

オープン・オペレーター:AIインテリジェンスでクラウド・ブラウザの操作を自動化する

概論 Open Operatorは、AIインテリジェンスによってブラウザの操作を自動化することを目的としたオープンソースプロジェクトである。このプロジェクトはBrowserbaseによって開発され、StagehandとBrowserbaseの技術を組み合わせています...
9ヶ月前
023.9K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind:タイムスタンプによるビデオ位置決めコンテンツとQ&Aオープンソースプロジェクト

概論 VideoMindは、長い動画の推論、Q&A、要約生成に焦点を当てたオープンソースのマルチモーダルAIツールである。香港理工大学のYe Liuとシンガポール国立大学のShow Labのチームによって開発された。このツールは人間の動画理解を模倣している。
4ヶ月前
023.9K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks:小型猿口計算リバースノート、リバースエンジニアリング、復号アルゴリズム

包括的な紹介 猿の口計算機リバースノートは、猿の口計算機アプリケーションのリバースエンジニアリングのプロセスと方法を文書化し、共有することを目的としたオープンソースプロジェクトです。このプロジェクトには、Fridaやdexdumpなどの命令を使用するための様々なリバースツールやテクニックが含まれています。
1年前
023.9K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: 画像、ビデオ、テキスト処理のためのオープンソース・マルチモーダル大規模モデル

包括的な紹介 InternVLは、上海人工知能研究所(OpenGVLab)によって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルプロジェクトです。視覚処理と言語処理の機能を統合し、画像、動画、テキストの包括的な理解と生成をサポートします。
6ヶ月前
023.9K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: ドキュメントを構造化データに抽出・分類し、ドキュメント処理プロセスを最適化します。

包括的な紹介 ExtractThinkerは、大規模言語モデル(LLM)を使用してドキュメントから構造化データを抽出・分類し、シームレスなORMライクなドキュメント処理ワークフローを提供する、柔軟なドキュメントインテリジェンスツールです。LLMを含む様々なドキュメントローダーをサポートしています。
9ヶ月前
023.9K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM:大規模モデルに外部知識を埋め込むためのオープンソース拡張ツール

KBLaMはマイクロソフトによって開発されたオープンソースプロジェクトで、正式名称は「知識ベース拡張言語モデル」(Knowledge Base Augmented Language Model)である。これは、外部の知識をベクトルに変換し、大規模なモデルに埋め込むことで、...
7ヶ月前
023.9K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

llms.txt Generator: Webサイトのコンテンツを素早くキャプチャし、LLMトレーニング用テキストデータセットを生成します。

包括的な紹介 llmstxt-generatorは、大規模言語モデリング(LLM)の訓練と推論のための高品質のテキストデータセットを準備するための専門的なウェブコンテンツ抽出と統合ツールです。このツールはMendable AIによって開発され、@firec...
9ヶ月前
023.9K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush:スマートペイントツールで画像にイルミネーションを加える

はじめに LuminaBrushは、人工知能技術を搭載した、照明効果のための革新的なインタラクティブ画像編集ツールです。このプロジェクトでは、2段階のフレームワークを使用して画像を処理します。第1段階では、入力画像を「均一な照明」ルックに変換し、第2段階では、...
9ヶ月前
023.9K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

高速GraphRAG:高精度で低コストのグラフィカル検索機能拡張生成ツール

包括的な紹介 Fast GraphRAGはCirclemind AIによって開発されたオープンソースツールで、知識グラフとPageRankアルゴリズムによって効率的で正確な検索補強生成(RAG)を可能にします。このツールはユーザーの用途にインテリジェントに適応する。
9ヶ月前
023.9K
Dolphin:面向亚洲语言识别与语音转文本模型

ドルフィン:アジア言語認識とアジア言語のための音声テキストモデル

総合紹介 Dolphinは、DataoceanAIと清華大学によって開発された、アジア言語の音声認識と言語認識に特化したオープンソースモデルです。東アジア、南アジア、東南アジア、中東の40の言語と22の中国語方言をサポートしています。
6ヶ月前
023.9K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

TransRouterは、GoogleのGeminiモデルをベースにしたリアルタイム音声翻訳ツールで、特に英語と中国語のリアルタイム音声翻訳用に設計されている。このツールは、Zoomのようなビデオ会議ソフトウェアにシームレスに統合され、クロスランゲージのための強力なツールを提供します...
9ヶ月前
023.9K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow:カートゥーンシェーディング、白黒画像の自動シェーディングによる画像の色の一貫性と品質の向上

包括的な紹介 ColorFlowは、Tencent ARCチームによって開発された画像シーケンスの自動カラーリングツールで、白黒画像シーケンスの自動カラーリングの問題を解決します。このツールは、検索で強化されたシェーディングパイプラインを使用して、キャラクターの髪の色やサービスなど、参照画像のプールを通して様々な要素の色を正確に生成します。
10ヶ月前
023.9K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty:AIを搭載したコードエディターを体験しよう!

概論 Meltyは、チャットによる会話とGitによるバージョン管理を組み合わせた画期的なAIコードエディターである。ReplicateのCharlieとJacksonによって開発されたこのツールは、従来のAIコーディングツールのペインポイントを解決することを目指している。最大の特徴は...
10ヶ月前
023.8K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev:ワイヤーフレームをアップロードしてLlama4ベースのフロントエンドコードを生成する

一般的な紹介 Napkins.devはフリーのオープンソースプロジェクトです。コア機能は、ユーザーがインターフェイスのスクリーンショットやワイヤーフレームをアップロードして、実行可能なフロントエンドコードを自動的に生成できるようにすることです。ユーザーはデザイン画を提供するだけでよく、ツールはLlama 4モデル(by Together ...
6ヶ月前
023.8K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: 大規模モデルグループチャットフレームワーク: 複数の大規模言語モデルと同時にチャットする

包括的な紹介 OpenAOEは、オープンソースの大規模モデルグループチャットフレームワークです。OpenAOEを使えば、ユーザーは複数の大規模言語モデル(LLM)と同時に会話し、並列出力を得ることができます。このフレームワークは...
8ヶ月前
023.8K
VirtualWife:支持B站直播和语音互动的二次元数字人

バーチャル・ワイフ:Bステーションのライブ・ストリーミングと音声インタラクションをサポートする第二のデジタル・パーソン

VirtualWifeは、開発者yakami129によって作成されたオープンソースのバーチャルデジタルパーソンプロジェクトです。現在、インキュベーション段階にあり、ゴールは「魂」を持ったバーチャルキャラクターを作ることで、ユーザーは友達のように交流することができる。このプロジェクトはB Station Liveによってサポートされています。
7ヶ月前
023.8K
Easy Voice Toolkit:本地部署的AI语音工具箱

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-ToolkitはOpen Source Speech Projectに基づく多機能なツールキットで、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供します。ユーザーは、必要に応じてこれらのツールを選択的に使用することができます...
1年前
023.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev:多言語対応のコード自動生成・デバッグツール

概要 AutoDevは、Unit Meshチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、人工知能技術によって開発者のプログラミング効率を向上させることを目的としています。強力なコーディングアシスタントであり、Ja...を含む複数のプログラミング言語をサポートしている。
8ヶ月前
023.8K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude

Model Context Provider CLI: クロードに依存しない、あらゆる大規模モデルでMCPサービスを使用するためのコマンドラインツール。

包括的な紹介 モデルコンテキストプロバイダCLI(mcp-cli)は、モデルコンテキストプロバイダサーバと対話するためのプロトコルレベルのコマンドラインツールです。このツールによって、ユーザーはコマンドを送信したり、データを照会したり、サーバーが提供する様々なリソースと対話したりすることができます...
7ヶ月前
023.8K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます!

はじめに GitPodcastは、GitHubのリポジトリをポッドキャストに変える革新的なツールで、開発者はいつでもどこでもコードの更新を聞くことができます。OpenAIとAzure Speech SDKを使って、GitPodca...
9ヶ月前
023.8K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具

RSS Translator: RSSコンテンツをリアルタイムで購読・翻訳するツール

概要 RSS Translatorは、ユーザーがリアルタイムでRSSコンテンツを翻訳して購読できるように設計された、オープンソースのクリーンで自己展開可能なツールです。このツールは、Google翻訳、Microsoft Tra...など、複数の翻訳エンジンをサポートしています。
8ヶ月前
023.8K
自动爬取小说并生成多角色有声书的工具

小説を自動的にクロールし、多文字のオーディオブックを生成するツール

概論 Auto-Audio-BookはGitHubでホストされているオープンソースプロジェクトです。ウェブサイトから小説の内容を自動的にクロールし、複数のキャラクターの声を持つオーディオブックに変換します。開発者 zqq-nuli Python 3.1...
7ヶ月前
023.8K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架

AIEditor: 複数のフロントエンドフレームワークをサポートするAI駆動型リッチテキストエディタの作成

包括的な紹介 AIEditorは、Webコンポーネント開発に基づいて、Vue、React、Angularおよび他のほとんどすべての主流のフロントエンドフレームワークをサポートしているAI駆動型の次世代リッチテキストエディタです。PCのWebと...
10ヶ月前
023.7K
Rankify:支持信息检索与重排序的Python工具包

Rankify: 情報検索と並び替えをサポートするPythonツールキット

一般的な紹介 Rankifyは、オーストリアのインスブルック大学のデータサイエンスグループによって開発されたオープンソースのPythonツールキットである。情報検索、並べ替え、検索拡張生成(RAG)に焦点を当て、統一されたフレームワークを提供している。このツールキットには40の検索済みベンチマークが組み込まれている。
7ヶ月前
023.7K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: ほぼすべてのビデオプラットフォームをサポートするコマンドライン動画ダウンローダー

概要 Luxは、Goで書かれた高速でシンプルなビデオダウンロードライブラリとコマンドラインツールです。YouTube、Bilibili、Youkuなど、複数のウェブサイトからの動画ダウンロードをサポートしています。Luxは、マルチスレッドダウンロードなど、様々なダウンロードオプションと機能を提供します。
9ヶ月前
023.7K