AIオープンソースプロジェクト

合計1020記事
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher:完全な調査レポートを書くための自動詳細調査ツール

概要 OpenDeepResearcherは、人工知能技術によって研究効率を向上させるために設計されたオープンソースの自動ディープリサーチツールです。プロジェクトはmshumerによって開発され、GitHubでホストされています。OpenDeepResear...
4ヶ月前
02.8K
InstantID:上传一张图片,迁移人像特征来生成不同风格图片

InstantID:画像をアップロードし、さまざまなスタイルの画像を生成するためにポートレート機能を移行する。

包括的な紹介 InstantIDは、1枚の参照ID画像を使用して、高い忠実度を確保しながら、パーソナライズされたスタイルやポーズの画像を数秒で生成することに焦点を当てた先進技術です。この技術は、顔画像とランドマークマップを統合することで、拡散モデルに基づいたソリューションを使用しています。
12ヶ月前
02.8K
Agent Inbox:与AI智能体进行人机交互的管理界面

エージェント・インボックス:AIインテリジェンスとのヒューマンコンピュータインタラクションのための管理インターフェース

概論 Agent InboxはLangChainチームによって開発されたオープンソースプロジェクトで、AIインテリジェンスと対話するための新しいユーザー体験を提供します。このプロジェクトにより、ユーザーは一元化されたインターフェイスを通して、複数のAIインテリジェンスとのインタラクションを管理し、最適化することができます。
7ヶ月前
02.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator:ウェブコンテンツをAIでRSSフィードに変換するツール

概要 AI RSSは、AI技術によりウェブコンテンツをRSSフィードに変換する革新的なツールです。ブラウザ・プラグインとサーバー・サイドの2つの主要部分から構成されています。ブラウザプラグインでは、ウェブページからリストを選択し、構造化データ記述(SDD)ファイルを生成することができます。
7ヶ月前
02.8K
Ovis:视觉与文本对齐模型,精准反推图像提示词

Ovis:画像手がかり語の正確なバックプロパゲーションのための視覚的・テキスト的アライメントモデル

一般的な紹介 Ovis (Open VISion) は、アリババの国際デジタル商取引グループのAIDC-AIチームによって開発され、GitHubでホストされているオープンソースのマルチモーダル大規模言語モデル(MLLM)です。このモデルは、革新的な構造埋め込みアライメント技術を使用して、視覚化...
5ヶ月前
02.8K
Atomic Agents:构建轻量级模块化AI智能体框架

アトミック・エージェント:軽量モジュール型AIインテリジェンス構築のためのフレームワーク

概論 Atomic Agentsは、エージェントAIパイプラインとアプリケーションを構築するためのアトミティシティ(atomicity)のコンセプトに基づいて設計された、非常に軽量でモジュール化されたフレームワークです。このフレームワークは、強力なアプリケーションを作成するために組み合わせることができるツールとエージェントのセットを提供します。このフレームワークは、Instruc...
8ヶ月前
02.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent:LLMとEKG(業界知識)によって駆動される新しいエージェントオーケストレーションフレームワーク

概要 muAgent は、Ant Group が開発した革新的なマルチインテリジェントフレームワークです。このフレームワークは、マルチインテリゲンチャ、ファンクションコール、コードインタープリタ、およびその他のテクノロジーと連携し、キャンバスのドラッグアンドドロップと簡単なテキスト記述によって、ユーザが人間の指導の下で様々な複雑な標準操作手順(SOP)を実行するのを支援します。
9ヶ月前
02.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: HTML URLから本文データを抽出し、プレーンテキスト/マークダウンを出力する。

概要 magic-htmlは、HTMLから本文領域のコンテンツを抽出するプロセスを簡素化するために設計されたPythonライブラリです。複雑なHTML構造を扱う場合でも、単純なウェブページを扱う場合でも、このライブラリはユーザーに便利で効率的なインターフェースを提供することを目的としています。マルチモーダルな抽出をサポートしています。
11ヶ月前
02.8K
Knowledge Table:高效提取与探索结构化数据的开源工具

知識テーブル:構造化データの効率的な抽出と探索のためのオープンソースツール

包括的な紹介 ナレッジテーブル(Knowledge Table)は、非構造化ドキュメントから構造化データを抽出し、探索するプロセスを簡素化するために設計されたオープンソースプロジェクトです。ユーザは、自然言語クエリインタフェースを通して、表やグラフのような構造化された知識表現を作成することができる。このツールは、抽出のカスタマイズをサポートしています。
10ヶ月前
02.8K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: リアルな似顔絵を生成するオープンソースツール

一般的な紹介 FantasyTalkingは、Fantasy-AMAPチームによって開発されたオープンソースプロジェクトで、オーディオドライブを通してリアルなトーキングポートレート動画を生成することに焦点を当てています。このプロジェクトは、高度なビデオ拡散モデルWan2.1とオーディオエンコーダWa...
3ヶ月前
02.8K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: macOSデバイスのデスクトップ操作を自動化するAIインテリジェンス

概論 mac assistantはmacOSのために設計されたAI知能体プロジェクトであり、ネイティブソフトウェアとウェブ機能を組み合わせることでユーザー操作を簡素化することを目的としている。このプロジェクトは現在OpenAIとGEMINIのAPIをサポートしており、将来的には...
6ヶ月前
02.8K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: 他のウェブページでChatGPTを動作させるブラウザプラグイン

一般的な紹介 ChatGPT Boxは、ChatGPTをユーザーのブラウザに深く統合するために設計されたオープンソースのブラウザ拡張機能です。josStorerによって開発されたこのツールは、複数の言語をサポートし、任意のページ上でチャットペアを呼び出すなどの様々な機能を提供します...
4ヶ月前
02.8K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

概要 Agentic Securityは、開発者やセキュリティ専門家に包括的なファズテストと攻撃技術を提供するために設計されたオープンソースのLLM(Large Language Model)脆弱性スキャンツールです。このツールは、カスタムルールセットやエージェントベースの攻撃をサポートし、LLM APを統合することができます。
6ヶ月前
02.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev:多言語対応のコード自動生成・デバッグツール

概要 AutoDevは、Unit Meshチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、人工知能技術によって開発者のプログラミング効率を向上させることを目的としています。強力なコーディングアシスタントであり、Ja...を含む複数のプログラミング言語をサポートしている。
6ヶ月前
02.8K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略

包括的な紹介 zChunkは、ZeroEntropyによって開発された、一般的なセマンティック・チャンキングのソリューションを提供する新しいチャンキング戦略です。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索を高いレベルで維持することを保証します。
6ヶ月前
02.8K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿

LAMBDA:下書きメール(Gmail)の返信を迅速に生成するローカライズされたAIメール自動化システム

概要 LAMBDA(Local Auto MailBox Draft Assistant)は、ユーザーのメールスタイルから学習し、Gmailの受信トレイにある未読メールすべてに下書きを生成するように設計された、ローカライズされたAIメール自動化システムです...
8ヶ月前
02.8K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: AIアプリケーションのためのモデルコンテキストプロトコル(MCP)統合ツール

概論 Klavis AIは、AIアプリケーションが外部のツールやデータソースと動的に接続することを可能にするオープンスタンダードであるモデルコンテキストプロトコル(MCP)の使用と統合を簡素化することに焦点を当てたオープンソースプラットフォームです。
3ヶ月前
02.8K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

概要 LiteAvatarはHumanAIGCチーム(Aliの一部)によって開発されたオープンソースツールで、音声によって駆動される2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム(fps)で動作し、特に...
6ヶ月前
02.8K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: デスクトップとブラウザの自動化のための自然言語によるインテリジェント・ボディ・ワークフローの構築

概論 Eko は、自然言語記述によって効率的なインテリジェントエージェントワークフローを構築するために設計された、プロダクショングレードの JavaScript フレームワークです。開発者が深いプログラミングをすることなく、AI 技術を使って日常的なタスクを自動化できるよう設計されています。
5ヶ月前
02.8K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX:マルチモーダル・マクロモデルを用いた胸部X線写真解析のためのインテリジェントボディ

包括的な紹介 MedRAXは、胸部X線(CXR)解析用に設計された最先端のAIインテリジェンスです。最先端のCXR解析ツールとマルチモーダル大規模言語モデルを統合し、追加トレーニングなしで複雑な医療クエリを動的に処理します。
5ヶ月前
02.8K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: ドキュメントを構造化データに抽出・分類し、ドキュメント処理プロセスを最適化します。

包括的な紹介 ExtractThinkerは、大規模言語モデル(LLM)を使用してドキュメントから構造化データを抽出・分類し、シームレスなORMライクなドキュメント処理ワークフローを提供する、柔軟なドキュメントインテリジェンスツールです。LLMを含む様々なドキュメントローダーをサポートしています。
7ヶ月前
02.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: Geminiマルチモーダル対話サイトのサーバーレス展開

一般的な紹介 Gemini Playgroundは、ユーザーが迅速にマルチモーダル対話サイトを展開するために設計されたオープンソースプロジェクトです。このプロジェクトは、技術的なクロールエビによって開発され、デプロイを完了するために10秒でGemini API Keyの使用をサポートしています。ユーザが...
6ヶ月前
02.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。
6ヶ月前
02.7K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: 複数のデータソースを迅速に統合するカスタムチャットボット

概要 OpenChatは、大規模言語モデル(LLM)の使用を簡素化するために設計されたユーザーフレンドリーなチャットボットコンソールです。OpenChatは、2ステップのセットアッププロセスを提供することで、ユーザーが簡単に複数のカスタムチャットボットを作成し、管理することを可能にします。このプラットフォームはG...
7ヶ月前
02.7K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter:ウィズダム・スペクトラムは、超長文を生成するための強力なモデルを発表し、1回の会話で10,000語以上の生成に対応。

包括的な紹介 LongWriter は、清華大学データマイニング研究グループ (THUDM) によって開発された強力な長文生成ツールです。このツールは、先進的なロングコンテクスト言語モデル(LLM)に基づいており、10,000語以上の長文を生成することができます。
8ヶ月前
02.7K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度

VoAPI:高付加価値AIモデル転送インターフェース管理システム、公式サイトがAPI枠を毎日無料提供

総合紹介 VoAPIは、知名度が高く高性能な新しいAIモデルインターフェース管理・配信システムであり、主に個人または企業の内部管理と配信チャネルに使用されます。NewAPIに基づいて開発されたこのシステムは、豊富な機能モジュールと最適化されたユーザーインターフェースを提供します。
9ヶ月前
02.7K
Orion:小米开源的端到端自动驾驶推理与规划框架

Orion:シャオミのオープンソースのエンド・ツー・エンドの自動運転推論・計画フレームワーク

包括的な紹介 OrionはXiaomi Labsによって開発されたオープンソースプロジェクトで、エンドツーエンド(E2E)自律走行技術に焦点を当てています。Orionは、視覚言語モデリング(VLM)と生成プランナーによって、従来の自律走行手法の複雑なシナリオにおける因果推論が不十分であるという問題を解決する。
4ヶ月前
02.7K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App: リアルタイムのウェブ検索と知的推論のためのオープンソースチャットアプリ

包括的な紹介 Exa & Deepseekチャットアプリは、オープンソースのスマートチャットアプリです。主な機能には、ExaのAPIを使用したリアルタイムのウェブ検索や、インテリジェントなDeepseek R1言語モデルの使用などがあります。
6ヶ月前
02.7K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI:インテリジェントなドキュメントQ&Aシステムの構築と、プライベートなウェブサイド・ナレッジベースのシンプルな構築

総合紹介 RAG Web UIは、RAG(Retrieval Augmented Generation)技術に基づいた知的対話システムです。企業や個人が独自の知識ベースに基づいてインテリジェントなQ&Aシステムを構築するのに役立ちます。文書検索と大規模な言語モデルを組み合わせることで、RAG Web UIは正確で信頼性の高い...
7ヶ月前
02.7K
Vanna:利用RAG技术将文本生成精准SQL查询

Vanna: RAG技術を使ったテキストからの正確なSQLクエリの生成

包括的な紹介 VannaはMITライセンスのオープンソースPythonフレームワークで、RAG(Retrieval Augmented Generation)技術を使ってSQLクエリを生成することに重点を置いている。ユーザはRAGモデルを訓練し、自分のデータに適用し、質問をすると、Vannaは適切なSQLクエリを返す。
7ヶ月前
02.7K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: 動画のローカル編集用テキストプロンプト オープンソースプロジェクト

一般的な紹介 VideoGrainは、xAIチームによって開発され、GitHubでホストされているマルチグラニュラービデオ編集に焦点を当てたオープンソースプロジェクトです。このプロジェクトは論文「VideoGrain: Modulating Space-Tim...
5ヶ月前
02.7K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境

ChainForge:大規模言語モデルヒントの有効性をテスト・評価するオープンソースのビジュアルプログラミング環境

概要 ChainForgeは、大規模言語モデル(LLM)のキューの有効性をテスト・評価するために設計されたオープンソースのビジュアルプログラミング環境です。データフローキューイングエンジニアリング環境を提供し、LLM応答における様々なキューの品質を素早く探索・分析することができます。
8ヶ月前
02.7K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain:リアルタイム音声テキスト化と話し言葉の最適化

概論 WhisperChainはGitHubでホストされているAIベースのオープンソースプロジェクトで、開発者のクリス・チョイが主導している。主に音声をテキストに変換し、AI技術によって自動的に表現を最適化し、冗長な部分を削除するために使用される。
5ヶ月前
02.7K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraphスーパーバイザー:スーパーバイジングインテリジェンスを用いたマルチインテリジェンスコラボレーション管理ツール

概要 LangGraph SupervisorはLangGraphフレームワークをベースとしたPythonライブラリで、マルチインテリジェントな身体システムの作成と管理のために設計されています。このライブラリは、中央の監督エージェントを通して複数の専門化されたエージェントの作業を調整し、通信の流れやタスクの分割を確実にします...
6ヶ月前
02.7K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT:衣服のディテールの信憑性を高める高忠実度AIバーチャルフィッティングツール

包括的な紹介 FitDiTは、拡散トランスフォーマー(Diffusion Transformers)に基づいた高忠実度のバーチャルフィッティングシステムである。Tencent AI Labによって開発されたこのプロジェクトは、衣服の詳細を表示するという従来のバーチャルフィッティングシステムの限界に対処することを目的としている。
7ヶ月前
02.7K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: 局所的知識を利用した深層推論検索のためのオープンソースプロジェクト

包括的な紹介 Deep Searcherは、大規模言語モデル(LLM)とベクトルデータベースを組み合わせた強力なツールで、プライベートデータに基づいて検索、評価、推論を行い、精度の高い回答と包括的なレポートを提供するように設計されています。企業のナレッジマネジメントに適しています。
6ヶ月前
02.7K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine:オープンソースエンジン、FLUXの低既存デプロイメント用、Wan 2.1

一般的な紹介 DiffSynth-EngineはModelScopeによって立ち上げられたオープンソースプロジェクトで、GitHubでホストされています。拡散モデリング技術に基づいており、画像や動画を効率的に生成することに重点を置き、開発者が本番環境でAIモデルを展開するのに適しています...
5ヶ月前
02.7K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

フラグメント:AnthropicのClaude Artifacts、Vercel v0、GPT Engineerのようなアプリケーションのオープンソース版。

概論 Fragments by E2Bは、Next.jsをベースとした、AIのみで生成されるアプリケーションを構築するためのテンプレートを提供するオープンソースプロジェクトです。このプロジェクトは、AIアプリケーションの開発プロセスを簡素化し、高速化するためにE2Bによって開発されました。このプロジェクトには、さまざまな現在のAIが統合されています。
9ヶ月前
02.7K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat:マルチプラットフォームAIモデルを統合したシンプルなWebチャットインタフェース(デプロイメント不要)

OrionChatは、複数の主流AIモデルと対話するための統一されたプラットフォームをユーザーに提供する、ウェブベースのAIチャット・インターフェースです。このプロジェクトは、Ollama(ローカルで動作)、OpenAI GPT、Google Gemi...を含む幅広いAIモデルをサポートしています。
8ヶ月前
02.7K
FramePack:6G低显存快速生成长视频的开源项目

FramePack:6Gの低グラフィックスメモリは、長いビデオオープンソースプロジェクトの高速成長

一般的な紹介 FramePackはオープンソースのビデオ生成ツールで、ビデオ拡散技術をより実用的にすることに重点を置いている。独自の次フレーム予測ニューラルネットワークによって入力フレームを固定長に圧縮することで、生成作業負荷をビデオの長さから切り離します。つまり、長い動画を生成する場合でも、必要な動画メモリは...
3ヶ月前
02.7K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: 人物の衣服をタイル状の衣服表示画像として抽出するAIツール

包括的な紹介 TryOffAnyoneは、Eコマース分野における衣服ディスプレイの課題を解決するために特別に設計された画期的なAI画像処理ツールです。TryOffAnyoneは、実際に服を着ている人の写真を、レイフラットディスプレイ効果のある画像にインテリジェントに変換することができ、この技術は最新のLatent Dif...
7ヶ月前
02.7K
FinGPT:开源金融大语言模型平台,助力金融分析与预测

FinGPT: 金融分析と予測のためのオープンソース金融ビッグ言語モデリング・プラットフォーム

概論 FinGPTは、AI4Finance財団によって開発されたオープンソースの金融ビッグ言語モデリング・プラットフォームであり、複雑な金融タスクを解決し、フィンテックにおけるイノベーションを推進するために金融セクター向けに設計されている。FinGPTは、軽量適応技術と強化学習アプローチを利用している。
7ヶ月前
02.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具

MM-EUREKA:視覚的推論を探求するマルチモーダル強化学習ツール

MM-EUREKAは、上海交通大学の上海人工知能研究所とその他の関係者によって開発されたオープンソースプロジェクトです。ルールベースの強化学習技術により、テキスト推論機能をマルチモーダルシナリオに拡張し、モデルによる画像とテキスト情報の処理を支援します。このツールのコア...
5ヶ月前
02.7K
Cerebr:与网页内容对话的开源浏览器插件

Cerebr:ウェブコンテンツと対話するオープンソースのブラウザ・プラグイン

概要 説明 Cerebrは、生産性と学習体験を向上させるために設計された、Chrome用の強力なAIアシスタント拡張機能です。Cerebrは、クリーンで効率的なブラウザAIアシスタントの必要性からゼロから設計され、ミニマルなデザインと強力な...
4ヶ月前
02.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: リアルタイムの音声対話AIアプリケーションを構築するためのNext.jsテンプレート

概要 OpenAI Realtime API Next.jsは、Next.jsフレームワークをベースとしたオープンソースプロジェクトで、開発者がリアルタイム音声AIアプリケーションを素早く構築できるように設計されています。このプロジェクトは、OpenAIのリアルタイムAPIとWebRTC技術を統合しています。
7ヶ月前
02.7K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: 効率的なデータ分析とAIアプリケーションのためのデータサイエンティスト向けPythonオープンソースライブラリ

概要 TaipyはAvaiga社によって開発された強力なPythonライブラリで、データ科学者や機械学習エンジニアがデータ駆動型のWebアプリケーションを迅速に構築・展開できるように設計されています。
8ヶ月前
02.7K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: AI対話とコード実行を統合したオンラインデータ分析フォーム

概要 Quadraticは、AI、コード、データ接続機能を組み合わせたオープンソースのスマート・スプレッドシート・ツールで、強力なデータ処理と分析機能をユーザーに提供するように設計されています。Python、SQL、Rustなどのプログラミング言語をサポートすることで、Quadratic...
6ヶ月前
02.7K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: パーソナライズされた個人指導を提供するAIツール, Llama 3.1で構築されたオープンソースのAI個人指導プロジェクト

一般的な紹介 Llama Tutorは、Llama 3.1上に構築されたオープンソースのAIパーソナル・チューター・プロジェクトで、パーソナライズされた学習体験をユーザーに提供するように設計されています。Together AI、Next.js、T...などの複数の技術スタックを統合することで、学習者のニーズに合わせた学習体験を提供します。
9ヶ月前
02.7K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker:デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

概論 Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出す。このシステムは、Whisper、Linly、Micros...といった様々な技術を統合しています。
6ヶ月前
02.7K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos:ワールド・ベース・モデル、物理世界のAIベース・モデルを構築するためのプラットフォーム

包括的な紹介 NVIDIA Cosmosは開発者向けのワールドベースのモデリング・プラットフォームであり、物理AI開発者がより良く、より速く物理AIシステムを構築できるように特別に設計されています。このプラットフォームは、拡散モデルや自己回帰モデルなど、さまざまな訓練済みモデルを提供します。
7ヶ月前
02.7K
promptfoo:提供安全可靠的LLM应用测试工具

プロンプトフー:安全で信頼性の高いLLMアプリケーションテストツールの提供

包括的な紹介 promptfooは、大規模言語モデル(LLM)アプリケーションの評価とレッドチームテストに特化したオープンソースのコマンドラインツールおよびライブラリです。信頼性の高いプロンプト、モデル、検索ベースの生成(RAG)を構築するためのツール一式を開発者に提供します。
6ヶ月前
02.7K
Docs:开源的协作笔记和文档管理工具

Docs: オープンソースの共同ノート・文書管理ツール

概要 Docs は、suitenumerique チームによって開発されたオープンソースの共同ノート作成および文書管理プラットフォームです。DjangoとReactの技術を使って構築されており、ユーザーがメモを取ったり、ドキュメントを管理したりするのに役立つ使いやすいツールを提供することを目標としています。
5ヶ月前
02.7K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人

DeepSeek-RAG-Chatbot: ローカルで動作する DeepSeek RAG チャットボット

一般的な紹介 DeepSeek-RAG-Chatbotは、GitHubでホストされているDeepSeek R1モデルに基づいて構築されたオープンソースのチャットボットプロジェクトで、開発者のSaiAkhil066によって作成されました。DeepSeek-RAG-Chatbotは、拡張された生成...
6ヶ月前
02.7K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D:高解像度3Dモデリングデジタル資産を生成するAIプラットフォーム

概論 Neural4Dは、ユーザーが簡単なテキストや画像を入力するだけで、高品質な3Dモデルやアニメーションを素早く生成できるよう支援することに重点を置いた、AIベースの革新的なプラットフォームです。DreamTech社によって開発されたこのプラットフォームは、世界をリードするエンドツーエンドの大規模3Dモデル生成技術に依存しています。
6ヶ月前
02.7K
Meeting:本地实时转录和生成会议纪要的开源客户端

ミーティング:オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes(別名Meetily)は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...
5ヶ月前
02.7K
Extract.fun:开源网站图片提取工具,利用Cloudflare浏览器渲染

Extract.fun: オープンソースのウェブサイト画像抽出ツール , Cloudflareのブラウザレンダリングを使用

概要 Extract.funは、Cloudflareのブラウザレンダリング機能を使用して、あらゆるWebサイトから画像を抽出する最新のWebアプリケーションです。Remix上に構築され、Cloudflare Pages上に配置されたこのアプリケーションは、高速な画像抽出を提供します。
9ヶ月前
02.7K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: フロントエンド設計のためのオープンソースCursor、Reactアプリケーションの設計とコードの公開

一般的な紹介 Onlookはデザイナーと開発者のために作られたオープンソースのデザインツールで、ユーザーは実行中のReactアプリケーションで直接デザインし、デザインの変更をコードに変換することができます。このツールは、Figma や Webf... に似た直感的なビジュアル編集体験を提供します。
6ヶ月前
02.7K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1:1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。
6ヶ月前
02.7K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: 対話、投稿生成、翻訳のためのWordPress AIアシスタントプラグイン

総合紹介 WordPress AI Assistant Plugin (wp-ai-chat)は、AI対話、記事生成、記事要約、記事翻訳、コンテンツ読み上げなど、様々なAI機能をユーザーに提供するために設計されたオープンソースのWordPressプラグインです。このプラグインは、複数のAIとのドッキングをサポートしています。
6ヶ月前
02.7K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI:画像要素の位置を正確にコントロール、ComfyUIをベースにした直感的なグラフィカル・インターフェース

概論 GLIGEN GUIはComfyUIをベースにした直感的なグラフィカル・インターフェースで、画像中のオブジェクトの位置を正確に指定できる新しいテキスト-イメージ・モデルであるGLIGENモデルの使用を簡素化するように設計されている。GLIGE...
11ヶ月前
02.7K
LlamaEdge:本地运行和微调LLM的最快捷方式

LlamaEdge:LLMをローカルで実行し、微調整する最も迅速な方法!

概要 LlamaEdgeは、ローカルデバイスやエッジデバイス上で大規模な言語モデル(LLM)を実行し、微調整するプロセスを簡素化するために設計されたオープンソースプロジェクトです。このプロジェクトはLlama2ファミリーのモデルをサポートし、OpenAI互換のAPIサービスを提供します。
7ヶ月前
02.7K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

ミニカバー:ブログ、ショートビデオ、ソーシャルメディアなどにパーソナライズされたカバーを作成するために設計されたオンラインカバーメーカー!

概要 Mini-Coverは、ブログやショートビデオ、ソーシャルメディアなどのプラットフォーム用にパーソナライズされたカバーを生成するために設計されたオープンソースのオンラインカバー生成ツールです。JLinMrによって開発されたこのツールは、シンプルで効率的なソリューションを提供し、ユーザーのニーズに合ったカバーを素早く生成することを目的としています。
8ヶ月前
02.7K
TubeTube:自部署YouTube视频下载工具

TubeTube: 自己展開型YouTube動画ダウンロードツール

概要 TubeTubeはMattBlackOnlyによって開発されたオープンソースのYouTube動画ダウンロードツールです。このツールは、コアダウンロードエンジンとしてyt-dlpを使用し、マルチスレッドダウンロードをサポートし、同時に複数のビデオをすばやくダウンロードすることができます。ユーザーはyam...
6ヶ月前
02.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Deepseek-V3とPlayHT TTSに基づくNotebookLMのオープンソース実装

概論 オープンソースNotebookLMは、Deepseek-V3の言語理解能力とPlayHTの音声合成技術を組み合わせた革新的な人工知能プロジェクトであり、インテリジェントなノート作成対話システムを目指しています。このプロジェクトは、Build Fast社によって開発されました。
7ヶ月前
02.7K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包

Sketch-Gen: 高品質の線画とスケッチを生成、イメージキューワードをバックプロパゲート、ワンクリックパッケージインストール

概要 Sketch-Genは、アーティストやデザイナーが高品質な線画やスケッチを素早く生成できるように設計された、AI技術ベースの線画・スケッチ生成ツールです。Paints-UNDOプロジェクトから生まれたこのツールは、高度な機械学習モデルを使用しています。
8ヶ月前
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

包括的な紹介 CogVLM2は清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...
6ヶ月前
02.7K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。

包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース(GUI)を提供します。
8ヶ月前
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak:LLMの脆弱性を検出し、安全な生成AIを実現するオープンソースツール

包括的な紹介 NVIDIA Garakは、大規模言語モデル(LLM)の脆弱性を検出するために特別に設計されたオープンソースツールです。静的、動的、適応的なプロービングを通して、イリュージョン、データリーク、ヒントインジェクション、エラーメッセージ生成、有害コンテンツ生成などの複数の弱点がないかモデルをチェックします。
9ヶ月前
02.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni:テキスト、画像、音声のマルチモーダル理解と解析をサポートするエンドサイド・マルチモーダル理解モデル

総合紹介 Infini-Megrezは、ハードウェアとソフトウェアの共同設計により、効率的なマルチモーダル理解と解析の実現を目指し、不問の中核ドーム(Infinigence AI)が開発したエッジ・インテリジェンス・ソリューションである。プロジェクトの中核となるのは、グラフをサポートするMegrez-3Bモデルである。
7ヶ月前
02.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink:質の高い長文エッセイを作成するためのライティング・フレームワークで、外部の知識を検索し、それを振り返り、段階的に知識ツリーを構築する。

包括的な紹介 OmniThinkは革新的なマシンライティングフレームワークで、人間の認知プロセスの反復的な拡張と反映を模倣することで、高品質の長文エッセイを生成するように設計されています。OmniThinkは、知識の境界を広げ、豊かで深い情報を生成することに重点を置いています。
7ヶ月前
02.7K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V:多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。深く圧縮された可変オートエンコーダ(VAE)により、このモデルは...
6ヶ月前
02.7K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

薄板-スプライン-モーションモデル:静的ポートレートマップ参考動画 ポートレートモーション生成動画

概論 Thin-Plate-Spline-Motion-Model は、CVPR 2022 で発表された画期的な画像アニメーション生成プロジェクトである。このプロジェクトは、薄板スプライン変換の理論に基づいており、走行映像に基づく静止画から高品質な動きを実現することができる...
7ヶ月前
02.7K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

AI投資システム:市場データを分析するマルチインテリジェンスシステムを利用したA株投資の自動意思決定システム

総合紹介 A_Share_investment_Agentは、マルチインテリジェンスシステムに基づくA株投資判断支援システムです。このシステムは、市場データの分析、銘柄の本質的価値の計算、市場心理の分析、複数の協調知能を通じたファンダメンタルズデータの分析を行うように設計されており、...
7ヶ月前
02.7K
基于Cloudflare Worker的AI图片生成脚本

Cloudflare WorkerベースのAI画像生成スクリプト

概論 CloudFlare-AI-ImageはGitHubでホストされているオープンソースプロジェクトで、Cloudflare Workersプラットフォームを通じて無料のAI画像生成サービスを提供している。CloudFlare-AI-Imageは、CloudFlare Workersプラットフォームを通じて無料のAI画像生成サービスを提供するオープンソースプロジェクトです。
4ヶ月前
02.7K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM:マルチインテリジェント・ボディ・アプリケーション構築のためのShangtangオープンソース・ローコード開発ツール

包括的な紹介 LazyLLMはLazyAGIチームによって開発されたオープンソースツールで、マルチインテリジェンス大規模モデルアプリケーションの開発プロセスを簡素化することに重点を置いています。ワンクリックのデプロイと軽量なゲートウェイ機構により、開発者が複雑なAIアプリケーションを素早く構築できるよう支援し、面倒なエンジニアリングの設定を省きます。
6ヶ月前
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介 中国語DeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された、110Kのデータを含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的なデータだけでなく、一般的なタイプのデータも多数含まれている。
6ヶ月前
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツール

一般的な紹介 PDF Craftは、書籍のPDFをスキャンしてMarkdown形式に変換するために設計されたオープンソースツールです。このツールはoomol-labによって開発され、電子書籍を整理したいユーザのためにGitHubでホストされています。このツールは、以下の方法で動作します。
5ヶ月前
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント

総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル(DeepSeek、Gemini、Tongyi Thousand Questionsなど)をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...
6ヶ月前
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: ノードオーケストレーションに基づくAIモデルのワークフロー可視化クライアント

概要 NodeToolは、AI愛好家、開発者、データサイエンティスト、クリエイターにシンプルで直感的なインターフェイスを提供するように設計された革新的なAIオーサリングプラットフォームです。アーティスト、開発者、初心者を問わず、NodeToolはクリエイティブなプロトタイプを素早く作成するのに役立ちます。
8ヶ月前
02.7K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW:拡張可能なプラグインを備えた、フル機能の軽量クロスプラットフォームAIクライアント

包括的な紹介 AIaW(AI as Workspace)は、フル機能で軽量かつ拡張可能なソリューションを提供するために設計された次世代AIクライアントです。このプラットフォームは、OpenAI、Anthropic、Googleを含む幅広いサービスプロバイダをサポートし、...
8ヶ月前
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: AIインテリジェンスをSolanaプロトコルに接続するためのオープンソースツールキット

概要 Solana Agent Kitは、AI知能をSolanaブロックチェーン・プロトコルにシームレスに接続するために設計されたオープンソースのツールキットである。このキットにより、AI研究者と暗号通貨開発者の双方が、モデル訓練された知的体を使用して、ブロックチェーン上で...
6ヶ月前
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

WeChat Markdownエディタ:シンプルで効率的なWeChatグラフィックレイアウトツール、WeChat公開番号に記事を貼り付けるためのキー

総合紹介 WeChat Markdown Editor (WeChat Markdown Editor)は、ユーザーが簡単に美しいWeChat投稿を作成できるように設計された、非常に簡潔なWeChatグラフィックレイアウトツールです。このエディタはすべての基本的なMarkdown ...
7ヶ月前
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG(Retrieval Augmentation Generation)システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。
6ヶ月前
02.7K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp:カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

概論 FoloUpは、企業向けにAIを活用した音声面接ソリューションを提供するために設計されたオープンソースのプラットフォームです。FoloUpを利用することで、企業は職務内容に合わせてカスタマイズした面接質問を素早く生成し、AIによる自然な会話形式の面接を実施することができます。また、このプラットフォームは、詳細な面接分析も提供します。
5ヶ月前
02.7K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)

Anon-Kode:コマンドラインAIコード・アシスタント(クロード・コードのコード分解)

一般的な紹介 Anon-Kodeは、開発者のDaniel NakovによってGitHubで公開された、端末ベースの操作のためのオープンソースのAIコードアシスタントです。言語モデルを統合することで、OpenAIスタイルのAPIをサポートするように設計されています。
5ヶ月前
02.6K