AI开源项目

共 1020 篇文章

排序

浏览收藏

Agent S：像人类一样操作电脑的开源智能体框架

综合介绍 Agent S 是由 Simular AI 开发的开源框架，让智能体通过图形用户界面（GUI）像人类一样操作电脑。它使用多模态大语言模型和经验学习技术，能完成浏览网页、编辑文档、使用软件等任...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

093.6K

BabelDOC：将PDF文档翻译成双语对照的开源工具

综合介绍 BabelDOC 是一个开源工具，专门用来把 PDF 文档翻译成双语对照格式。它由 funstory-ai 团队开发，托管在 GitHub 上，主要服务于需要处理外语文档的用户，比如研究人员...

最新AI资源 # AI开源项目 # AI翻译

10个月前

0109.3K

Text2Voice：基于硅基流动API的文本转语音图形界面

综合介绍 Text2Voice 是一个开源工具，基于硅基流动 API 提供文本转语音功能，最大的特点是带有简洁的图形用户界面（GUI）。它由开发者 Sheldon Lee 在 GitHub 上创建，让...

最新AI资源 # AI开源项目 # AI文本转语音

12个月前

056.3K

FreeAI：基于Pollinations封装的的免费AI工具

综合介绍 FreeAI 是一个基于 Pollinations.AI API 的开源 AI 应用平台，提供免费且无限制的 AI 聊天助手、图像生成和语音合成服务。这个项目由开发者 Azad-sl 在 G...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

1年前

076.9K

优化代码生成和展示的Open WebUI

综合介绍 Open WebUI Artifacts Overhaul 是基于 Open WebUI 的一个分支项目，由开发者 Nick Tonjum 开发。它是一个开源工具，专注于提升 AI 生成代码...

AI新闻 # AI开源项目 # AI本地化聊天应用

1年前

073.9K

OpenAvatarChat：模块化设计的数字人对话工具

综合介绍 OpenAvatarChat 是由 HumanAIGC-Engineering 团队开发的一个开源项目，托管在 GitHub 上。它是一个模块化的数字人对话工具，用户可以在单台 PC 上运行...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

071.7K

uniOCR：跨平台开源的文字识别工具

综合介绍 uniOCR 是一个开源的文字识别工具，由 mediar-ai 团队开发。它基于 Rust 语言编写，支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...

最新AI资源 # AI开源项目 # OCR

1年前

079.8K

Serena：语义检索和编辑代码的免费MCP工具

综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具，托管在 GitHub 上。它是一个强大的代码助手，可以直接在你的代码库中工作，帮助开发者分析、编辑和执行代码。Seren...

最新AI资源 # AI开源项目 # AI编程 # MCP服务

1年前

0186.4K

AudioX：参考文本、图像、视频生成音频和音乐

综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目，官方论文发布于 arXiv（编号 2503.10522）。它基于扩散变换器（Diffusion Transf...

最新AI资源 # AI开源项目 # AI音乐

12个月前

085.4K

EasyControl：将人像转为吉卜力风格图像的免费工具

综合介绍 EasyControl 是一个开源项目，项目基于扩散变换器（DiT）架构，提供高效、灵活的图像生成控制。其中，Ghibli Control LoRA 是其特色功能之一，通过仅用 100 张亚...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

054.7K

YOLOE：实时视频检测和分割物体的开源工具

综合介绍 YOLOE 是清华大学软件学院多媒体智能组（THU-MIG）开发的一个开源项目，全称“You Only Look Once Eye”。它基于 PyTorch 框架，属于 YOLO 系列的扩展...

最新AI资源 # AI开源项目 # AI抠图改背景 # 视觉目标检测

1年前

071.2K

集成多种先进语音合成服务的开源运营项目

综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台，由 ItusiAI 团队开发。它支持超过 50 种语言，可以将文字转为自然语音，还能通过上传音频克隆个性化声音。项目整合了 Ope...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI文本转语音

1年前

058.3K

VideoMind：视频按时间戳定位内容与问答的开源项目

综合介绍 VideoMind 是一个开源的多模态AI工具，专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔（Ye Liu）和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...

10个月前

057.9K

SuperCoder：命令行终端运行的智能代码助手

综合介绍 SuperCoder 是一个在终端运行的智能工具，专为程序员设计。它利用 AI 技术，帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源，支...

最新AI资源 # AI开源项目 # AI编程

1年前

057.4K

Emigo：在Emacs中使用AI完成复杂编程任务的助手

综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手，由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型（LLM），帮助程序员在 Emacs 中完成代码分析...

最新AI资源 # AI开源项目 # AI编程

1年前

070.1K

SegAnyMo：从视频中自动分割任意运动物体的开源工具

综合介绍 SegAnyMo 是一个开源项目，由加州大学伯克利分校和北京大学的研究团队开发，包括 Nan Huang 等成员。这个工具专注于视频处理，能自动识别和分割视频中任意运动的物体，比如人、动物或...

最新AI资源 # AI开源项目 # AI抠图改背景 # 视觉目标检测

1年前

063.9K

GenXD：生成任意3D和4D场景视频的开源框架

综合介绍 GenXD 是一个开源项目，由新加坡国立大学（NUS）和微软团队开发。它专注于生成任意 3D 和 4D 场景，解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

058.5K

ChatAnyone：从照片生成半身数字人肖像视频的工具

综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术，从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型，能生成头部动作...

最新AI资源 # AI开源项目 # AI数字人

1年前

061.4K

Search-R1：强化学习训练大模型搜索与推理的工具

综合介绍 Search-R1 是一个开源项目，由 PeterGriffinJin 在 GitHub 上开发，基于 veRL 框架构建。它通过强化学习（RL）技术训练大语言模型（LLM），让模型自主学会...

最新AI资源 # AI开源项目 # 大模型微调

1年前

078.8K

DeepGemini：多模型编排任务并封装为API接口

综合介绍 DeepGemini 是一个开源项目，由开发者 Thomas Sligter 创建。它是一个支持多模型编排的 AI 管理工具，主要特点是能灵活组合多种 AI 模型，并通过 OpenAI 兼容...

最新AI资源 # AI开源项目

10个月前

050.6K

Optexity：用人类演示训练AI执行网页操作的开源项目

综合介绍 Optexity 是一个在 GitHub 上开源的项目，由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务，尤其是网页操作。项目包含三个代码库：Compute...

最新AI资源 # AI开源项目 # 大模型微调 # 桌面自动化智能体

1年前

061.3K

II-Researcher：深度搜索与分步推理解答复杂问题

综合介绍 II-Researcher 是 Intelligent-Internet 团队开发的一款开源人工智能研究工具，托管于 GitHub。它专为深度搜索和复杂推理设计，能通过智能网页搜索和多步骤分...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

053.4K

Cua：让AI代理在macOS/Linux沙盒中安全执行应用

综合介绍 Cua 是一个开源项目，全称“Computer-Use Agent”（计算机使用代理），读作“koo-ah”。它专为 Apple Silicon 设备设计，能创建并运行高性能的 macOS ...

最新AI资源 # AI开源项目

1年前

069.4K

Paper to Podcast：把学术论文转换为多人对话播客

综合介绍 Paper to Podcast 是一个开源工具，专门把学术研究论文转化为生动有趣的播客。它通过人工智能技术，将 PDF 格式的论文变成三个角色——主持、学习者和专家——之间的对话，让复杂的...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

048.3K

Anubis：通过工作量证明干扰AI爬虫抓取

综合介绍 Anubis 是一个由 TecharoHQ 团队开发的开源工具，主要用来保护网站免受 AI 爬虫的侵扰。它在 HTTP 请求中加入 SHA256 工作量证明（Proof-of-Work）挑战...

最新AI资源 # AI开源项目

1年前

071.5K

OmniSQL：将自然语言转化为高质量SQL查询的模型

综合介绍 OmniSQL 是一个开源项目，由 RUCKBReasoning 团队开发，托管在 GitHub 上。它的核心功能是将用户输入的自然语言问题转化为高质量的 SQL 查询语句，帮助用户轻松与数...

最新AI资源 # AI开源项目 # AI数据分析

1年前

069.2K

LatentSync：用音频直接生成唇形同步视频的开源工具

综合介绍 LatentSync 是字节跳动（ByteDance）开发的一个开源工具，托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作，让嘴型与声音精准匹配。项目基于 Stable Di...

最新AI资源 # AI开源项目 # 口型同步

10个月前

0139K

Morphik Core：处理多模态数据的开源 RAG 平台

综合介绍 Morphik Core 是一个开源项目，由 morphik-org 团队开发，托管在 GitHub 上。它以前叫 DataBridge Core，现在更名为 Morphik Core。这个...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

064.4K

基于Workers AI免费将多种文件转为Markdown格式

综合介绍 serverless-markdown-convertor 是一个免费的开源工具，基于 Cloudflare Worker 和 Workers AI 开发，能将多种文件转换为 Markdow...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

055.5K

EditorJumper：Cursor/Trae/Windsurf和JetBrains无缝切换工具

综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件，由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE（如 IntelliJ ...

最新AI资源 # AI开源项目

1年前

062.3K

VirtualWife：支持B站直播和语音互动的二次元数字人

综合介绍 VirtualWife 是一个开源的虚拟数字人项目，由开发者 yakami129 创建。它目前处于孵化阶段，目标是打造一个有“灵魂”的虚拟角色，用户可以像朋友一样与之互动。项目支持 B站直播...

最新AI资源 # AI开源项目 # AI数字人

1年前

054.4K

GPT-Crawler：自动爬取网站内容生成知识库文件

综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具，托管在 GitHub 上。它通过输入一个或多个网站 URL，爬取页面内容，生成结构化的知识文件（output.jso...

最新AI资源 # AI开源项目 # 文档提取与清洗

10个月前

057.4K

MegaTTS3：合成中英文语音的轻量模型

综合介绍 MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具，专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数，轻量高效，支持中英文混合语音生成和语音克隆。项目托管在...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

068.4K

KBLaM：为大模型嵌入外部知识的开源增强工具

综合介绍 KBLaM 是微软开发的一个开源项目，全称是“Knowledge Base augmented Language Model”（知识库增强语言模型）。它通过将外部知识转化为向量并嵌入大模型的...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

061.7K

LangGraph CodeAct：生成代码帮助智能体解决复杂任务

综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架，基于 CodeAct 架构（详见论文 arXiv:2402.01030）。它通过生成...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

070.3K

BrowserTools MCP：实时监控浏览器活动的MCP服务

综合介绍 BrowserTools MCP 是一个开源项目，由 AgentDeskAI 团队开发。它通过 Chrome 扩展和 Node.js 服务，让 AI 能实时监控浏览器活动，包括日志、网络请求...

最新AI资源 # AI开源项目 # MCP服务

1年前

084.9K

AgentLaboratory：利用智能代理完成科研全流程的开源工具

综合介绍 AgentLaboratory 是一个开源工具，托管在 GitHub 上，由 Samuel Schmidgall 开发。它利用大语言模型（LLM）驱动的智能代理，帮助研究人员完成科研全流程...

最新AI资源 # AI开源项目 # AI教育工具 # 论文

1年前

059K

Kilo Code：具有简洁使用体验的Roo Code分支

综合介绍 Kilo Code 是一个开源的 Visual Studio Code（简称 VS Code）扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发，最...

最新AI资源 # AI IDE # AI开源项目 # AI编程

1年前

0155.8K

G-Search-MCP：免费谷歌搜索的MCP服务器

综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具，托管在 GitHub 上，由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP（Model Context...

最新AI资源 # AI开源项目 # MCP服务

1年前

063.4K

AgentIQ：灵活连接和管理AI智能体的开源工具

综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具，旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作，连接企业数据和工具，像调用函数一样构建工作流。这个工具的最大...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

054.7K

MIDI-3D：从单张图片快速生成多物体3D场景的开源工具

综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目，它能从一张图片快速生成包含多个物体的3D场景，适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

061K

TripoSF：快速生成高分辨率3D模型的实用工具

综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目，专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术，处理效率高，能在普...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

056.7K

TripoSG：单张图像生成高分辨率3D建模数字资产

综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目，能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术，结合混合监督训练和优质数据集，让生成的 3D 模型拥有...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

062.9K

MoshiVis：实时语音对话和图像理解的开源模型

综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目，托管在 GitHub 上。它基于 Moshi 语音-文本模型（7B 参数），新增了约 2.06 亿个适配参数和冻结的 Pal...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

056.1K

MiniMind：2小时从零训练26M参数GPT的开源工具

综合介绍 MiniMind 是一个开源项目，由开发者 jingyaogong 创建。它的核心目标是让普通人也能快速训练自己的 AI 模型。MiniMind 主打特点是用 2 小时在单张 NVIDIA ...

最新AI资源 # AI开源项目

1年前

082.8K

WritingBench：测试大模型写作能力的基准评估工具

综合介绍 WritingBench 是 X-PLUG 团队开发的一个开源项目，托管在 GitHub 上。它是一个专门用来测试大模型写作能力的工具，提供了 1239 个真实世界的写作任务。这些任务覆盖 ...

最新AI资源 # AI开源项目

1年前

062.9K

Free-Search：免费获取实时谷歌搜索结果的API工具

综合介绍 Free-Search 是一个由 Hanzla Javaid 开发的开源 API 工具，托管在 GitHub 上。它的主要功能是通过自定义搜索引擎提供实时的谷歌搜索结果，并爬取网页内容返回结...

最新AI资源 # AI开源项目

1年前

064.7K

AI-ClothingTryOn：基于 Gemini 的虚拟服装试穿工具

综合介绍 AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序，由开发者 speedTD 创建，托管在 GitHub 上。它利用 Google Gemini 人工智能技术，让...

最新AI资源 # AI开源项目 # AI换脸与换装

1年前

059.8K

OpenDeepSearch：支持智能推理的开源搜索工具

综合介绍 OpenDeepSearch 是一个开源的搜索工具，由 sentient-agi 团队开发。它结合了大型语言模型（LLM）和智能推理代理，让用户可以用简单的方式搜索网页信息并获取准确答案。这...

最新AI资源 # AI开源项目 # AI搜索工具

1年前

057.9K

Vibe Draw：将手绘草图转化为3D模型的创意工具

综合介绍 Vibe Draw 是一个开源项目，它由 Martin Sit 开发，能让用户把手绘草图变成漂亮的 3D 模型。这个工具的目标很简单：让任何人都能轻松做 3D 建模，不需要高超的艺术技巧或复...

最新AI资源 # AI开源项目 # AI文本与图片转3D # AI涂鸦生成绘画

1年前

056.4K

OAK：可视化构建智能体应用的开源项目

综合介绍 OAK（Open Agent Kit）是一个开源工具，帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型（LLM），比如OpenAI、Google或Anthropic的模型...

最新AI资源 # AI开源项目 # 智能体应用

1年前

059K

LangGraph CUA：基于 LangGraph 控制电脑操作的AI智能体

综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架，让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

053.5K

n8n-mcp-server：与n8n工作流交互的MCP服务工具

综合介绍 n8n-mcp-server 是一个开源项目，托管在 GitHub 上，由 Leonard Sellem 开发。它是一个 MCP（Model Context Protocol）服务工具，专门...

最新AI资源 # AI开源项目 # MCP服务

1年前

071.4K

FlowGram.AI：快速创建节点式工作流的开源引擎

综合介绍 Flowgram.ai 是由 ByteDance 开发的一款开源流程搭建引擎。它基于节点编辑，帮助开发者快速创建工作流程，支持固定布局和自由连线两种模式。项目使用 TypeScript 编写...

最新AI资源 # AI开源项目 # 低代码工作流

1年前

0105K

Cursor Auto Register：自动创建并管理Cursor账号的开源工具

综合介绍 Cursor Auto Register 是一个开源项目，托管在 GitHub 上。它由开发者 ddCat-main 创建，旨在帮助用户自动注册和管理 Cursor AI 代码编辑器的账号...

最新AI资源 # AI开源项目

1年前

075.4K

Qwen2.5-Omni：多模态输入和实时语音交互的端测模型

综合介绍 Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入，并实时生成文本或自然语音响应。这款模型于 2025 年 3 ...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

069K

IndexTTS：支持中英文混合的文本转语音工具

综合介绍 IndexTTS 是一个开源的文本转语音（TTS）工具，托管在 GitHub 上，由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术，通过改进模块设计，提供高效且...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0122.2K

Dify-Plus：为Dify开发的企业内部管理后台

综合介绍 Dify-Plus是基于Dify开源项目二次开发的AI应用开发平台。它在Dify的基础上，新增了基于的管理中心，针对企业场景进行了功能优化。项目最初为企业内部使用，后来发现社区有类似需求，便...

最新AI资源 # AI开源项目

1年前

068.3K

Rankify：支持信息检索与重排序的Python工具包

综合介绍 Rankify 是由奥地利因斯布鲁克大学数据科学小组开发的开源 Python 工具包。它专注于信息检索、重排序和检索增强生成（RAG），提供了一个统一的框架。工具包内置 40 个预检索基准数...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

055.1K

CFG-Zero-star：提升图像和视频生成质量的开源工具

综合介绍 CFG-Zero-star 是一个开源项目，由 Weichen Fan 和南洋理工大学 S-Lab 团队开发。它专注于改进流匹配模型中的分类器自由引导（CFG）技术，通过优化引导策略和零初始...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # AI视频生成工具

1年前

068.3K

Bonsai：适合边缘设备运行的三值权重语言模型

综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型，参数规模为 5 亿，采用三值权重（ternary weights）技术。它基于 Llama 架构和 Mistral 分词器...

最新AI资源 # AI开源项目 # 大模型微调

1年前

052.5K

Motia：用代码快速构建智能体的开发框架

综合介绍 Motia 是一个面向软件工程师的开源 AI 代理框架，托管在 GitHub 上，由 MotiaDev 团队开发。它让开发者能用熟悉的编程语言（如 Python、TypeScript、Rub...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

075.5K

DiffSynth-Engine：低现存部署FLUX、Wan2.1的开源引擎

综合介绍 DiffSynth-Engine 是魔搭社区（ModelScope）推出的开源项目，托管于 GitHub。它基于扩散模型技术，专注于高效生成图像和视频，适合开发者在生产环境中部署 AI 模型...

最新AI资源 # AI开源项目

1年前

069.4K

RF-DETR：实时视觉对象检测开源模型

综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构，核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

093.5K

Aana SDK：简易部署多模态AI模型的开源工具

综合介绍 Aana SDK 是一个开源框架，由 Mobius Labs 开发，名字源于马拉雅拉姆语“ആന”（大象）。它帮助开发者快速部署和管理多模态 AI 模型，支持处理文本、图像、音频和视频等多种数...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

1年前

051.3K

PiT：用图像零件拼出完整图像的工具（未开放）

综合介绍 PiT（Piece it Together）是一个开源工具，托管在 GitHub 上，由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件，比如翅膀...

最新AI资源 # AI图像编辑 # AI图像风格控制 # AI开源项目

1年前

054K

Agent TARS：使用视觉和命令操作电脑的开源智能体

综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体，核心特点是通过视觉理解网页内容，并结合命令行和文件系统操作，帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作，而是能自...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

072.4K

Qlib：微软开发的AI量化投资研究工具

综合介绍 Qlib 是微软开发的一个开源平台，专注于用 AI 技术帮助用户研究量化投资。它从最基本的数据处理开始，支持用户探索投资想法并将其变成可用的策略。平台简单易用，适合想用机器学习提升投资研究的...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

086.9K

自动爬取小说并生成多角色有声书的工具

综合介绍 Auto-Audio-Book 是一个开源项目，托管在 GitHub 上。它能自动从网站爬取小说内容，并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.1...

最新AI资源 # AI副业赚钱项目 # AI开源项目

1年前

065.4K

UniAPI：免服务器统一管理大模型API转发

综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器，核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API，比如 OpenAI、Azure OpenAI、Clau...

最新AI资源 # AI开源项目

1年前

058.7K

Oliva：语音控制的多智能体产品搜索助手

综合介绍 Oliva 是一个开源的多智能体助手工具，由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作，帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...

最新AI资源 # AI开源项目 # 智能体应用 # 知识检索与RAG框架

1年前

066.9K

Playwright MCP：微软推出的浏览器自动化MCP服务

综合介绍 Playwright MCP 是微软开发的一款开源工具，托管在 GitHub 上。它通过 Model Context Protocol（MCP）协议，让人工智能模型能直接控制浏览器，完成打开...

最新AI资源 # AI开源项目 # MCP服务 # 桌面自动化智能体

1年前

0102.2K

PDF Craft：PDF扫描文件转Markdown的开源工具

综合介绍 PDF Craft 是一个开源工具，专为扫描书籍的PDF设计，能将其转换为Markdown格式。它由 oomol-lab 开发，托管在 GitHub 上，适合喜欢整理电子书的用户。工具通过本...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

1年前

080.6K

InfiniteYou：保留人脸特征的照片生成与编辑工具

综合介绍 InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器（DiTs）技术，使用 FLUX.1-dev 模型，核心功能是让用户上传照片并输入文字描述，生...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

060.2K

Grok-Mirror：一键部署可盈利的Grok镜像站

综合介绍 Grok-Mirror是一个基于无服务器快速部署Grok3国内镜像站构建的可经营的Grok镜像站。它让用户可以通过Docker一键部署本地Grok服务站。Grok是xAI公司推出的人工智...

最新AI资源 # AI副业赚钱项目 # AI开源项目

1年前

095.5K

LHM：从单张图片生成支持动作的3D人体模型

综合介绍 LHM（Large Animatable Human Reconstruction Model）是一个开源项目，它由aigc3d团队开发，能从一张图片快速生成支持动作的3D人体模型。核心特色...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

065.4K

Second Me：本地训练拥有个人记忆和习惯的AI分身

综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目，它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯，变成一个懂你的智...

最新AI资源 # AI开源项目 # AI生活效率助手 # 大模型微调

1年前

069.5K

openapi-mcp-server：让AI直接调用开放API的MCP服务

综合介绍 openapi-mcp-server 是一个开源工具，旨在将符合 OpenAPI v3.1 标准的API转化为AI可用的资源。它由 janwilmake 维护，基于 Model Contex...

最新AI资源 # AI开源项目 # MCP服务

1年前

064.4K

检测MCP服务安全风险的开源工具

综合介绍 mcp-is-dangerous 是 Shaojie Jiang 在 GitHub 上开发的一个开源工具。它通过简单的 Python 代码，帮助用户检测 MCP（Model Context ...

最新AI资源 # AI开源项目 # MCP服务

1年前

054.4K

StarVector：从图像和文字生成SVG矢量图的基础模型

综合介绍 StarVector 是一个开源项目，它由 Juan A. Rodriguez 等开发者创建，目的是将图像和文字转化为可缩放矢量图形（SVG）。这个工具使用视觉语言模型，能够理解图像内容和文...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

063.2K

CortexON：开源多代理AI工具，支持复杂任务自动化

综合介绍 CortexON 是一个开源的多代理 AI 系统，托管在 GitHub 上，网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...

最新AI资源 # AI开源项目 # 智能体应用

1年前

055.6K

MarkPDFDown：基于多模态模型将PDF转为Markdown文件

综合介绍 MarkPDFDown 是一个开源工具。它利用多模态大语言模型，把 PDF 文件转为 Markdown 格式。开发者是 GitHub 用户 jorben。这个工具的目标很简单：让 PDF 文...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

060.8K

Easy Dataset：创建大模型微调数据集的简易工具

综合介绍 Easy Dataset 是一个专门为大模型（LLM）微调设计的开源工具，托管在 GitHub 上。它提供了一个简单易用的界面，让用户可以上传文件、自动分割内容、生成问题和答案，最终输出适合...

最新AI资源 # AI开源项目 # 大模型微调

1年前

067.2K

无服务器快速部署Grok3国内镜像站

综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型，而 ...

最新AI资源 # AI开源项目

1年前

077K

Skywork-R1V：昆仑万文开源的图文混合多模态推理模型

综合介绍 Skywork-R1V 是由 SkyworkAI（昆仑万维）团队开发的一款开源多模态推理模型，发布于 GitHub。它能同时处理图像和文字，进行多步骤逻辑推理，特别擅长分析复杂图像问题。这...

最新AI资源 # AI开源项目

1年前

053.1K

AI Logo：AI快速生成定制化品牌Logo

综合介绍 AI Logo 是一个开源的AI应用项目，目标是帮助用户通过人工智能快速生成个性化的品牌标志。它结合了强大的AI技术，比如Stable Diffusion和DeepAI，让用户输入简单的品牌...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

052.3K

Docs：开源的协作笔记和文档管理工具

综合介绍 Docs 是一个开源的协作笔记和文档管理平台，由 suitenumerique 团队开发。它使用 Django 和 React 技术构建，目标是提供一个简单易用的工具，帮助用户记录笔记、管理...

最新AI资源 # AI开源项目 # AI笔记

1年前

056.2K

SmartRead：自动标注技术PDF文档并提供相关引用源

综合介绍 SmartRead 是一个基于 AI 的开源工具，专为技术文档设计。它能自动分析 PDF 文件，标注关键内容，比如重要术语、标题或核心观点，帮助用户快速理解复杂文档。同时，它还能提供与文档主...

最新AI资源 # AI写作 # AI开源项目 # AI教育工具

1年前

063.1K

Hunyuan3D-2：腾讯开源的高分辨率3D模型生成工具

综合介绍 Hunyuan3D-2 是腾讯开发的一个开源项目，旨在通过文字或图像生成高分辨率的3D模型。它由两个核心部分组成：形状生成模型（Hunyuan3D-DiT）和纹理生成模型（Hunyuan3D...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

093K

LangManus：支持多智能体协作的开源AI自动化框架

综合介绍 LangManus 是一个开源的 AI 自动化框架，托管在 GitHub 上。它由一群前同事在业余时间开发，属于学术驱动项目，目标是结合语言模型和专用工具，完成网页搜索、数据爬取和代码执行等...

最新AI资源 # AI开源项目 # 智能体应用

1年前

056.4K

使用Cursor读取并修改Figma设计稿的MCP服务

综合介绍 Cursor Talk to Figma MCP 是一个开源项目，通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figm...

最新AI资源 # AI开源项目 # AI页面设计 # MCP服务

1年前

064.4K

闲鱼卖家全天自动值守的AI客服机器人

综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统，由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守，帮助闲鱼卖家回复...

最新AI资源 # AI副业赚钱项目 # AI客服机器人 # AI开源项目

1年前

067.1K

Seed-VC：支持少样本实时转换语音和歌声

综合介绍 Seed-VC 是一个开源项目，地址在 GitHub 上，由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频，快速实现语音或歌声转换，不需要额外训练。项目支持实时语音转换，延...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0165K

PilottAI：构建企业级多智能体应用的开源项目

综合介绍 PilottAI 是一个开源的 Python 框架，托管在 GitHub 上，由开发者 anuj0456 创建。它专注于帮助用户构建企业级的多智能体系统，支持大语言模型（LLM）集成，提供任...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

048.1K

HumanOmni：分析人类视频情感和动作的多模态大模型

综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型，托管在 GitHub 上。它专注于分析人类视频，能同时处理画面和声音，帮助理解情感、动作和对话内容。项目用了 2...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

058.3K

TxAgent：帮医生分析药物作用和治疗方案的AI工具

综合介绍 TxAgent 是哈佛大学医学与科学人工智能团队（MIMS）开发的一款开源AI工具，旨在帮助医生分析药物相互作用并制定个性化治疗方案。它通过多步骤推理和实时检索生物医学知识，结合患者的具体情...

最新AI资源 # AI开源项目 # 智能体应用

1年前

065.3K

OpenSearch-SQL：将自然语言转为SQL查询的开源工具

综合介绍 OpenSearch-SQL 是一个开源项目，它是一个强大的 Text-to-SQL 工具，可以把用户的自然语言描述转化为 SQL 查询语句，帮助不熟悉数据库的人轻松获取数据。这个项目由 O...

最新AI资源 # AI开源项目 # AI数据分析

1年前

060.5K

SmolDocling：小体积高效处理文档的视觉语言模型

综合介绍 SmolDocling 是由 ds4sd 团队与 IBM 合作开发的一个视觉语言模型（VLM），基于 SmolVLM-256M 打造，托管在 Hugging Face 平台。它体积小，只有 ...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

1年前

051.7K

Moffee：将Markdown转为PPT幻灯片

综合介绍 Moffee 是一个开源工具，它能把 Markdown 文件快速变成专业的幻灯片，简单又高效。用户只需写好 Markdown 内容，Moffee 就能自动处理布局、分页和样式，省去手动排版的...

最新AI资源 # AI开源项目 # AI生成演示文稿/PPT

1年前

076.5K

加载更多