Agent S:像人类一样操作电脑的开源智能体框架综合介绍 Agent S 是由 Simular AI 开发的开源框架,让智能体通过图形用户界面(GUI)像人类一样操作电脑。它使用多模态大语言模型和经验学习技术,能完成浏览网页、编辑文档、使用软件等任...最新AI资源# AI开源项目# 桌面自动化智能体4个月前01.3K
BabelDOC:将PDF文档翻译成双语对照的开源工具综合介绍 BabelDOC 是一个开源工具,专门用来把 PDF 文档翻译成双语对照格式。它由 funstory-ai 团队开发,托管在 GitHub 上,主要服务于需要处理外语文档的用户,比如研究人员...最新AI资源# AI开源项目# AI翻译2个月前01.6K
Text2Voice:基于硅基流动API的文本转语音图形界面综合介绍 Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让...最新AI资源# AI开源项目# AI文本转语音4个月前01.2K
FreeAI:基于Pollinations封装的的免费AI工具综合介绍 FreeAI 是一个基于 Pollinations.AI API 的开源 AI 应用平台,提供免费且无限制的 AI 聊天助手、图像生成和语音合成服务。这个项目由开发者 Azad-sl 在 G...最新AI资源# AI开源项目# AI集成多模型对话平台4个月前01.2K
优化代码生成和展示的Open WebUI综合介绍 Open WebUI Artifacts Overhaul 是基于 Open WebUI 的一个分支项目,由开发者 Nick Tonjum 开发。它是一个开源工具,专注于提升 AI 生成代码...AI新闻# AI开源项目# AI本地化聊天应用4个月前01.3K
OpenAvatarChat:模块化设计的数字人对话工具综合介绍 OpenAvatarChat 是由 HumanAIGC-Engineering 团队开发的一个开源项目,托管在 GitHub 上。它是一个模块化的数字人对话工具,用户可以在单台 PC 上运行...最新AI资源# AI开源项目# 多模态实时互动产品4个月前01.2K
uniOCR:跨平台开源的文字识别工具综合介绍 uniOCR 是一个开源的文字识别工具,由 mediar-ai 团队开发。它基于 Rust 语言编写,支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...最新AI资源# AI开源项目# OCR4个月前0963
Serena:语义检索和编辑代码的免费MCP工具综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具,托管在 GitHub 上。它是一个强大的代码助手,可以直接在你的代码库中工作,帮助开发者分析、编辑和执行代码。Seren...最新AI资源# AI开源项目# AI编程# MCP服务4个月前02K
AudioX:参考文本、图像、视频生成音频和音乐综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目,官方论文发布于 arXiv(编号 2503.10522)。它基于扩散变换器(Diffusion Transf...最新AI资源# AI开源项目# AI音乐4个月前02K
EasyControl:将人像转为吉卜力风格图像的免费工具综合介绍 EasyControl 是一个开源项目,项目基于扩散变换器(DiT)架构,提供高效、灵活的图像生成控制。其中,Ghibli Control LoRA 是其特色功能之一,通过仅用 100 张亚...最新AI资源# AI图像风格控制# AI开源项目4个月前01.7K
YOLOE:实时视频检测和分割物体的开源工具综合介绍 YOLOE 是清华大学软件学院多媒体智能组(THU-MIG)开发的一个开源项目,全称“You Only Look Once Eye”。它基于 PyTorch 框架,属于 YOLO 系列的扩展...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测4个月前01.2K
集成多种先进语音合成服务的开源运营项目综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音4个月前01.6K
VideoMind:视频按时间戳定位内容与问答的开源项目综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI音视频编辑2个月前01.3K
SuperCoder:命令行终端运行的智能代码助手综合介绍 SuperCoder 是一个在终端运行的智能工具,专为程序员设计。它利用 AI 技术,帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源,支...最新AI资源# AI开源项目# AI编程4个月前01.1K
Emigo:在Emacs中使用AI完成复杂编程任务的助手综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手,由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型(LLM),帮助程序员在 Emacs 中完成代码分析...最新AI资源# AI开源项目# AI编程4个月前01.2K
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测4个月前01.2K
GenXD:生成任意3D和4D场景视频的开源框架综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...最新AI资源# AI开源项目# AI文本与图片转3D4个月前01.2K
ChatAnyone:从照片生成半身数字人肖像视频的工具综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作...最新AI资源# AI开源项目# AI数字人4个月前01.3K
Search-R1:强化学习训练大模型搜索与推理的工具综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...最新AI资源# AI开源项目# 大模型微调4个月前01.2K
DeepGemini:多模型编排任务并封装为API接口综合介绍 DeepGemini 是一个开源项目,由开发者 Thomas Sligter 创建。它是一个支持多模型编排的 AI 管理工具,主要特点是能灵活组合多种 AI 模型,并通过 OpenAI 兼容...最新AI资源# AI开源项目2个月前01.4K
Optexity:用人类演示训练AI执行网页操作的开源项目综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...最新AI资源# AI开源项目# 大模型微调# 桌面自动化智能体4个月前01.4K
II-Researcher:深度搜索与分步推理解答复杂问题综合介绍 II-Researcher 是 Intelligent-Internet 团队开发的一款开源人工智能研究工具,托管于 GitHub。它专为深度搜索和复杂推理设计,能通过智能网页搜索和多步骤分...最新AI资源# AI开源项目# 生成深度研究报告4个月前01.1K
Cua:让AI代理在macOS/Linux沙盒中安全执行应用综合介绍 Cua 是一个开源项目,全称“Computer-Use Agent”(计算机使用代理),读作“koo-ah”。它专为 Apple Silicon 设备设计,能创建并运行高性能的 macOS ...最新AI资源# AI开源项目4个月前01.7K
Paper to Podcast:把学术论文转换为多人对话播客综合介绍 Paper to Podcast 是一个开源工具,专门把学术研究论文转化为生动有趣的播客。它通过人工智能技术,将 PDF 格式的论文变成三个角色——主持、学习者和专家——之间的对话,让复杂的...最新AI资源# AI开源项目# AI文本转语音4个月前01K
Anubis:通过工作量证明干扰AI爬虫抓取综合介绍 Anubis 是一个由 TecharoHQ 团队开发的开源工具,主要用来保护网站免受 AI 爬虫的侵扰。它在 HTTP 请求中加入 SHA256 工作量证明(Proof-of-Work)挑战...最新AI资源# AI开源项目4个月前02.5K
OmniSQL:将自然语言转化为高质量SQL查询的模型综合介绍 OmniSQL 是一个开源项目,由 RUCKBReasoning 团队开发,托管在 GitHub 上。它的核心功能是将用户输入的自然语言问题转化为高质量的 SQL 查询语句,帮助用户轻松与数...最新AI资源# AI开源项目# AI数据分析4个月前01.3K
LatentSync:用音频直接生成唇形同步视频的开源工具综合介绍 LatentSync 是字节跳动(ByteDance)开发的一个开源工具,托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作,让嘴型与声音精准匹配。项目基于 Stable Di...最新AI资源# AI开源项目# 口型同步2个月前02.7K
Morphik Core:处理多模态数据的开源 RAG 平台综合介绍 Morphik Core 是一个开源项目,由 morphik-org 团队开发,托管在 GitHub 上。它以前叫 DataBridge Core,现在更名为 Morphik Core。这个...最新AI资源# AI开源项目# 知识检索与RAG框架4个月前01.6K
基于Workers AI免费将多种文件转为Markdown格式综合介绍 serverless-markdown-convertor 是一个免费的开源工具,基于 Cloudflare Worker 和 Workers AI 开发,能将多种文件转换为 Markdow...最新AI资源# AI开源项目# 文档提取与清洗4个月前01.4K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件,由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE(如 IntelliJ ...最新AI资源# AI开源项目4个月前01.2K
VirtualWife:支持B站直播和语音互动的二次元数字人综合介绍 VirtualWife 是一个开源的虚拟数字人项目,由开发者 yakami129 创建。它目前处于孵化阶段,目标是打造一个有“灵魂”的虚拟角色,用户可以像朋友一样与之互动。项目支持 B站直播...最新AI资源# AI开源项目# AI数字人4个月前01.5K
GPT-Crawler:自动爬取网站内容生成知识库文件综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新AI资源# AI开源项目# 文档提取与清洗2个月前02.3K
MegaTTS3:合成中英文语音的轻量模型综合介绍 MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具,专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数,轻量高效,支持中英文混合语音生成和语音克隆。项目托管在...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆4个月前01.4K
KBLaM:为大模型嵌入外部知识的开源增强工具综合介绍 KBLaM 是微软开发的一个开源项目,全称是“Knowledge Base augmented Language Model”(知识库增强语言模型)。它通过将外部知识转化为向量并嵌入大模型的...最新AI资源# AI开源项目# 知识检索与RAG框架4个月前01.5K
LangGraph CodeAct:生成代码帮助智能体解决复杂任务综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架,基于 CodeAct 架构(详见论文 arXiv:2402.01030)。它通过生成...最新AI资源# AI开源项目# 智能体开发框架4个月前01.6K
BrowserTools MCP:实时监控浏览器活动的MCP服务综合介绍 BrowserTools MCP 是一个开源项目,由 AgentDeskAI 团队开发。它通过 Chrome 扩展和 Node.js 服务,让 AI 能实时监控浏览器活动,包括日志、网络请求...最新AI资源# AI开源项目# MCP服务4个月前02K
AgentLaboratory:利用智能代理完成科研全流程的开源工具综合介绍 AgentLaboratory 是一个开源工具,托管在 GitHub 上,由 Samuel Schmidgall 开发。它利用大语言模型(LLM)驱动的智能代理,帮助研究人员完成科研全流程...最新AI资源# AI开源项目# AI教育工具# 论文4个月前01.3K
Kilo Code:具有简洁使用体验的Roo Code分支综合介绍 Kilo Code 是一个开源的 Visual Studio Code(简称 VS Code)扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发,最...最新AI资源# AI IDE# AI开源项目# AI编程4个月前01.6K
G-Search-MCP:免费谷歌搜索的MCP服务器综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具,托管在 GitHub 上,由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP(Model Context...最新AI资源# AI开源项目# MCP服务4个月前01.3K
AgentIQ:灵活连接和管理AI智能体的开源工具综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具,旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作,连接企业数据和工具,像调用函数一样构建工作流。这个工具的最大...最新AI资源# AI开源项目# 智能体开发框架4个月前01.2K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目,它能从一张图片快速生成包含多个物体的3D场景,适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...最新AI资源# AI开源项目# AI文本与图片转3D4个月前01.3K
TripoSF:快速生成高分辨率3D模型的实用工具综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目,专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术,处理效率高,能在普...最新AI资源# AI开源项目# AI文本与图片转3D4个月前01.2K
TripoSG:单张图像生成高分辨率3D建模数字资产综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目,能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术,结合混合监督训练和优质数据集,让生成的 3D 模型拥有...最新AI资源# AI开源项目# AI文本与图片转3D4个月前01.4K
MoshiVis:实时语音对话和图像理解的开源模型综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...最新AI资源# AI开源项目# 多模态实时互动产品4个月前01.3K
MiniMind:2小时从零训练26M参数GPT的开源工具综合介绍 MiniMind 是一个开源项目,由开发者 jingyaogong 创建。它的核心目标是让普通人也能快速训练自己的 AI 模型。MiniMind 主打特点是用 2 小时在单张 NVIDIA ...最新AI资源# AI开源项目4个月前01.6K
WritingBench:测试大模型写作能力的基准评估工具综合介绍 WritingBench 是 X-PLUG 团队开发的一个开源项目,托管在 GitHub 上。它是一个专门用来测试大模型写作能力的工具,提供了 1239 个真实世界的写作任务。这些任务覆盖 ...最新AI资源# AI开源项目4个月前01.2K
Free-Search:免费获取实时谷歌搜索结果的API工具综合介绍 Free-Search 是一个由 Hanzla Javaid 开发的开源 API 工具,托管在 GitHub 上。它的主要功能是通过自定义搜索引擎提供实时的谷歌搜索结果,并爬取网页内容返回结...最新AI资源# AI开源项目4个月前01K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具综合介绍 AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序,由开发者 speedTD 创建,托管在 GitHub 上。它利用 Google Gemini 人工智能技术,让...最新AI资源# AI开源项目# AI换脸与换装4个月前01.5K
OpenDeepSearch:支持智能推理的开源搜索工具综合介绍 OpenDeepSearch 是一个开源的搜索工具,由 sentient-agi 团队开发。它结合了大型语言模型(LLM)和智能推理代理,让用户可以用简单的方式搜索网页信息并获取准确答案。这...最新AI资源# AI开源项目# AI搜索工具4个月前01.3K
Vibe Draw:将手绘草图转化为3D模型的创意工具综合介绍 Vibe Draw 是一个开源项目,它由 Martin Sit 开发,能让用户把手绘草图变成漂亮的 3D 模型。这个工具的目标很简单:让任何人都能轻松做 3D 建模,不需要高超的艺术技巧或复...最新AI资源# AI开源项目# AI文本与图片转3D# AI涂鸦生成绘画4个月前01.3K
OAK:可视化构建智能体应用的开源项目综合介绍 OAK(Open Agent Kit)是一个开源工具,帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型(LLM),比如OpenAI、Google或Anthropic的模型...最新AI资源# AI开源项目# 智能体应用5个月前01.3K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架,让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核...最新AI资源# AI开源项目# 桌面自动化智能体5个月前01.5K
n8n-mcp-server:与n8n工作流交互的MCP服务工具综合介绍 n8n-mcp-server 是一个开源项目,托管在 GitHub 上,由 Leonard Sellem 开发。它是一个 MCP(Model Context Protocol)服务工具,专门...最新AI资源# AI开源项目# MCP服务5个月前02K
FlowGram.AI:快速创建节点式工作流的开源引擎综合介绍 Flowgram.ai 是由 ByteDance 开发的一款开源流程搭建引擎。它基于节点编辑,帮助开发者快速创建工作流程,支持固定布局和自由连线两种模式。项目使用 TypeScript 编写...最新AI资源# AI开源项目# 低代码工作流5个月前01.7K
Cursor Auto Register:自动创建并管理Cursor账号的开源工具综合介绍 Cursor Auto Register 是一个开源项目,托管在 GitHub 上。它由开发者 ddCat-main 创建,旨在帮助用户自动注册和管理 Cursor AI 代码编辑器的账号...最新AI资源# AI开源项目5个月前01.5K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型综合介绍 Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入,并实时生成文本或自然语音响应。这款模型于 2025 年 3 ...最新AI资源# AI开源项目# 多模态实时互动产品5个月前02.1K
IndexTTS:支持中英文混合的文本转语音工具综合介绍 IndexTTS 是一个开源的文本转语音(TTS)工具,托管在 GitHub 上,由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术,通过改进模块设计,提供高效且...最新AI资源# AI开源项目# AI文本转语音5个月前01.6K
Dify-Plus:为Dify开发的企业内部管理后台综合介绍 Dify-Plus是基于Dify开源项目二次开发的AI应用开发平台。它在Dify的基础上,新增了基于的管理中心,针对企业场景进行了功能优化。项目最初为企业内部使用,后来发现社区有类似需求,便...最新AI资源# AI开源项目5个月前01.2K
Rankify:支持信息检索与重排序的Python工具包综合介绍 Rankify 是由奥地利因斯布鲁克大学数据科学小组开发的开源 Python 工具包。它专注于信息检索、重排序和检索增强生成(RAG),提供了一个统一的框架。工具包内置 40 个预检索基准数...最新AI资源# AI开源项目# 知识检索与RAG框架5个月前01.6K
CFG-Zero-star:提升图像和视频生成质量的开源工具综合介绍 CFG-Zero-star 是一个开源项目,由 Weichen Fan 和南洋理工大学 S-Lab 团队开发。它专注于改进流匹配模型中的分类器自由引导(CFG)技术,通过优化引导策略和零初始...最新AI资源# AI图像生成辅助工具# AI开源项目# AI视频生成工具5个月前01.5K
Bonsai:适合边缘设备运行的三值权重语言模型综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器...最新AI资源# AI开源项目# 大模型微调5个月前01.7K
Motia:用代码快速构建智能体的开发框架综合介绍 Motia 是一个面向软件工程师的开源 AI 代理框架,托管在 GitHub 上,由 MotiaDev 团队开发。它让开发者能用熟悉的编程语言(如 Python、TypeScript、Rub...最新AI资源# AI开源项目# 智能体开发框架5个月前01.2K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎综合介绍 DiffSynth-Engine 是魔搭社区(ModelScope)推出的开源项目,托管于 GitHub。它基于扩散模型技术,专注于高效生成图像和视频,适合开发者在生产环境中部署 AI 模型...最新AI资源# AI开源项目5个月前01.4K
RF-DETR:实时视觉对象检测开源模型综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构,核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...最新AI资源# AI开源项目# 视觉目标检测5个月前01.8K
Aana SDK:简易部署多模态AI模型的开源工具综合介绍 Aana SDK 是一个开源框架,由 Mobius Labs 开发,名字源于马拉雅拉姆语“ആന”(大象)。它帮助开发者快速部署和管理多模态 AI 模型,支持处理文本、图像、音频和视频等多种数...最新AI资源# AI开源项目# 本地部署开源大模型工具5个月前01.5K
PiT:用图像零件拼出完整图像的工具(未开放)综合介绍 PiT(Piece it Together)是一个开源工具,托管在 GitHub 上,由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件,比如翅膀...最新AI资源# AI图像编辑# AI图像风格控制# AI开源项目5个月前01.3K
Agent TARS:使用视觉和命令操作电脑的开源智能体综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自...最新AI资源# AI开源项目# 桌面自动化智能体5个月前01.5K
Qlib:微软开发的AI量化投资研究工具综合介绍 Qlib 是微软开发的一个开源平台,专注于用 AI 技术帮助用户研究量化投资。它从最基本的数据处理开始,支持用户探索投资想法并将其变成可用的策略。平台简单易用,适合想用机器学习提升投资研究的...最新AI资源# AI开源项目# AI金融数据分析5个月前01.8K
自动爬取小说并生成多角色有声书的工具综合介绍 Auto-Audio-Book 是一个开源项目,托管在 GitHub 上。它能自动从网站爬取小说内容,并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.1...最新AI资源# AI副业赚钱项目# AI开源项目5个月前01.2K
UniAPI:免服务器统一管理大模型API转发综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器,核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API,比如 OpenAI、Azure OpenAI、Clau...最新AI资源# AI开源项目5个月前01.5K
Oliva:语音控制的多智能体产品搜索助手综合介绍 Oliva 是一个开源的多智能体助手工具,由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作,帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...最新AI资源# AI开源项目# 智能体应用# 知识检索与RAG框架5个月前01.1K
Playwright MCP:微软推出的浏览器自动化MCP服务综合介绍 Playwright MCP 是微软开发的一款开源工具,托管在 GitHub 上。它通过 Model Context Protocol(MCP)协议,让人工智能模型能直接控制浏览器,完成打开...最新AI资源# AI开源项目# MCP服务# 桌面自动化智能体5个月前01.9K
PDF Craft:PDF扫描文件转Markdown的开源工具综合介绍 PDF Craft 是一个开源工具,专为扫描书籍的PDF设计,能将其转换为Markdown格式。它由 oomol-lab 开发,托管在 GitHub 上,适合喜欢整理电子书的用户。工具通过本...最新AI资源# AI开源项目# OCR# 文档提取与清洗5个月前01.4K
InfiniteYou:保留人脸特征的照片生成与编辑工具综合介绍 InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器(DiTs)技术,使用 FLUX.1-dev 模型,核心功能是让用户上传照片并输入文字描述,生...最新AI资源# AI图像风格控制# AI开源项目5个月前01.5K
Grok-Mirror:一键部署可盈利的Grok镜像站综合介绍 Grok-Mirror是一个基于 无服务器快速部署Grok3国内镜像站 构建的可经营的Grok镜像站。它让用户可以通过Docker一键部署本地Grok服务站。Grok是xAI公司推出的人工智...最新AI资源# AI副业赚钱项目# AI开源项目5个月前01.4K
LHM:从单张图片生成支持动作的3D人体模型综合介绍 LHM(Large Animatable Human Reconstruction Model)是一个开源项目,它由aigc3d团队开发,能从一张图片快速生成支持动作的3D人体模型。核心特色...最新AI资源# AI开源项目# AI文本与图片转3D5个月前01.5K
Second Me:本地训练拥有个人记忆和习惯的AI分身综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...最新AI资源# AI开源项目# AI生活效率助手# 大模型微调5个月前02.2K
openapi-mcp-server:让AI直接调用开放API的MCP服务综合介绍 openapi-mcp-server 是一个开源工具,旨在将符合 OpenAPI v3.1 标准的API转化为AI可用的资源。它由 janwilmake 维护,基于 Model Contex...最新AI资源# AI开源项目# MCP服务5个月前01.8K
检测MCP服务安全风险的开源工具综合介绍 mcp-is-dangerous 是 Shaojie Jiang 在 GitHub 上开发的一个开源工具。它通过简单的 Python 代码,帮助用户检测 MCP(Model Context ...最新AI资源# AI开源项目# MCP服务5个月前01.5K
StarVector:从图像和文字生成SVG矢量图的基础模型综合介绍 StarVector 是一个开源项目,它由 Juan A. Rodriguez 等开发者创建,目的是将图像和文字转化为可缩放矢量图形(SVG)。这个工具使用视觉语言模型,能够理解图像内容和文...最新AI资源# AI图像风格控制# AI开源项目5个月前01.5K
CortexON:开源多代理AI工具,支持复杂任务自动化综合介绍 CortexON 是一个开源的多代理 AI 系统,托管在 GitHub 上,网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...最新AI资源# AI开源项目# 智能体应用5个月前01.2K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件综合介绍 MarkPDFDown 是一个开源工具。它利用多模态大语言模型,把 PDF 文件转为 Markdown 格式。开发者是 GitHub 用户 jorben。这个工具的目标很简单:让 PDF 文...最新AI资源# AI开源项目# 文档提取与清洗5个月前01.5K
Easy Dataset:创建大模型微调数据集的简易工具综合介绍 Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合...最新AI资源# AI开源项目# 大模型微调5个月前01.4K
无服务器快速部署Grok3国内镜像站综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型,而 ...最新AI资源# AI开源项目5个月前01.4K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型综合介绍 Skywork-R1V 是由 SkyworkAI(昆仑万维) 团队开发的一款开源多模态推理模型,发布于 GitHub。它能同时处理图像和文字,进行多步骤逻辑推理,特别擅长分析复杂图像问题。这...最新AI资源# AI开源项目5个月前01.5K
AI Logo:AI快速生成定制化品牌Logo综合介绍 AI Logo 是一个开源的AI应用项目,目标是帮助用户通过人工智能快速生成个性化的品牌标志。它结合了强大的AI技术,比如Stable Diffusion和DeepAI,让用户输入简单的品牌...最新AI资源# AI图像风格控制# AI开源项目5个月前01.2K
Docs:开源的协作笔记和文档管理工具综合介绍 Docs 是一个开源的协作笔记和文档管理平台,由 suitenumerique 团队开发。它使用 Django 和 React 技术构建,目标是提供一个简单易用的工具,帮助用户记录笔记、管理...最新AI资源# AI开源项目# AI笔记5个月前01.6K
SmartRead:自动标注技术PDF文档并提供相关引用源综合介绍 SmartRead 是一个基于 AI 的开源工具,专为技术文档设计。它能自动分析 PDF 文件,标注关键内容,比如重要术语、标题或核心观点,帮助用户快速理解复杂文档。同时,它还能提供与文档主...最新AI资源# AI写作# AI开源项目# AI教育工具5个月前01.6K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具综合介绍 Hunyuan3D-2 是腾讯开发的一个开源项目,旨在通过文字或图像生成高分辨率的3D模型。它由两个核心部分组成:形状生成模型(Hunyuan3D-DiT)和纹理生成模型(Hunyuan3D...最新AI资源# AI开源项目# AI文本与图片转3D5个月前01.3K
LangManus:支持多智能体协作的开源AI自动化框架综合介绍 LangManus 是一个开源的 AI 自动化框架,托管在 GitHub 上。它由一群前同事在业余时间开发,属于学术驱动项目,目标是结合语言模型和专用工具,完成网页搜索、数据爬取和代码执行等...最新AI资源# AI开源项目# 智能体应用5个月前01.4K
使用Cursor读取并修改Figma设计稿的MCP服务综合介绍 Cursor Talk to Figma MCP 是一个开源项目,通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figm...最新AI资源# AI开源项目# AI页面设计# MCP服务5个月前01.7K
闲鱼卖家全天自动值守的AI客服机器人综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统,由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守,帮助闲鱼卖家回复...最新AI资源# AI副业赚钱项目# AI客服机器人# AI开源项目5个月前01.3K
Seed-VC:支持少样本实时转换语音和歌声综合介绍 Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延...最新AI资源# AI开源项目# AI语音克隆5个月前01.7K
PilottAI:构建企业级多智能体应用的开源项目综合介绍 PilottAI 是一个开源的 Python 框架,托管在 GitHub 上,由开发者 anuj0456 创建。它专注于帮助用户构建企业级的多智能体系统,支持大语言模型(LLM)集成,提供任...最新AI资源# AI开源项目# 智能体开发框架5个月前01.2K
HumanOmni:分析人类视频情感和动作的多模态大模型综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型,托管在 GitHub 上。它专注于分析人类视频,能同时处理画面和声音,帮助理解情感、动作和对话内容。项目用了 2...最新AI资源# AI开源项目# 视觉目标检测5个月前01.1K
TxAgent:帮医生分析药物作用和治疗方案的AI工具综合介绍 TxAgent 是哈佛大学医学与科学人工智能团队(MIMS)开发的一款开源AI工具,旨在帮助医生分析药物相互作用并制定个性化治疗方案。它通过多步骤推理和实时检索生物医学知识,结合患者的具体情...最新AI资源# AI开源项目# 智能体应用5个月前01.1K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具综合介绍 OpenSearch-SQL 是一个开源项目,它是一个强大的 Text-to-SQL 工具,可以把用户的自然语言描述转化为 SQL 查询语句,帮助不熟悉数据库的人轻松获取数据。这个项目由 O...最新AI资源# AI开源项目# AI数据分析5个月前01.1K
SmolDocling:小体积高效处理文档的视觉语言模型综合介绍 SmolDocling 是由 ds4sd 团队与 IBM 合作开发的一个视觉语言模型(VLM),基于 SmolVLM-256M 打造,托管在 Hugging Face 平台。它体积小,只有 ...最新AI资源# AI开源项目# OCR# 文档提取与清洗5个月前01.3K
Moffee:将Markdown转为PPT幻灯片综合介绍 Moffee 是一个开源工具,它能把 Markdown 文件快速变成专业的幻灯片,简单又高效。用户只需写好 Markdown 内容,Moffee 就能自动处理布局、分页和样式,省去手动排版的...最新AI资源# AI开源项目# AI生成演示文稿/PPT4个月前01.3K