MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架9个月前025.3K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统综合介绍 R2R(RAG to Riches)是一个先进的AI检索系统,支持检索增强生成(RAG)功能,具备生产就绪的特性。该系统基于容器化的RESTful API构建,提供多模态内容解析、混合搜索功...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前025.3K
Prompt Optimizer:优化主流AI模型提示词的开源工具综合介绍 Prompt Optimizer 是一个专注于提示词优化的开源工具,由 linshenkx 在 GitHub 上开发。它能够帮助用户通过智能算法优化 AI 模型的提示词,从而提升生成内容的质...最新AI资源# AI开源项目# PROMPTS辅助工具7个月前025.3K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...最新AI资源# AI开源项目# OCR# 文档提取与清洗10个月前025.3K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端综合介绍 Copilot后端代理服务是一个开源项目,旨在通过借助其他FIM模型(如DeepSeek)来管理GitHub Copilot插件服务端,同时支持多人共享官方账号。该服务支持多种IDE,包括V...最新AI资源# AI开放服务# AI开源项目10个月前025.2K
AiPy:自动化运行Python代码完成数据分析任务综合介绍 AiPy 是一个开源的 Python 命令行工具,由 Knownsec 团队开发。它结合大语言模型(LLM)和 Python 运行环境,让用户通过自然语言描述任务,自动生成并运行 Pytho...最新AI资源# AI开源项目# 桌面自动化智能体6个月前025.2K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目,旨在通过集成空间编织注意力机制(Spatial Knitting Attentions)在扩散模型中嵌入高层次和高保真条...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格10个月前025.2K
Moffee:将Markdown转为PPT幻灯片综合介绍 Moffee 是一个开源工具,它能把 Markdown 文件快速变成专业的幻灯片,简单又高效。用户只需写好 Markdown 内容,Moffee 就能自动处理布局、分页和样式,省去手动排版的...最新AI资源# AI开源项目# AI生成演示文稿/PPT7个月前025.2K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...最新AI资源# AI开源项目# AI编程10个月前025.2K
code2prompt:将代码库转换为大模型可理解的prompt文件综合介绍 code2prompt 是一个开源的命令行工具,由开发者 Mufeed VH 创建并托管在 GitHub 上,旨在帮助用户将整个代码库快速转换为适合大语言模型(LLM)的提示(prompt...最新AI资源# AI开源项目7个月前025.2K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台综合介绍 AutoGPT是一个强大的平台,旨在帮助用户创建、部署和管理连续运行的AI代理,自动化复杂的工作流。该平台由Significant Gravitas开发,提供了多种工具和功能,使用户能够专注...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架10个月前025.2K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息综合介绍 MegaParse 是一个强大且多功能的文件解析工具,专为大语言模型(LLM)的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档,MegaPar...最新AI资源# AI开源项目# 文档提取与清洗10个月前025.2K
ANP:实现智能代理间安全高效通信的开源协议综合介绍 AgentNetworkProtocol(简称ANP)是一个开源协议项目,托管于GitHub,专注于为智能代理(AI Agents)提供安全、高效的通信解决方案。它通过三层架构——身份与加密...最新AI资源# AI开源项目7个月前025.2K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型综合介绍 Raycast-G4F(GPT4Free) 是一款强大的 Raycast 扩展工具,让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...最新AI资源# AI开源项目# AI本地化聊天应用# 免费大模型API9个月前025.2K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁...最新AI资源# AI开源项目# AI文本与图片转3D10个月前025.2K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型综合介绍 Step-Video-T2V是由StepFun AI(阶跃星辰)推出的一款先进的文本到视频转换模型。该模型拥有30亿参数,能够生成长达204帧的视频。通过深度压缩变分自编码器(VAE),模型...最新AI资源# AI开源项目# AI文本转视频8个月前025.2K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型综合介绍 Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入,并实时生成文本或自然语音响应。这款模型于 2025 年 3 ...最新AI资源# AI开源项目# 多模态实时互动产品7个月前025.1K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件综合介绍 WhoDB 是一个轻量级(约20MB)、功能强大且用户友好的数据库管理工具,旨在简化数据库管理任务。它结合了 Adminer 的简洁性,并在用户体验和性能上进行了增强。WhoDB 使用 Go...最新AI资源# AI开源项目# AI数据分析11个月前025.1K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Ch...最新AI资源# AI开源项目1年前025.1K
LivePortrait:静态图像、视频生成动态肖像动画工具综合介绍 LivePortrait 是一款由快手科技开发的先进 AI 动态肖像动画工具。它利用创新的 AI 技术,将静态图像转化为生动的视频动画。无论是使用真实照片、动画风格还是艺术肖像,LivePo...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格11个月前025.1K
Shandu:多轮收集分析信息的AI研究自动化工具综合介绍 Shandu 是一个基于人工智能的开源研究系统,托管在GitHub上,由开发者jolovicdev创建。它利用 LangChain 和 LangGraph 技术,旨在为用户提供自动化、全面且...最新AI资源# AI开源项目# 生成深度研究报告7个月前025.1K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式综合介绍 MarkItDown是由微软开发的一个Python工具,旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型,包括PDF、PowerPoint、Word、Excel、图...最新AI资源# AI开源项目# 文档提取与清洗10个月前025.1K
NodeRAG:基于异构图的精准信息检索与生成工具综合介绍 NodeRAG 是一个开源的检索增强生成(RAG)系统,托管在 GitHub,由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成,显著提升检索精准度和上下文相关性。Nod...最新AI资源# AI开源项目# 知识检索与RAG框架6个月前025.1K
TreeGPT:可视化树状对话的AI聊天界面综合介绍 TreeGPT 是一个基于 Next.js 开发的开源聊天应用,专注于通过树状图结构(有向无环图,DAG)可视化与大型语言模型(LLM,如 GPT)的对话,取代传统的线性聊天方式,提升速度和...最新AI资源# AI开源项目# AI本地化聊天应用8个月前025.1K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种...最新AI资源# AI图像编辑# AI开源项目10个月前025.1K
SegAnyMo:从视频中自动分割任意运动物体的开源工具综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新AI资源# AI开源项目# AI抠图改背景# 视觉目标检测6个月前025.1K
olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别综合介绍 olmOCR 是由 Allen Institute for Artificial Intelligence (AI2) 的 AllenNLP 团队开发的一款开源工具,专注于将 PDF 文件转...最新AI资源# AI开源项目# 文档提取与清洗8个月前025.1K
CFG-Zero-star:提升图像和视频生成质量的开源工具综合介绍 CFG-Zero-star 是一个开源项目,由 Weichen Fan 和南洋理工大学 S-Lab 团队开发。它专注于改进流匹配模型中的分类器自由引导(CFG)技术,通过优化引导策略和零初始...最新AI资源# AI图像生成辅助工具# AI开源项目# AI视频生成工具7个月前025.1K
WeChatAI:Windows版微信群聊智能助手客户端综合介绍 WeChatAI 是一款基于 Python 开发的微信群聊和个人智能助手,支持多种大语言模型(如 DeepSeek、Gemini、通义千问),可以实现智能对话、自动回复等功能。该项目采用现代...最新AI资源# AI客服机器人# AI开源项目8个月前025.1K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型综合介绍 Leffa 是一个用于生成可控人物图像的统一框架,能够精确操控人物的外观(如虚拟试穿)和姿势(如姿势转移)。该框架通过在注意力层中引导目标查询关注正确的参考键,显著减少了细粒度细节的失真,同...最新AI资源# AI图像风格控制# AI开源项目# AI换脸与换装10个月前025.1K
LlamaEdge:本地运行和微调LLM的最快捷方式综合介绍 LlamaEdge是一个开源项目,旨在简化本地或边缘设备上运行和微调大型语言模型(LLM)的过程。该项目支持Llama2系列模型,并提供与OpenAI兼容的API服务,使用户能够轻松创建和运...最新AI资源# AI开源项目# 大模型微调9个月前025.1K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包综合介绍 Clone Voice 是一个开源的声音克隆工具,提供了一个基于Web的界面,允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单,即使没有NVIDIA GPU,也可以通过预编译的应...最新AI资源# AI开源项目# AI语音克隆1年前025.1K
Sidekick CLI:一个开源的 Claude Code 替代工具综合介绍 Sidekick CLI 是一个开源的命令行工具,旨在通过 AI 辅助简化开发者的项目开发和部署流程。它受到 Claude Code、Copilot 和 Cursor 的启发,提供类似的功能...最新AI资源# AI开源项目# AI编程6个月前025.1K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术综合介绍 Agentic Security是一个开源的LLM(大语言模型)漏洞扫描工具,旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击,能够集成LLM AP...最新AI资源# AI开源项目# prompt越狱8个月前025.1K
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台综合介绍 Comp AI 是一个开源平台,由 Comp AI, Inc. 开发,总部位于美国旧金山。它帮助企业通过自动化工具快速完成 SOC 2、ISO 27001 和 GDPR 等合规要求,目标是几...最新AI资源# AI开源项目# 专业生产力工具6个月前025.1K
AnkiAIUtils:Anki闪卡学习AI工具集,自动优化记忆卡片的智能助手综合介绍 AnkiAIUtils是一套专为Anki闪卡学习系统设计的人工智能增强工具集。该工具由一位医学院学生开发,旨在通过AI技术自动改进用户在学习过程中遇到困难的卡片。它能够智能地为用户提供个性化...最新AI资源# AI开源项目# AI教育工具9个月前025.1K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务综合介绍 Flow是一个轻量级的任务引擎,专为构建AI代理而设计,强调简洁性和灵活性。与传统的基于节点和边的工作流不同,Flow采用动态任务队列系统,支持并行执行、动态调度和智能依赖管理。其核心理念是...最新AI资源# AI开源项目# 低代码工作流10个月前025K
LangGraph CodeAct:生成代码帮助智能体解决复杂任务综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架,基于 CodeAct 架构(详见论文 arXiv:2402.01030)。它通过生成...最新AI资源# AI开源项目# 智能体开发框架7个月前025K
ALog:便携AI语音日记应用,支持语音转文字。综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文...最新AI资源# AI开源项目# AI语音转文本9个月前025K
GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型综合介绍 GPT4Free 是一个由开发者 xtekky 在 GitHub 上发布的开源项目,旨在免费提供多种强大的语言模型,包括 GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...最新AI资源# AI开源项目# AI集成多模型对话平台11个月前025K
BrowserTools MCP:实时监控浏览器活动的MCP服务综合介绍 BrowserTools MCP 是一个开源项目,由 AgentDeskAI 团队开发。它通过 Chrome 扩展和 Node.js 服务,让 AI 能实时监控浏览器活动,包括日志、网络请求...最新AI资源# AI开源项目# MCP服务7个月前025K
AstrBot:具有WebUI的AI聊天机器人接入平台综合介绍 AstrBot 是一个开源的聊天机器人开发框架,它支持 QQ、Telegram、微信等多种消息平台,并能轻松接入 OpenAI、DeepSeek、Google Gemini 等大语言模型(L...最新AI资源# AI客服机器人# AI开源项目6个月前025K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像综合介绍 OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别...最新AI资源# AI在线生成图像# AI开源项目11个月前025K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置综合介绍 DragGAN是一个基于生成对抗网络(GAN)的交互式图像编辑工具。该项目由Xingang Pan等人在2023年SIGGRAPH会议上发布,旨在通过简单的点选和拖拽操作,让用户能够直观地操...最新AI资源# AI图像编辑# AI开源项目10个月前025K
Open Codex:将自然语言转换为Shell命令的开源AI工具综合介绍 Open Codex 是一个开源的命令行AI工具,专为开发者设计,能将自然语言指令转换为精准的Shell命令。它使用本地语言模型(如 phi-4-mini),无需联网或API密钥,所有操作在...最新AI资源# AI开源项目6个月前025K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目,旨在帮助英语学习者高效掌握大学英语四级(CET-4)词汇。项目托管在GitHub上...最新AI资源# AI开源项目# AI教育工具8个月前025K
DiffRhythm(谛韵):10秒内生成最长4分45秒的歌曲综合介绍 DiffRhythm 是由 ASLP-lab(西北工业大学音频、语音与语言处理小组)开发的一个开源项目,专注于通过人工智能技术实现端到端的音乐创作。它基于潜扩散模型(Latent Diffu...最新AI资源# AI开源项目# AI音乐7个月前024.9K
SemHash:快速实现语义文本去重,提升数据清理效率综合介绍 SemHash 是一个轻量级且灵活的工具,用于通过语义相似性来去重数据集。它结合了 Model2Vec 的快速嵌入生成和 Vicinity 的高效 ANN(近似最近邻)相似性搜索。SemHa...最新AI资源# AI开源项目# 文档提取与清洗9个月前024.9K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI资源# AI开源项目# AI编程9个月前024.9K
MediaCrawler:多社交媒体平台内容、视频评论爬虫工具综合介绍 MediaCrawler是一个专为开发者设计的社交媒体内容爬虫工具。通过提供一个强大的爬虫功能,它能够快速地从小红书、抖音、快手、B站、微博等社交平台抓取视频、图片、评论、点赞、转发等数据...最新AI资源# AI开源项目1年前024.9K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码综合介绍 Onlook是一款开源的设计工具,专为设计师和开发者打造,允许用户直接在运行的React应用中进行设计,并将设计修改转换为代码。该工具提供了一种直观的视觉编辑体验,类似于Figma或Webf...最新AI资源# AI开源项目# AI页面设计9个月前024.9K
FoleyCrafter:为无声视频添加生动同步的音效综合介绍 FoleyCrafter 是一个由 OpenMMLab 开发的开源项目,旨在为无声视频生成生动且同步的音效。该项目利用先进的人工智能技术,通过分析视频内容,生成与之语义相关且时间同步的音效...最新AI资源# AI开源项目# AI音乐10个月前024.9K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体综合介绍 MedRAX是一个专为胸部X光片(CXR)分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型,能够动态处理复杂的医学查询,而无需额外训练。MedRAX通过其模块化设计...最新AI资源# AI开源项目# 智能体应用# 视觉目标检测7个月前024.9K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景综合介绍 Fay是一个开源的3D虚拟数字人框架,集成了语言模型和数字角色,适用于多种应用场景,如虚拟购物导购、虚拟主播、助理、服务员、教师以及基于语音或文本的移动助手。Fay框架支持全离线使用,提供毫...最新AI资源# AI开源项目# AI数字人9个月前024.9K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具综合介绍 PhotoDoodle 是一个开源的图像编辑工具,由 ShowLab 开发,专注于通过人工智能技术实现照片的艺术化编辑。用户只需输入简单的文本提示词,就能为真实照片添加卡通风格、3D效果、光...最新AI资源# AI图像编辑# AI开源项目7个月前024.9K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型综合介绍 腾讯混元文生视频(元宝 APP中可体验)是由腾讯推出的一款基于AI技术的视频生成平台。该平台利用腾讯混元大模型,具备强大的跨领域知识和自然语言理解能力,能够根据用户的文本描述生成高质量的视频...最新AI资源# AI开源项目# AI文本转视频9个月前024.9K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码综合介绍 Devika是一个先进的AI软件工程师,能够理解高阶人类指令,将其分解为步骤,研究相关信息,并编写代码以实现给定的目标。它利用大型语言模型、规划和推理算法以及网页浏览能力,智能地开发软件。D...最新AI资源# AI开源项目# AI编程# 智能体应用7个月前024.9K
推荐Github优秀开源下载工具在互联网高速发展的今天,下载工具作为用户获取信息和资源的重要手段,扮演着不可或缺的角色。本文将系统分析五款开源下载工具:AB Download Manager、XDM(Xtreme Download ...最新AI资源# AI开源项目1年前024.9K
PPTX2MD:将PPTX文件转换为Markdown的专用工具综合介绍 PPTX2MD是一个开源工具,旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发,支持保留标题、列表、文本格式(如粗体、斜体、颜色和超...最新AI资源# AI开源项目# 文档提取与清洗8个月前024.9K
n8n-mcp-server:与n8n工作流交互的MCP服务工具综合介绍 n8n-mcp-server 是一个开源项目,托管在 GitHub 上,由 Leonard Sellem 开发。它是一个 MCP(Model Context Protocol)服务工具,专门...最新AI资源# AI开源项目# MCP服务7个月前024.8K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具,作为 Proxy 的迷你版,采用开放权重设计。它基于 3B参数的视觉语言模型(VLM),能够自...最新AI资源# AI开源项目# 桌面自动化智能体7个月前024.8K
LocalGPT:在本地设备上与多文档对话,确保数据隐私综合介绍 LocalGPT是一个开源项目,旨在让用户在本地设备上与文档进行对话,确保数据隐私。通过使用各种开源模型,LocalGPT可以在不将数据上传到云端的情况下处理和理解文档内容。该项目支持多种平...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前024.8K
Orama:高性能全文本和向量搜索引擎综合介绍 Orama 是一个开源的高性能搜索引擎,完全用 TypeScript 编写,支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作,提供快速、可靠...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前024.8K
Deep Recall:为大模型提供企业级记忆框架的开源工具综合介绍 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支...最新AI资源# AI开源项目# 知识检索与RAG框架5个月前024.8K
MiMo:高效数学推理与代码生成的小型开源模型综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...最新AI资源# AI开源项目5个月前024.8K
Search-R1:强化学习训练大模型搜索与推理的工具综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...最新AI资源# AI开源项目# 大模型微调7个月前024.8K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具综合介绍 AI ContentCraft 是一个多功能的内容创作工具,集成了文本生成、语音合成、图像生成等功能。它可以帮助创作者快速生成故事、播客脚本和配套的音视频内容。该工具支持多种语言转换,能够批...最新AI资源# AI写作# AI开源项目9个月前024.8K
AI Chatbot:Vercel 构建和部署智能聊天机器人综合介绍 AI Chatbot 是一个由 Vercel 开发的开源项目,旨在帮助开发者快速构建和部署智能聊天机器人。该项目基于 Next.js 框架,并集成了多种 AI 模型提供商,如 OpenAI...最新AI资源# AI开源项目# AI本地化聊天应用10个月前024.8K
Gemini Teacher:英语口语发音纠正助手综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音,并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力,通...最新AI资源# AI开源项目# AI教育工具8个月前024.7K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)综合介绍 EchoMimic 是一个开源项目,旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发,利用可编辑的标志点条件,结合音频和面部标志点生成动态的肖像视频。EchoMimic...最新AI资源# AI开源项目# AI数字人9个月前024.7K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体10个月前024.7K
Paper2Code:将机器学习论文自动转化为可运行代码综合介绍 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划...最新AI资源# AI开源项目# 智能体应用5个月前024.7K
Emigo:在Emacs中使用AI完成复杂编程任务的助手综合介绍 Emigo 是一个专为 Emacs 设计的开源 AI 编程助手,由 MatthewZMD 在 GitHub 上开发。它通过集成大型语言模型(LLM),帮助程序员在 Emacs 中完成代码分析...最新AI资源# AI开源项目# AI编程6个月前024.7K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现综合介绍 开源NotebookLM是一个创新的人工智能项目,它结合了Deepseek-V3的语言理解能力和PlayHT的语音合成技术,旨在创建一个智能化的笔记对话系统。该项目由Build Fast w...最新AI资源# AI开源项目# AI文本与音频/视频总结工具9个月前024.7K
Data Formulator:AI驱动的数据可视化工具综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面(GUI)和自然语言输入(NL),使用户能够通过简单的交互和指令,快速创建和迭代...最新AI资源# AI开源项目# AI数据分析8个月前024.7K
VoiceCraft:开源零样本语音克隆与文本转语音工具综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音...最新AI资源# AI开源项目# AI语音克隆1年前024.7K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文综合介绍 AnyText是一个革命性的多语言视觉文本生成和编辑工具,基于扩散模型开发。它能够在图像中生成自然、高质量的多语种文本,并支持灵活的文本编辑功能。该项目由研究团队开发,并在ICLR 2024...最新AI资源# AI图像生成辅助工具# AI图像风格控制# AI开源项目10个月前024.7K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用综合介绍 Ai2 OLMoE是由Allen Institute for AI(简称Ai2,艾伦人工智能研究所)开发的一款开源iOS应用,旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...最新AI资源# AI大模型原生对话工具# AI开源项目# AI本地化聊天应用8个月前024.7K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI资源# AI开源项目# AI语音转文本10个月前024.7K
AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具综合介绍 AnimeGamer 是腾讯 ARC 实验室推出的一个开源工具。用户可以用简单的语言指令,比如“宗介开紫色车兜风”,生成动漫视频,还能让不同动漫角色互动,比如《魔女宅急便》的琪琪和《天空之城...最新AI资源# AI开源项目# AI视频生成工具# AI视频转换风格6个月前024.7K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集综合介绍 Harbor是一个革新性的容器化LLM工具集,专注于简化本地AI开发环境的部署和管理。它通过简洁的命令行界面(CLI)和配套应用程序,让开发者能够一键启动和管理包括LLM后端、API接口、前...最新AI资源# AI开源项目# 本地部署开源大模型工具9个月前024.7K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...最新AI资源# AI开源项目# 桌面自动化智能体9个月前024.7K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象综合介绍 OASIS(Open Agent Social Interaction Simulations)是一个开源的社交媒体模拟器,能够模拟多达一百万用户的行为。该平台结合了大型语言模型和基于规则的...最新AI资源# AI开源项目# 智能体应用7个月前024.6K
NextChat:兼容多平台的本地化AI聊天助手综合介绍 NextChat是一项革命性的AI聊天服务,允许用户部署与GPT-3、GPT-4、GPT-4.5和Gemini Pro等一流语言模型的聊天服务。它提供了优雅的用户界面、协作特性、集成、模板和...最新AI资源# AI开放服务# AI开源项目# AI本地化聊天应用8个月前024.6K
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码综合介绍 Morphic是一个基于AI技术的搜索引擎,采用生成式用户界面,旨在提供智能问答和高效搜索体验。用户可以通过Morphic进行多种搜索,包括文本、视频等,并能保存搜索历史,分享搜索结果。Mo...最新AI资源# AI开源项目# AI搜索工具11个月前024.6K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著...最新AI资源# AI开源项目# AI自部署图像生成工具11个月前024.6K
AgenticSeek:完全本地运行的任务自动化AI助手综合介绍 AgenticSeek 是一个完全本地运行的开源AI助手,基于 Deepseek R1 模型开发。它不需要云端API,也不产生每月数百美元的费用。它的目标是成为类似电影中“贾维斯”的智能助手...最新AI资源# AI开源项目# 智能体应用7个月前024.6K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...最新AI资源# AI开源项目# 桌面自动化智能体9个月前024.6K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具综合介绍 LangGraph Supervisor是一个基于LangGraph框架的Python库,专为创建和管理多智能体系统而设计。该库通过一个中央监督代理协调多个专门代理的工作,确保通信流和任务分...最新AI资源# AI开源项目# 智能体开发框架8个月前024.6K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告综合介绍 STORM是由斯坦福大学 Oval 团队开发的一个知识整合和文章生成系统。它专注于从头开始生成类似维基百科的详尽文章(成体系的论文)。系统利用大型语言模型进行话题研究,准备概要并模拟实际互联...最新AI资源# AI开源项目# 生成深度研究报告# 论文7个月前024.5K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具综合介绍 MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watso...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前024.5K
Cog-ComfyUI:使用API运行ComfyUI工作流综合介绍 Cog-ComfyUI是一个开源项目,旨在通过API运行ComfyUI工作流。该项目由GitHub用户fofr创建,提供了一种高效的方式来集成和运行ComfyUI工作流。ComfyUI是一种...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI9个月前024.5K
使用Cursor读取并修改Figma设计稿的MCP服务综合介绍 Cursor Talk to Figma MCP 是一个开源项目,通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figm...最新AI资源# AI开源项目# AI页面设计# MCP服务7个月前024.5K
SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一...最新AI资源# AI图像放大与修复# AI开源项目9个月前024.5K
OAK:可视化构建智能体应用的开源项目综合介绍 OAK(Open Agent Kit)是一个开源工具,帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型(LLM),比如OpenAI、Google或Anthropic的模型...最新AI资源# AI开源项目# 智能体应用7个月前024.5K
StarVector:从图像和文字生成SVG矢量图的基础模型综合介绍 StarVector 是一个开源项目,它由 Juan A. Rodriguez 等开发者创建,目的是将图像和文字转化为可缩放矢量图形(SVG)。这个工具使用视觉语言模型,能够理解图像内容和文...最新AI资源# AI图像风格控制# AI开源项目7个月前024.5K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库综合介绍 RAG Web UI 是一个基于 RAG(检索增强生成)技术的智能对话系统。它帮助企业和个人构建基于自身知识库的智能问答系统。通过结合文档检索和大语言模型,RAG Web UI 提供准确可靠...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前024.5K
infinite-zoom-stable-diffusion:生成无限缩放循环视频综合介绍 无限缩放稳定扩散(Infinite Zoom Stable Diffusion)是一个开源项目,旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本,用户可以通过...最新AI资源# AI开源项目# AI视频转换风格9个月前024.5K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发综合介绍 Dynamiq是一个开源的AI编排框架,专为代理AI和大语言模型(LLM)应用而设计。它旨在简化AI驱动应用程序的开发,特别是在检索增强生成(RAG)和LLM代理的编排方面。Dynamiq提...最新AI资源# AI开源项目# 智能体开发框架11个月前024.4K