PaddleOCR:基于飞桨的多语言OCR工具库,支持80多种语言识别综合介绍 PaddleOCR 是一个基于 PaddlePaddle 的多语言 OCR 工具包,旨在提供实用且超轻量级的 OCR 系统。它支持超过 80 种语言的识别,并提供数据标注和合成工具,支持在服...最新AI资源# AI开源项目# OCR12个月前049.1K
Kimi-Audio:开源音频处理与对话基础模型综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 130...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本7个月前048.7K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程Excalidraw 综合介绍 Excalidraw是一款开源的虚拟白板绘图工具,可以让您轻松地绘制具有手绘风格的图表。您可以使用Excalidraw创建美观的手绘风格的图解、线框图、或者任何您喜欢的...最新AI资源# AI开源项目# AI白板与信息图1年前048.5K
BabelDOC:将PDF文档翻译成双语对照的开源工具综合介绍 BabelDOC 是一个开源工具,专门用来把 PDF 文档翻译成双语对照格式。它由 funstory-ai 团队开发,托管在 GitHub 上,主要服务于需要处理外语文档的用户,比如研究人员...最新AI资源# AI开源项目# AI翻译6个月前048.5K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据综合介绍 Crawl4AI 是一个开源的异步网页爬虫工具,专为大型语言模型(LLMs)和人工智能(AI)应用设计。它简化了网络爬虫和数据提取流程,支持高效的网页爬取,并提供对 LLM 友好的输出格式...最新AI资源# AI开源项目1年前048.4K
WeChatFerry:功能全面的微信机器人开发框架综合介绍 WeChatFerry 是一个开源的微信机器人底层框架,由开发者 lich0821 在 GitHub 上创建并维护。该项目通过微信 Hook 技术,提供了一套强大的 SDK,允许开发者将微信...最新AI资源# AI客服机器人# AI开源项目9个月前048.4K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案综合介绍 NocoDB 是一个开源的Airtable替代方案,旨在提供一个强大且易于使用的在线数据库管理工具。通过NocoDB,用户可以轻松创建、读取、更新和删除数据库中的数据,无需编写代码。该平台支...最新AI资源# AI开源项目# AI数据分析1年前048.2K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具综合介绍 ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换,采用Co...最新AI资源# AI开源项目# AI文本转语音11个月前048.2K
OpenSPG:开源知识图谱引擎综合介绍 OpenSPG是由蚂蚁集团与OpenKG合作开发的开源知识图谱引擎,基于SPG(语义增强可编程图)框架。该引擎旨在提供显式语义表示、逻辑规则定义和操作框架等功能,支持领域知识图谱的构建和管理...最新AI资源# AI开源项目# 知识图谱1年前048K
Suna:集成浏览器操作与数据分析的智能代理综合介绍 Suna 是 Kortix AI 开发的一个开源通用 AI 代理,托管在 GitHub 上,基于 Apache 2.0 许可证,允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成...最新AI资源# AI开源项目# 桌面自动化智能体# 生成深度研究报告7个月前047.9K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载综合介绍 Comics Downloader 是一个开源工具,旨在帮助用户从各种网站下载漫画和漫画书。该工具支持多种文件格式,包括 PDF、EPUB、CBR 和 CBZ,使用户能够根据自己的需求选择合...最新AI资源# AI开源项目11个月前047.8K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表综合介绍 WrenAI是一个开源的SQL AI助手,专门设计用于帮助数据团队、产品团队和业务团队通过自然语言对话的方式获取数据洞察。它能够将自然语言转换为SQL查询,生成图表、电子表格和报告,支持多语...最新AI资源# AI开源项目# AI数据分析11个月前047.8K
Linly-Dubbing:智能视频多语言AI配音/翻译工具综合介绍 Linly-Dubbing 是一个智能多语言AI配音和翻译工具,旨在通过整合先进的AI技术,为用户提供高质量的多语言视频配音和字幕翻译服务。该工具特别适用于国际教育、全球内容本地化等场景,帮...最新AI资源# AI开源项目# AI翻译10个月前047.7K
Playwright MCP:微软推出的浏览器自动化MCP服务综合介绍 Playwright MCP 是微软开发的一款开源工具,托管在 GitHub 上。它通过 Model Context Protocol(MCP)协议,让人工智能模型能直接控制浏览器,完成打开...最新AI资源# AI开源项目# MCP服务# 桌面自动化智能体8个月前047.7K
TimesFM 2.0:谷歌开源进行时间序列预测的预训练模型综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型,专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下...最新AI资源# AI开源项目11个月前047.6K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库综合介绍 MaxKB(Max Knowledge Base)是一款基于大语言模型和RAG(检索增强生成)的开源知识库问答系统。该系统广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。MaxKB...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前047.5K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步综合介绍 MuseV是一个GitHub上的公共项目,旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术,并提供了Image2Video、Text2Image2Video、Video2Video...最新AI资源# AI开源项目# AI数字人# 口型同步12个月前047.4K
Langfuse:开源的 LLM 应用观测与调试平台综合介绍 Langfuse 是一个开源的 LLM(大语言模型)工程平台。它帮助开发者追踪、调试和优化 LLM 应用,提供观测调用、管理提示词、运行实验和评估结果的工具。平台由 Langfuse 团队开...最新AI资源# AI开源项目8个月前047.3K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本综合介绍 Cursor Reset是一个用于重置Cursor IDE设备标识的PowerShell脚本工具,支持Cursor 0.45.x版本。该工具旨在帮助用户在Cursor IDE中重置设备标识...最新AI资源# AI开源项目10个月前047.2K
E2B:安全云沙箱中的AI代码运行平台综合介绍 E2B是一个开源平台,专为在安全的云沙箱中运行AI生成的代码而设计。它支持多种编程语言和框架,提供了一个隔离的虚拟环境,确保代码执行的安全性和可靠性。E2B适用于各种AI应用场景,包括数据分...最新AI资源# AI开源项目11个月前047.2K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实...最新AI资源# AI开源项目# 低代码工作流# 知识检索与RAG框架10个月前047.1K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署综合介绍 Dify 是一个开源的生成式 AI 应用开发平台,旨在帮助开发者快速构建和运营基于大型语言模型(LLM)的原生 AI 应用。平台提供了从 Agent 构建到 AI 工作流编排、RAG 检索...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架10个月前046.9K
wechat-article-exporter:一键部署微信公众号文章批量导出工具综合介绍 wechat-article-exporter 是一个开源工具,旨在帮助用户批量导出微信公众号文章。该工具支持导出文章中的内嵌音视频,无需搭建任何环境,能够100%还原文章样式,并支持私有部...最新AI资源# AI开源项目1年前046.9K
Smolagents:快速开发AI智能体,轻量级构建智能体的开源项目综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...最新AI资源# AI开源项目# 智能体开发框架11个月前046.9K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库,具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发,旨在为需要快速、准确语音转文字的应用提供支持...AI新闻# AI开源项目# AI语音转文本10个月前046.8K
MobileAgent:多代理协作的移动设备操作助手综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...最新AI资源# AI开源项目# 桌面自动化智能体10个月前046.8K
HippoRAG:基于长时记忆的多跳知识检索框架综合介绍 HippoRAG 是俄亥俄州立大学 OSU-NLP 小组开发的一个开源框架,灵感来源于人类长时记忆机制。它结合检索增强生成(RAG)、知识图谱和个性化 PageRank 技术,帮助大语言模型...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前046.7K
RooFlow:基于 Roo Code 扩展的记忆增强系统综合介绍 RooFlow 是一个开源的AI辅助编程工具,核心功能是通过项目记录保存开发过程中的代码、决策和任务进展。它基于Roo Code扩展,集成了五种模式:架构、编码、测试、调试和问答。这些模式互...最新AI资源# AI开源项目# AI编程7个月前046.6K
OpenManus:MetaGPT推出的开源版Manus综合介绍 OpenManus 是一个开源项目,旨在帮助用户通过简单配置在本地运行智能体,实现各种创意想法。它由 MetaGPT 社区的成员 @mannaandpoem、@XiangJinyu、@Mos...最新AI资源# AI开源项目# 智能体开发框架9个月前046.6K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架综合介绍 Browser Use Web UI是一个创新的开源项目,专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上,通过Gradio构建了一个用...最新AI资源# AI开源项目# 桌面自动化智能体6个月前046.3K
Void:基于VSCode的开源Cursor替代品综合介绍 Void是一个开源的Cursor替代品,基于vscode仓库的分支。它提供了一个强大的开发环境,旨在为开发者提供更高效的编码体验。Void的目标是通过社区贡献和快速迭代,不断提升其功能和稳定...最新AI资源# AI开源项目# AI编程1年前046.2K
Wan2.1:在消费级 GPU 上生成高质量视频综合介绍 Wan2.1 是由 Wan-Video 团队开发并在 GitHub 上开源的一个视频生成工具套件,专注于通过人工智能技术推动视频创作的边界。它基于先进的扩散变换器架构,集成了独特的时空变分自...最新AI资源# AI开源项目# AI文本转视频9个月前046.1K
微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台综合介绍 微信视频号下载器是一个开源项目,旨在帮助用户快速下载微信视频号中的视频内容。该工具支持多种视频格式和平台,用户可以方便地在Windows和macOS系统上使用。项目由ltaoo开发,并托管在...最新AI资源# AI开源项目11个月前046K
Kokoro WebGPU:浏览器中离线运行的文本转语音服务综合介绍 Kokoro WebGPU是Kokoro文本转语音(TTS)模型的WebGPU版本,由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术,使用户能...最新AI资源# AI开源项目# AI文本转语音10个月前046K
RF-DETR:实时视觉对象检测开源模型综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构,核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...最新AI资源# AI开源项目# 视觉目标检测8个月前046K
A2A:谷歌发布AI智能间通信的开放协议综合介绍 A2A(Agent2Agent)是谷歌开发的一个开源协议,目的是让不同框架或厂商开发的AI智能体能够互相通信和协作。它提供了一套标准化的方法,让智能体可以发现彼此的能力、分担任务并完成工作...最新AI资源# AI开源项目# 智能体开发框架8个月前046K
OmniSVG:从文本和图像生成SVG矢量图形的开源项目综合介绍 OmniSVG 是一个开源项目,专注于通过多模态模型生成高质量矢量图形(SVG)。它利用预训练的视觉-语言模型,支持从文本描述或图像输入生成 SVG,涵盖简单图标到复杂动漫角色的多种场景。项...最新AI资源# AI图像风格控制# AI开源项目8个月前045.9K
Meeting:本地实时转录和生成会议纪要的开源客户端综合介绍 Meeting Minutes(又名 Meetily)是由 Zackriya Solutions 开发的一款免费开源的 AI 会议助手工具,专注于实时捕获会议音频、生成转录文本并自动提取会议...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI语音转文本9个月前045.9K
bilive:B站无人监守直播录制与自动切片、上传工具综合介绍 bilive是一个专为B站直播录制设计的工具,提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器,支持7x24小时无人值守录制,自动识别并渲染弹幕和字幕,自动切片并...最新AI资源# AI开源项目# AI音视频编辑10个月前045.9K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)综合介绍 MaskGCT(Masked Generative Codec Transformer)是由趣丸科技和香港中文大学联合推出的一个完全非自回归的文本到语音(TTS)模型。该模型无需显式的文本与...最新AI资源# AI开源项目# AI语音克隆1年前045.8K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)综合介绍 Graphiti是由 getzep 开发的一款用于构建和查询动态、时间感知的知识图谱的工具。它能够表示实体之间复杂且不断变化的关系,并通过时间、全文、语义和图算法等多种方法进行查询。Grap...最新AI资源# AI开源项目# 知识图谱9个月前045.8K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板综合介绍 n8n自托管AI入门套件是一个开源的Docker Compose模板,旨在快速初始化一个全面的本地AI和低代码开发环境。由n8n团队精心策划,该套件结合了自托管的n8n平台和一系列兼容的AI...最新AI资源# AI开源项目10个月前045.7K
edge-tts:文本转语音Python模块|免费文本转语音服务综合介绍 edge-tts是一个开源的Python模块,允许用户在Python代码中使用微软Edge的在线文本转语音服务,而无需Microsoft Edge浏览器、Windows操作系统或API密...最新AI资源# AI开源项目# AI文本转语音1年前045.6K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验综合介绍 Linly-Talker 是一个创新的数字人对话系统,结合了大语言模型(LLMs)与视觉模型,创造出一种新颖的人机互动方式。该系统集成了多种技术,如 Whisper、Linly、Micros...最新AI资源# AI开源项目# AI数字人10个月前045.5K
Qlib:微软开发的AI量化投资研究工具综合介绍 Qlib 是微软开发的一个开源平台,专注于用 AI 技术帮助用户研究量化投资。它从最基本的数据处理开始,支持用户探索投资想法并将其变成可用的策略。平台简单易用,适合想用机器学习提升投资研究的...最新AI资源# AI开源项目# AI金融数据分析8个月前045.3K
Onyx:连接企业知识库的智能AI聊天平台综合介绍 Onyx(原名Danswer)是一个开源的AI聊天平台,由onyx-dot-app团队开发,旨在帮助企业整合和管理文档、应用及员工数据。它提供丰富的聊天功能,支持连接任意大语言模型(LLM...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前045.2K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等综合介绍 经常要下载YouTube和Twitter视频,所以找到了这款免费无广告的视频下载器。Cobalt 是一个开源的媒体下载工具,旨在提供用户友好的下载体验。它支持从多个平台下载视频和音频内容,包...最新AI资源# AI开源项目11个月前045.1K
Midscene.js:用AI驱动浏览器自动化测试的开源插件综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具,能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本,简化了UI测...最新AI资源# AI开源项目# 桌面自动化智能体10个月前044.9K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程综合介绍 MetaGPT 是一个创新的多智能体框架,旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan(Alexander Wu)创建,目标是将不同角色的GPT模型组合成一个协作实体...最新AI资源# AI开源项目# AI编程# 智能体开发框架9个月前044.9K
Repomix:打包代码库为一个文本文件以便大模型检索综合介绍 Repomix(前称Repopack)是一款开源工具,专门用于将整个代码库打包成一个单一的、AI友好的文件。这个工具可以让开发者轻松地将他们的代码库提供给大语言模型(如Claude、Chat...最新AI资源# AI开源项目# 文档提取与清洗10个月前044.8K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习综合介绍 Cognee是一个专为AI应用和AI代理设计的可靠数据层解决方案。旨在加载和构建LLM(大型语言模型)上下文,通过知识图谱和向量存储创建准确和可解释的AI解决方案。该框架有利于成本节约、可解...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架10个月前044.5K
Magic MCP:生成现代化UI组件的MCP服务综合介绍 Magic MCP 是由 21st.dev 团队开发的一款 AI 驱动工具,专为前端开发者设计。它能通过自然语言描述即时生成现代化的 UI 组件,集成在 Cursor、WindSurf 和 ...最新AI资源# AI开源项目# AI页面设计# MCP服务9个月前044.4K
文多多 AiPPT:AI生成PPT,演讲稿生成综合介绍 AiPPT 是一个基于人工智能技术的PPT生成工具,旨在帮助用户快速创建专业演示文稿。它通过输入主题、上传文件或提供网址等方式,自动生成内容丰富、设计精美的幻灯片,支持原生图表、动画和3D特...最新AI资源# AI开源项目# AI生成演示文稿/PPT9个月前044.4K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频综合介绍 TRV 是一个开源工具,托管于 GitHub,旨在帮助用户将幻灯片和演讲笔记快速转化为带有旁白的视频。它通过简单的命令行操作,将输入的演示文稿文件自动生成音频和视频内容,适合需要快速制作演示...最新AI资源# AI开源项目# AI视频生成工具9个月前044.3K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架综合介绍 Eliza是一个先进的多智能体(Multi-Agent)开发框架,致力于简化自主智能体(Autonomous Agent)的构建和部署过程。它支持部署多个具有不同角色设定的智能体,可实现智能...最新AI资源# AI开源项目# 智能体开发框架11个月前044.2K
AutoGen Studio:多代理系统AutoGen的简易用户界面版综合介绍 AutoGen Studio 2.0 是一个由 AutoGen 提供支持的用户界面,旨在简化创建和管理多代理解决方案的过程。该平台通过直观的界面,使用户能够声明性地定义和修改代理及其工作流程...最新AI资源# AI开源项目# 智能体开发框架10个月前044.1K
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API综合介绍 DDG-Chat 是一个开源项目,旨在提供一个可以一键部署到多种平台的 ChatGPT API 后端。该项目支持多种模型,包括 GPT-4o mini、Claude 3 Haiku、Llam...最新AI资源# AI开源项目# 免费大模型API1年前044.1K
Abogen:将多种文本格式转换为有声读物的工具综合介绍 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物...最新AI资源# AI开源项目# AI语音转文本7个月前044.1K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持综合介绍 J.A.R.V.I.S.(Just A Rather Very Intelligent System)是一个智能代码助手,旨在利用多种最先进的语言模型来帮助开发者进行代码生成、修改和技术讨论...最新AI资源# AI开源项目# AI编程11个月前043.9K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化综合介绍 RMBG-2-Studio 是一款基于 BRIA-RMBG-2.0 模型开发的增强型背景移除和替换应用。该应用旨在为用户提供高效、准确的图像背景处理功能,适用于各种图像类型,包括电商、游戏和...最新AI资源# AI开源项目# AI抠图改背景12个月前043.9K
Orion:小米开源的端到端自动驾驶推理与规划框架综合介绍 Orion 是小米实验室开发的开源项目,专注于端到端(E2E)自动驾驶技术。它通过视觉语言模型(VLM)和生成式规划器,解决传统自动驾驶方法在复杂场景中因果推理不足的问题。Orion 整合长...最新AI资源# AI开源项目8个月前043.9K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面综合介绍 SP-MangaEditer 是一个独立的漫画编辑平台,专为漫画创作者设计。该平台支持图像生成、图层编辑、图像调整、滤镜应用等多种功能,帮助用户轻松创建高质量的漫画插图。用户可以通过简单的操...最新AI资源# AI图像生成辅助工具# AI开源项目11个月前043.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程综合介绍 ComfyUI-disty-Flow 是一个为 ComfyUI 提供用户友好界面的自定义节点。它旨在通过提供替代用户界面来简化工作流程的运行,而不是替代工作流程的创建。ComfyUI-dis...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI10个月前043.8K
ImBD:AI生成内容检测,检测内容是否由人工智能生成综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目,该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用,识别A...最新AI资源# AI开源项目# AI教育工具11个月前043.8K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型综合介绍 DeepSeek-VL2 是一系列高级的 Mixture-of-Experts (MoE) 视觉语言模型,显著提升了其前身 DeepSeek-VL 的性能。该模型在视觉问答、光学字符识别、文...最新AI资源# AI开源项目# 多模态实时互动产品10个月前043.7K
DeepFace:实现面部年龄、性别、情绪、种族识别的轻量级Python库综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析(包括年龄、性别、情绪和种族)的Python库。它集成了多种先进的面部识别模型,如VGG-Face、FaceNet、OpenFace、De...最新AI资源# AI开源项目10个月前043.6K
CrewAI:多角色扮演协作智能框架,简化复杂任务综合介绍 CrewAI 是一个先进的框架,旨在协调角色扮演和自主AI代理的协作。通过促进协作智能,CrewAI 使代理能够无缝协作,解决复杂任务。无论是构建智能助手平台、自动化客户服务团队,还是多代理...最新AI资源# AI开源项目# 智能体开发框架11个月前043.6K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本综合介绍 GitIngest 是一个开源工具,旨在将 GitHub 代码库转化为适合大语言模型(LLM)提示的文本。通过简单的操作,用户可以将任何 GitHub 仓库的内容提取并格式化为适合 LLM ...最新AI资源# AI开源项目# 文档提取与清洗12个月前043.6K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架综合介绍 RuoYi AI 是一个基于 ruoyi-plus 框架开发的后端项目,专注于集成 AI 聊天和绘画功能。它完全开源免费,采用 Java17 和 SpringBoot 3.X 技术栈,后台管...最新AI资源# AI副业赚钱项目# AI开源项目9个月前043.5K
Grok-Mirror:一键部署可盈利的Grok镜像站综合介绍 Grok-Mirror是一个基于 无服务器快速部署Grok3国内镜像站 构建的可经营的Grok镜像站。它让用户可以通过Docker一键部署本地Grok服务站。Grok是xAI公司推出的人工智...最新AI资源# AI副业赚钱项目# AI开源项目8个月前043.5K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频综合介绍 MatAnyone 是一个专注于视频抠像的开源项目,由新加坡南洋理工大学 S-Lab 的研究团队开发并在 GitHub 上发布。它通过一致性记忆传播技术,为用户提供稳定高效的视频处理能力,尤...最新AI资源# AI开源项目# AI音视频编辑9个月前043.5K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具综合介绍 Hunyuan3D-2 是腾讯开发的一个开源项目,旨在通过文字或图像生成高分辨率的3D模型。它由两个核心部分组成:形状生成模型(Hunyuan3D-DiT)和纹理生成模型(Hunyuan3D...最新AI资源# AI开源项目# AI文本与图片转3D8个月前043.5K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...最新AI资源# AI开源项目# AI文本转语音10个月前043.4K
Agno:构建具备记忆、知识和工具的多模态智能体框架综合介绍 Agno 是一个由 agno-agi 团队开发并托管于 GitHub 的开源 Python 库,致力于让开发者轻松构建具备记忆、知识和工具的 AI 智能体。它支持文本、图像、音频和视频等多模...最新AI资源# AI开源项目# 智能体开发框架9个月前043.4K
Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用综合介绍 Steel Browser是一个开源的浏览器API,专为AI代理和应用程序设计。它提供了一个完整的浏览器实例,允许用户在不需要担心基础设施的情况下自动化网页操作。Steel Browser支...最新AI资源# AI开源项目12个月前043.3K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Ze...最新AI资源# AI开源项目# 文档提取与清洗10个月前043.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播综合介绍 Deep Live Cam 是一个开源的人工智能工具,旨在通过单张照片实现实时换脸和深度伪造视频生成。该工具利用先进的深度学习算法,能够在直播或视频通话中实时替换人脸,保护用户隐私并增加趣味...最新AI资源# AI开源项目# AI视频换脸1年前043.3K
Reader API:网页内容提取工具,HTML转换为Markdown格式综合介绍 Jina AI的Reader项目是一个开源工具(Reader 开源地址),可将任何URL通过添加前缀https://r.jina.ai/转换成适合大型语言模型(Large Languag...最新AI资源# AI开源项目# 文档提取与清洗1年前043.2K
Page Assist:本地AI模型对话与检索文档的网页助手插件综合介绍 Page Assist 是一个开源的浏览器扩展,旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展,用户可以在任何网页上打开一个侧边栏,与本地运行的AI模型进行互动。Page Assi...最新AI资源# AI开源项目# AI本地化聊天应用# 浏览器AI助手8个月前043.1K
Open Deep Research:LangChain开源的深度研究智能助手综合介绍 Open Deep Research 是一个基于网络的研究助手,能够生成有关任何主题的综合研究报告。该系统采用计划和执行的工作流程,用户可以先对报告结构进行规划并审阅,然后进入耗时的研究阶段...最新AI资源# AI开源项目# 生成深度研究报告8个月前043.1K
让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展,旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid...最新AI资源# AI开源项目10个月前043K
Prompt Optimizer:优化主流AI模型提示词的开源工具综合介绍 Prompt Optimizer 是一个专注于提示词优化的开源工具,由 linshenkx 在 GitHub 上开发。它能够帮助用户通过智能算法优化 AI 模型的提示词,从而提升生成内容的质...最新AI资源# AI开源项目# PROMPTS辅助工具9个月前042.9K
FlowiseAI:构建自定义LLM应用的节点拖放界面综合介绍 FlowiseAI 是一个开源的低代码工具,旨在帮助开发者构建自定义的LLM(大语言模型)应用和AI代理。通过简单的拖放界面,用户可以快速创建和迭代LLM应用,从测试到生产的过程变得更加高效...最新AI资源# AI开源项目# 低代码工作流10个月前042.9K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库,旨在通过结构化文本生成来提升大语言模型(LLM)的应用能力。该库支持多种模型集成,包括 OpenAI、transformers...最新AI资源# AI开源项目# 文档提取与清洗10个月前042.8K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力综合介绍 Dify-WebUI 是一个基于 Dify API 的现代化桌面智能对话应用,旨在为企业提供强大的 AI 对话能力。该应用支持多种预设主题颜色,满足企业个性化需求,并且具备知识库管理功能,支...最新AI资源# AI开源项目# AI本地化聊天应用11个月前042.7K
IC-Light(V2):图像照明控制神器,控制图像光影和背景综合介绍 IC-Light是一个用于图像照明控制的项目,旨在通过先进的AI模型操控图像的光照效果。该项目由Lvmin Zhang等人开发,提供了两种主要模型:文本条件重光模型和背景条件模型。用户可以通...最新AI资源# AI图像风格控制# AI开源项目12个月前042.7K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务综合介绍 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即...最新AI资源# AI开源项目# MCP服务7个月前042.7K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT综合介绍 PPTAgent是一个创新的系统,旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法,采用两步流程确保内容质量和视觉效果。此外,PPTAgent还引入了PPTEval,一个全面...最新AI资源# AI开源项目# AI生成演示文稿/PPT10个月前042.6K
小红书AI运营助手:自动生成和发布小红书文章综合介绍 小红书AI运营助手(xhsaipublisher)是一个专为在小红书平台上发布文章而设计的自动化工具。该项目结合了图形用户界面与自动化脚本,利用大模型技术生成内容,并通过浏览器自动登录和发布...最新AI资源# AI副业赚钱项目# AI开源项目11个月前042.6K
GFPGAN:腾讯开源的人脸修复算法综合介绍 GFPGAN(Generative Facial Prior GAN)是由腾讯ARC(Applied Research Center)开发的一种开源人脸修复算法。该算法利用预训练的面部GAN...最新AI资源# AI图像放大与修复# AI开源项目1年前042.6K
TRELLIS:Microsoft开发的3D资产生成模型,支持多种格式和灵活编辑综合介绍 TRELLIS是一个由Microsoft开发的大型3D资产生成模型。它能够接收文本或图像提示,并生成各种格式的高质量3D资产,如辐射场、3D高斯和网格。TRELLIS的核心是统一的结构化潜在...最新AI资源# AI开源项目# AI文本与图片转3D12个月前042.6K
GraphRAG-Dify:让Dify具备GraphRAG能力综合介绍 GraphRAG-Dify是一个开源项目,旨在结合GraphRAG和Dify技术,快速创建和部署AI Agent。该项目利用FastAPI和Uvicorn进行服务搭建,并支持DSL导入,方便...最新AI资源# AI开源项目# 知识图谱1年前042.5K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps综合介绍 LiteAvatar 是由 HumanAIGC 团队(阿里旗下)开发的一款开源工具,专注于通过音频实时驱动2D虚拟形象生成面部动画。它仅依靠CPU就能以30帧每秒(fps)的速度运行,特别适...最新AI资源# AI开源项目# AI数字人9个月前042.5K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LL...最新AI资源# AI开源项目# 文档提取与清洗1年前042.4K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能综合介绍 MiniPerplx(更名为Scira)是一个极简主义设计的AI驱动搜索引擎,它整合了多种实用功能,为用户提供全方位的信息检索服务。该项目采用现代化的技术栈,包括Next.js、Tailwi...最新AI资源# AI开源项目# AI搜索工具11个月前042.4K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。综合介绍 OpenWebUI-Monitor 是一个用于监控 OpenWebUI 用户活动和管理使用限额的仪表板。它可以高效地设置用户配额,实时查看用户数据和可视化信息,支持一键部署,方便用户管理和监...最新AI资源# AI副业赚钱项目# AI开源项目1年前042.4K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量...最新AI资源# AI开源项目# AI文本转语音10个月前042.4K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)综合介绍 Anon-Kode 是一个基于终端操作的开源AI代码助手,由开发者 Daniel Nakov 在 GitHub 上推出。它专为程序员设计,通过集成支持 OpenAI 风格 API 的语言模型...最新AI资源# AI开源项目# AI编程9个月前042.3K
Gemini-OpenAI:反代Gemini地址绕过区域限制并转换为OpenAI兼容API综合介绍 Gemini OpenAI API代理是一个免费且无需服务器维护的OpenAI兼容端点。用户可以轻松将其部署到Vercel、Netlify和Cloudflare等平台,适用于个人使用。该项目...最新AI资源# AI开源项目11个月前042.2K