TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号综合介绍 ai-trend-publish 是一个在 GitHub 上托管的开源项目,由 OpenAISpace 团队开发,专注于实时追踪和发布人工智能领域的最新趋势。这个工具旨在帮助开发者、技术爱好...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前059K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站综合介绍 AutoFlow 是由 PingCAP 开发的开源工具,旨在通过 TiDB 无服务器向量存储构建基于图的知识库。它集成了 LlamaIndex 和 DSPy 框架,支持复杂的对话搜索和知识图...最新AI资源# AI客服机器人# AI开源项目# 知识图谱1年前059K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...最新AI资源# AI开源项目# 多模态实时互动产品1年前058.9K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用综合介绍 Gemini Next Chat 是一个开源项目,旨在帮助用户轻松部署私人Gemini应用。该项目支持Gemini 1.5和Gemini 2.0多模态模型,用户可以通过一键部署在Vercel...最新AI资源# AI开源项目# AI本地化聊天应用1年前058.9K
GenXD:生成任意3D和4D场景视频的开源框架综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...最新AI资源# AI开源项目# AI文本与图片转3D1年前058.9K
VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度综合介绍 VoAPI 是一个全新的高颜值、高性能的 AI 模型接口管理与分发系统,主要用于个人或企业内部的管理与分发渠道。该系统基于 NewAPI 开发,提供了丰富的功能模块和优化的用户界面,旨在提升...最新AI资源# AI开放服务# AI开源项目1年前058.9K
Ovis:视觉与文本对齐模型,精准反推图像提示词综合介绍 Ovis(Open VISion)是由阿里巴巴国际数字商业集团的 AIDC-AI 团队开发的一款开源多模态大语言模型(MLLM),托管于 GitHub。该模型采用创新的结构嵌入对齐技术,将视...最新AI资源# AI图像生成辅助工具# AI开源项目1年前058.9K
Atomic Agents:构建轻量级模块化AI智能体框架综合介绍 Atomic Agents 是一个围绕原子性概念设计的极其轻量级和模块化的框架,用于构建代理AI管道和应用程序。该框架提供了一组工具和代理,可以组合创建强大的应用程序。它基于 Instruc...最新AI资源# AI开源项目# 智能体开发框架1年前058.9K
Lux:几乎支持所有视频平台的命令行视频下载器综合介绍 Lux 是一个用 Go 语言编写的快速且简单的视频下载库和命令行工具。它支持从多个网站下载视频,包括 YouTube、Bilibili、优酷等。Lux 提供了多种下载选项和功能,如多线程下载...最新AI资源# AI开源项目1年前058.8K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码综合介绍 Micro-Agent是由Builder.io开发的一款开源AI编码助手,旨在为开发者提供自动生成和测试代码的功能。它通过理解自然语言描述生成测试用例,并迭代代码直到所有测试通过,从而减少开...最新AI资源# AI开源项目# AI编程1年前058.8K
Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件综合介绍 Artab 是一个浏览器扩展程序,旨在每次打开新标签页时展示世界上最伟大的艺术作品。该扩展程序适用于 Chrome、Edge 和 Firefox 浏览器。通过 Artab,用户可以在日常浏览...最新AI资源# AI开源项目1年前058.8K
集成多种先进语音合成服务的开源运营项目综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音1年前058.8K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型,旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中,显著提升了医疗图...最新AI资源# AI开源项目# 视觉目标检测1年前058.7K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容综合介绍 社交媒体代理(Social Media Agent)是一个开源项目,由全新的 Agent Inbox 管理交互信息,旨在帮助用户自动生成和管理社交媒体内容。该项目由LangChain团队开发...最新AI资源# AI开源项目# AI社交媒体1年前058.7K
OpenDeepSearch:支持智能推理的开源搜索工具综合介绍 OpenDeepSearch 是一个开源的搜索工具,由 sentient-agi 团队开发。它结合了大型语言模型(LLM)和智能推理代理,让用户可以用简单的方式搜索网页信息并获取准确答案。这...最新AI资源# AI开源项目# AI搜索工具1年前058.6K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单综合介绍 PydanticAI是一个基于Pydantic的Python代理框架,旨在简化生成式AI应用的开发。它由Pydantic团队开发,支持多种模型(如OpenAI、Gemini、Groq等),并...最新AI资源# AI开源项目1年前058.6K
LivePortrait:静态图像、视频生成动态肖像动画工具综合介绍 LivePortrait 是一款由快手科技开发的先进 AI 动态肖像动画工具。它利用创新的 AI 技术,将静态图像转化为生动的视频动画。无论是使用真实照片、动画风格还是艺术肖像,LivePo...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格1年前058.6K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求...最新AI资源# AI图像转视频# AI开源项目1年前058.6K
元界AI:开源版AI数字人克隆与短视频生成工具综合介绍 元界AI(开源版)是一个托管在 GitHub 上的项目,,由 libn-net 团队开发。它能通过 AI 技术克隆数字人形象和声音,生成短视频,还支持配音和字幕制作。这个工具提供 Windo...最新AI资源# AI副业赚钱项目# AI开源项目# AI数字人1年前058.5K
Yek:读取git仓库文本文件并快速分块,以供大模型使用综合介绍 Yek 是一个基于 Rust 的快速工具,用于读取存储库或目录中的文本文件,将其分块并序列化以供大型语言模型(LLM)使用。该工具默认使用 .gitignore 规则跳过不需要的文件,并利用...最新AI资源# AI开源项目# 文档提取与清洗1年前058.5K
Knowledge Table:高效提取与探索结构化数据的开源工具综合介绍 知识表(Knowledge Table)是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。用户可以通过自然语言查询接口创建结构化的知识表示,如表格和图形。该工具支持自定义提...最新AI资源# AI开源项目# 知识图谱1年前058.5K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体综合介绍 miniLLMFlow是一个极简主义的大语言模型(LLM)开发框架,其核心代码仅包含100行,彰显了"大道至简"的设计理念。该框架专门设计用于让AI助手(如ChatGPT、Claude等)能...最新AI资源# AI开源项目# 智能体开发框架1年前058.4K
DevDocs:快速抓取并整理技术文档的MCP服务综合介绍 DevDocs 是一个完全免费的开源工具,由 CyberAGI 团队开发,托管在 GitHub 上。它专为程序员和软件开发者设计,能从技术文档的网址开始,自动爬取相关页面并整理成简洁的 Ma...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗1年前058.4K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前058.4K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧...最新AI资源# AI开源项目# AI文本转视频1年前058.4K
VideoMind:视频按时间戳定位内容与问答的开源项目综合介绍 VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI音视频编辑10个月前058.3K
SuperCoder:命令行终端运行的智能代码助手综合介绍 SuperCoder 是一个在终端运行的智能工具,专为程序员设计。它利用 AI 技术,帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源,支...最新AI资源# AI开源项目# AI编程1年前058.3K
R1-Omni:通过视频和音频分析情感的开源模型综合介绍 R1-Omni 是 HumanMLLM 团队在 GitHub 上推出的开源项目。它首次将强化学习与可验证奖励(RLVR)技术应用于多模态大语言模型,专注于情感识别。项目通过分析视频和音频数据...最新AI资源# AI开源项目1年前058.3K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量综合介绍 DeepEval是一个简单易用的开源LLM评估框架,用于评估和测试大语言模型系统。它类似于Pytest,但专注于LLM输出的单元测试。DeepEval结合最新的研究成果,通过G-Eval、幻...最新AI资源# AI开源项目# PROMPTS辅助工具1年前058.3K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具综合介绍 ScrapeGraphAI是一个创新的Python网页抓取库,它巧妙地结合了大语言模型(LLM)和直接图逻辑来创建网站和本地文档的抓取管道。这个工具的独特之处在于它的简单性和强大功能的完美平...最新AI资源# AI开源项目# 文档提取与清洗1年前058.3K
AI Podcast Generator:自动抓取新闻生成音频播客综合介绍 AI 播客生成器是一个智能化的播客生成工具,利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容,生成自然流畅的叙述,并将其转换为音频播客。项目基于 Next...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前058.2K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架,专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发,采用先进的3D重建技术和音频特征提取方法,能够准确捕捉说话人的身份特征和表...最新AI资源# AI开源项目# AI数字人1年前058.1K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档综合介绍 Cloud Document Converter 是一个 Chrome 扩展,专为将飞书云文档转换为 Markdown 格式而设计。用户可以通过该工具轻松下载或复制飞书云文档为 Markdo...最新AI资源# AI开源项目1年前058.1K
AIEvo:创建多智能体协作应用的高效框架综合介绍 AIEvo是蚂蚁集团开源的多代理框架,旨在高效创建多代理应用。该框架严格遵循SOP任务图,提升复杂任务的执行成功率,并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产...最新AI资源# AI开源项目# 智能体开发框架1年前058.1K
Open MCP Client:网页版MCP客户端,快速连接任意MCP服务综合介绍 Open MCP Client 是一个开源工具,最大的亮点是提供网页版 MCP(Model Context Protocol)客户端,让用户无需安装即可连接任意 MCP 服务器进行聊天。它还...最新AI资源# AI开源项目# MCP服务1年前058.1K
GPT-Crawler:自动爬取网站内容生成知识库文件综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新AI资源# AI开源项目# 文档提取与清洗10个月前058.1K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿综合介绍 LAMBDA(Local Auto MailBox Draft Assistant)是一个本地化的AI邮件自动化系统,旨在从用户的邮件风格中学习,并为Gmail收件箱中的每一封未读邮件生成草...最新AI资源# AI开源项目# AI生活效率助手1年前058.1K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具,旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行...最新AI资源# AI开源项目1年前058K
MTranServer:CPU即可运行的离线翻译服务综合介绍 MTranServer 是一个专注于离线翻译的开源服务器项目,托管于 GitHub,由开发者 xxnuo 创建。它最大的亮点是超低的资源需求,仅需 CPU 和 1GB 内存即可运行,无需 G...最新AI资源# AI开源项目# AI翻译1年前058K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师综合介绍 CR-Mentor 是一个结合专业知识库与大语言模型(LLM)能力的智能代码审查工具。它不仅支持所有编程语言的代码审查,还能基于知识库积累的最佳实践,为团队定制专属审查标准和重点关注领域。通...最新AI资源# AI开源项目# AI编程1年前058K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体1年前058K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面综合介绍 Mini-Cover 是一个开源的在线封面生成工具,专为博客、短视频和社交媒体等平台生成个性化封面。该工具由 JLinMr 开发,旨在提供一个简洁高效的解决方案,帮助用户快速生成符合自己需求...最新AI资源# AI开源项目# AI营销1年前058K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)综合介绍 Swarm是由OpenAI开发的一个实验性教育框架,旨在探索多代理系统的轻量级、可控和易于测试的接口。该框架主要用于展示代理之间的交接和例程模式,帮助开发者理解和实现多代理系统的协调与执行...最新AI资源# AI开源项目# 智能体开发框架1年前058K
Browse AI:无代码提取和监控结构化数据Browse介绍 Browse AI是一个无需编码的云端网页自动化软件,旨在帮助用户无需编程便能从任意网站提取和监控数据。您只需用鼠标指点一次,就可以训练一个机器人来执行数据提取、监控和自动化的任务...最新AI资源# AI开放服务# AI开源项目# 无代码开发2年前058K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目,旨在通过集成空间编织注意力机制(Spatial Knitting Attentions)在扩散模型中嵌入高层次和高保真条...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格1年前057.9K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件综合介绍 WhoDB 是一个轻量级(约20MB)、功能强大且用户友好的数据库管理工具,旨在简化数据库管理任务。它结合了 Adminer 的简洁性,并在用户体验和性能上进行了增强。WhoDB 使用 Go...最新AI资源# AI开源项目# AI数据分析1年前057.9K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具综合介绍 TryOffAnyone是一款突破性的AI图像处理工具,专门用于解决电商领域中服装展示的难题。它能够将真人穿着状态下的服装照片智能转换为平铺展示效果图,这项技术基于最新的Latent Dif...最新AI资源# AI开源项目# AI换脸与换装1年前057.9K
Autiobooks:将epub电子书转换为m4b有声书综合介绍 Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由...最新AI资源# AI开源项目# AI文本转语音1年前057.8K
LLM API Engine:通过自然语言快速生成和部署API综合介绍 LLM API Engine 是一个开源项目,旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型(LLM)和智能网页抓取技术,允许用户通过自然语言描述来创建自定义API。其主...最新AI资源# AI开源项目1年前057.8K
MM-EUREKA:探索视觉推理的多模态强化学习工具综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心...最新AI资源# AI开源项目# 大模型微调1年前057.8K
PrivateGPT:完全本地化RAG处理流程的文档问答系统综合介绍 PrivateGPT是一个可用于生产环境的AI项目,允许用户在没有互联网连接的情况下,使用大型语言模型(LLMs)对文档进行问答。该项目确保100%的数据隐私,所有数据都在用户的执行环境中处...最新AI资源# AI开源项目# 知识检索与RAG框架1年前057.7K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务综合介绍 Bambo是一个新型的代理框架,与主流框架相比,它更加轻量和灵活,能够处理各种负载任务。Bambo通过定义工具目录中的所有工具,并使用异步自定义函数来实现高效的代理功能。用户可以在llm_c...最新AI资源# AI开源项目# 智能体开发框架1年前057.7K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案综合介绍 GPTMe是一款革命性的终端AI助手工具,专为提升开发者工作效率而设计。它将强大的AI能力与终端环境完美结合,支持代码执行、文件编辑、网页浏览和视觉识别等多样化功能。作为ChatGPT代码解...最新AI资源# AI开源项目# AI编程1年前057.6K
Crawlee:使用Node.js构建可靠的网络爬虫和浏览器自动化工具综合介绍 Crawlee 是一个由 Apify 开发的开源网络爬虫和浏览器自动化库,专为 Node.js 环境设计。它支持 JavaScript 和 TypeScript,能够与 Puppeteer...最新AI资源# AI开源项目1年前057.6K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件综合介绍 ChatGPT Box 是一个开源的浏览器扩展工具,旨在将 ChatGPT 深度集成到用户的浏览器中。该工具由 josStorer 开发,支持多种语言,并提供多种功能,如在任意页面调用聊天对...最新AI资源# AI开源项目# AI集成多模型对话平台# 浏览器AI助手1年前057.6K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频综合介绍 Thin-Plate-Spline-Motion-Model是一个在CVPR 2022会议上发表的开创性图像动画生成项目。该项目基于薄板样条变换理论,能够将静态图像根据驱动视频实现高质量的动...最新AI资源# AI开源项目# AI视频换脸1年前057.6K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架综合介绍 InspireMusic 是一个基于 PyTorch 的开源工具包,专注于音乐、歌曲和音频生成。它提供了一个统一的框架,通过文本提示、音乐结构和音乐风格等控制生成高质量的音频。Inspire...最新AI资源# AI开源项目# AI音乐1年前057.5K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案综合介绍 Podcastfy 是一个开源的 Python 软件包,利用生成式人工智能(GenAI)技术,将网页内容、PDF 文件、文本、图像、youtube 视频等多种来源的内容转换为引人入胜的多语言...最新AI资源# AI开源项目# AI文本转语音1年前057.5K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手综合介绍 Agent Laboratory 是一个端到端的自主研究工作流,旨在帮助研究人员实现他们的研究想法。该系统由大型语言模型驱动的专用代理组成,支持整个研究工作流——从进行文献综述和制定计划到执...最新AI资源# AI开源项目# 生成深度研究报告1年前057.5K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富综合介绍 UltraPixel 是一项先进的超高分辨率图像生成技术,旨在创造出极高质量、细节丰富的图像。该项目由 GitHub 用户 catcathh 开发,并在 NeurIPS 2024 上展示。U...最新AI资源# AI在线生成图像# AI开源项目1年前057.5K
HivisionIDPhotos:开源智能AI证件照制作工具综合介绍 HivisionIDPhotos 是一款开源的轻量级 AI 证件照制作工具,能够智能识别用户拍照场景并进行抠图,生成符合多种规格的标准证件照。该工具支持自定义背景色和尺寸,未来还将推出美颜和...最新AI资源# AI开源项目# AI抠图改背景2年前057.5K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前057.5K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS...最新AI资源# AI开源项目# AI文本转语音1年前057.5K
OneLine:生成热点事件时间轴的AI工具综合介绍 OneLine 是一个开源的热点事件时间轴生成工具,托管在 GitHub,由用户 chengtx809 开发。它通过用户输入的关键词,快速生成事件的时间轴,展示事件的时间、标题、描述和相关人...最新AI资源# AI开源项目# AI搜索工具12个月前057.4K
ANUS:任务自动化与多代理协作的开源 AI 框架综合介绍 ANUS(Advanced Neural Understanding System,高级神经理解系统)是一个托管在 GitHub 上的开源 AI 代理框架,由用户 nikmcfly 通过提示...最新AI资源# AI开源项目# 智能体开发框架1年前057.4K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具综合介绍 Crawl4LLM 是一个由清华大学和卡内基梅隆大学联合开发的开源项目,专注于优化大模型(LLM)预训练的网页爬取效率。它通过智能选择高质量网页数据,显著减少无效爬取,号称能将原本需要爬取1...最新AI资源# AI开源项目# 文档提取与清洗1年前057.3K
Open Operator:通过AI智能体在云浏览器中执行自动化操作综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术...最新AI资源# AI开源项目# 桌面自动化智能体1年前057.3K
OmAgent:构建多模态智能设备的智能体框架综合介绍 OmAgent是由Om AI Lab开发的一个多模态智能体框架,旨在为智能设备提供强大的AI驱动功能。该项目通过整合最先进的多模态基础模型和智能体算法,使开发者能够在各种智能设备上创建高效...最新AI资源# AI开源项目# 多模态实时互动产品# 智能体开发框架1年前057.3K
SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成综合介绍 SimGRAG(SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented G...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前057.3K
GaiaNet node:安装和运行自己的本地模型在线代理服务综合介绍 GaiaNet-AI/gaianet-node是一个开源项目,允许用户在Mac、Linux或Windows WSL上通过一条命令快速安装默认的节点软件栈。用户可以初始化节点,自定义配置,下载...最新AI资源# AI开源项目# 本地部署开源大模型工具2年前057.3K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)综合介绍 3FS(Fire-Flyer File System)是由DeepSeek团队开发的一款开源并行文件系统,专为现代SSD和RDMA网络设计,旨在大幅提升数据访问效率。它在180节点集群中实现...最新AI资源# AI开源项目1年前057.2K
TripoSF:快速生成高分辨率3D模型的实用工具综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目,专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术,处理效率高,能在普...最新AI资源# AI开源项目# AI文本与图片转3D1年前057.2K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护综合介绍 Higress是阿里巴巴开发的一款云原生API网关,基于Istio和Envoy构建,旨在提供高效的流量调度、服务治理和安全防护解决方案。它支持多种编程语言的Wasm插件扩展,适用于AI业务...最新AI资源# AI开源项目1年前057.2K
RAIN:实时捕捉真人表情生成动漫形象视频流综合介绍 RAIN(Real-time Animation Of Infinite Video Stream)是一个开源项目,旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发,提...最新AI资源# AI开源项目# AI视频转换风格1年前057.2K
BotSharp:基于.NET的多智能体AI应开发与管理平台综合介绍 BotSharp是基于.NET Core的一个开源项目,致力于提供一个全面的AI聊天机器人平台构建工具。它采用C#编程,支持跨平台操作,旨在简化机器学习算法的应用,使企业级开发者能够高效地将...最新AI资源# AI开源项目# 智能体开发框架1年前057.2K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划综合介绍 OpenHealthForAll 是一个开源项目,旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术,OpenHealthForAll 提供了一个本地运行的健康助手,帮助用户更好地管理...最新AI资源# AI开源项目# AI生活效率助手1年前057.1K
Docs:开源的协作笔记和文档管理工具综合介绍 Docs 是一个开源的协作笔记和文档管理平台,由 suitenumerique 团队开发。它使用 Django 和 React 技术构建,目标是提供一个简单易用的工具,帮助用户记录笔记、管理...最新AI资源# AI开源项目# AI笔记1年前057.1K
DeepSeek-R1-FP4:FP4优化版DeepSeek-R1推理速度25倍综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型,基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Opt...最新AI资源# AI开源项目1年前057.1K
DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置综合介绍 DragGAN是一个基于生成对抗网络(GAN)的交互式图像编辑工具。该项目由Xingang Pan等人在2023年SIGGRAPH会议上发布,旨在通过简单的点选和拖拽操作,让用户能够直观地操...最新AI资源# AI图像编辑# AI开源项目1年前057.1K
LangManus:支持多智能体协作的开源AI自动化框架综合介绍 LangManus 是一个开源的 AI 自动化框架,托管在 GitHub 上。它由一群前同事在业余时间开发,属于学术驱动项目,目标是结合语言模型和专用工具,完成网页搜索、数据爬取和代码执行等...最新AI资源# AI开源项目# 智能体应用1年前057.1K
Vibe Draw:将手绘草图转化为3D模型的创意工具综合介绍 Vibe Draw 是一个开源项目,它由 Martin Sit 开发,能让用户把手绘草图变成漂亮的 3D 模型。这个工具的目标很简单:让任何人都能轻松做 3D 建模,不需要高超的艺术技巧或复...最新AI资源# AI开源项目# AI文本与图片转3D# AI涂鸦生成绘画1年前057.1K
Text2Voice:基于硅基流动API的文本转语音图形界面综合介绍 Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让...最新AI资源# AI开源项目# AI文本转语音1年前057K
MoshiVis:实时语音对话和图像理解的开源模型综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...最新AI资源# AI开源项目# 多模态实时互动产品1年前057K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话综合介绍 NoneBot DeepSeek 插件是一个集成了 DeepSeek 模型的 NoneBot 插件,旨在提供智能对话与问答功能。通过接入 DeepSeek 模型,用户可以在 NoneBot ...最新AI资源# AI客服机器人# AI开源项目1年前057K
AudioNotes:快速提取音视频内容并生成结构化笔记综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容,并调用大模型进行整理,生成一份结构化的 Markdown 笔记,方便用...最新AI资源# AI开源项目# AI语音转文本1年前057K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目,旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM(NVID...AI新闻# AI开源项目# AI文本转语音1年前057K
Reactive Resume:支持多语言、多模板的开源免费简历生成器综合介绍 Reactive Resume 是一个免费且开源的简历生成器,旨在简化创建、更新和分享简历的过程。该平台注重用户隐私,没有任何用户跟踪或广告。用户可以在不到30秒内自托管应用程序,完全掌控自...最新AI资源# AI开源项目# AI生活效率助手1年前057K
DiffPortrait360:从单张人像生成360度头部视图综合介绍 DiffPortrait360 是一个开源项目,隶属于 CVPR 2025 论文《DiffPortrait360: Consistent Portrait Diffusion for 360...最新AI资源# AI图像风格控制# AI开源项目1年前057K
Lecca:无代码构建AI智能体与AI工作流构建平台综合介绍 Lecca 是一个强大的AI平台,允许用户配置和部署大语言模型(LLMs),并配备多种工具和工作流。用户可以轻松构建、定制和自动化他们的AI代理。Lecca 提供了多种AI提供商和模型选择...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架1年前056.9K
GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序综合介绍 GeminiCoder是一个基于Google Gemini API开发的创新型Web应用程序生成工具。该项目继承了 LlamaCoder 的优秀特性,并集成了最新的Gemini 1.5 Pr...最新AI资源# AI开源项目# AI编程1年前056.9K
BrownChat:开源实时语音聊天的AI助手综合介绍 BrownChat 是一个基于大型语言模型(LLM)技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发,旨在通过先进的自然语言处理技术提升用户的沟通体验。B...最新AI资源# AI开源项目# 多模态实时互动产品1年前056.8K
Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人综合介绍 GPT-Telegram-Worker 是一个基于 Cloudflare Workers 的多模型 AI Telegram 机器人,支持 OpenAI、Claude、Azure 等多个 AP...最新AI资源# AI开源项目# 智能体应用1年前056.8K
WikiChat:使用维基百科数据检索知识的聊天工具综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人,旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型(如ChatGPT和GPT-4)在处理最新信息或不太流行的话题时,往往...最新AI资源# AI开源项目# 知识检索与RAG框架1年前056.8K
FantasyTalking:生成真实感说话肖像的开源工具综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目,专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1,结合音频编码器 Wa...最新AI资源# AI开源项目# AI数字人11个月前056.7K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作综合介绍 OmniParser是一个由微软开发的工具,旨在解析用户界面截图,将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...最新AI资源# AI开源项目1年前056.7K
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码综合介绍 Morphic是一个基于AI技术的搜索引擎,采用生成式用户界面,旨在提供智能问答和高效搜索体验。用户可以通过Morphic进行多种搜索,包括文本、视频等,并能保存搜索历史,分享搜索结果。Mo...最新AI资源# AI开源项目# AI搜索工具1年前056.7K
OpenSumi Lite:纯前端IDE解决方案,轻松实现代码查看与编辑综合介绍 OpenSumi Lite 是一个基于 OpenSumi 项目的纯前端 IDE 解决方案,旨在提供无需 Node.js 环境的代码查看与编辑功能。该项目由阿里巴巴集团和蚂蚁集团共同开发,采用...AI答疑# AI开源项目1年前056.7K
Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...最新AI资源# AI开源项目# 文档提取与清洗1年前056.6K
CortexON:开源多代理AI工具,支持复杂任务自动化综合介绍 CortexON 是一个开源的多代理 AI 系统,托管在 GitHub 上,网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...最新AI资源# AI开源项目# 智能体应用1年前056.6K