AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...最新AI资源# AI开源项目# 桌面自动化智能体1年前064.6K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体综合介绍 miniLLMFlow是一个极简主义的大语言模型(LLM)开发框架,其核心代码仅包含100行,彰显了"大道至简"的设计理念。该框架专门设计用于让AI助手(如ChatGPT、Claude等)能...最新AI资源# AI开源项目# 智能体开发框架1年前064.6K
OAK:可视化构建智能体应用的开源项目综合介绍 OAK(Open Agent Kit)是一个开源工具,帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型(LLM),比如OpenAI、Google或Anthropic的模型...最新AI资源# AI开源项目# 智能体应用1年前064.6K
AgentLaboratory:利用智能代理完成科研全流程的开源工具综合介绍 AgentLaboratory 是一个开源工具,托管在 GitHub 上,由 Samuel Schmidgall 开发。它利用大语言模型(LLM)驱动的智能代理,帮助研究人员完成科研全流程...最新AI资源# AI开源项目# AI教育工具# 论文1年前064.5K
Cerebr:与网页内容对话的开源浏览器插件综合介绍 Cerebr 是一个功能强大的 Chrome 浏览器 AI 助手扩展,旨在提升用户的工作效率和学习体验。Cerebr 的设计理念源于对简洁、高效浏览器 AI 助手的需求,凭借其极简设计和强大...最新AI资源# AI开源项目# 浏览器AI助手1年前064.5K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言综合介绍 askrepo 是一个基于LLM(大语言模型)的源代码阅读工具。它能够读取指定目录下的Git管理的文本文件内容,并将其发送到Google Gemini API,根据指定的提示提供问题的答案...最新AI资源# AI开源项目2年前064.5K
LLManager:智能自动化流程审批与人类审核结合的管理工具综合介绍 LLManager 是一个开源的智能审批管理工具,基于 LangChain 的 LangGraph 框架开发,专注于自动化处理审批请求,同时结合人类审核优化决策。它通过语义搜索、少样本学习和...最新AI资源# AI开源项目# 专业生产力工具1年前064.4K
集成多种先进语音合成服务的开源运营项目综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音1年前064.4K
元界AI:开源版AI数字人克隆与短视频生成工具综合介绍 元界AI(开源版)是一个托管在 GitHub 上的项目,,由 libn-net 团队开发。它能通过 AI 技术克隆数字人形象和声音,生成短视频,还支持配音和字幕制作。这个工具提供 Windo...最新AI资源# AI副业赚钱项目# AI开源项目# AI数字人1年前064.4K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具综合介绍 autoMate 是一款由 yuruotong1 在 GitHub 上开源开发的本地自动化工具,以 AI+RPA(人工智能+机器人流程自动化)为核心特色。它将大型语言模型的智能理解与 RPA...最新AI资源# AI开源项目# 桌面自动化智能体1年前064.4K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧...最新AI资源# AI开源项目# AI文本转视频2年前064.3K
Yek:读取git仓库文本文件并快速分块,以供大模型使用综合介绍 Yek 是一个基于 Rust 的快速工具,用于读取存储库或目录中的文本文件,将其分块并序列化以供大型语言模型(LLM)使用。该工具默认使用 .gitignore 规则跳过不需要的文件,并利用...最新AI资源# AI开源项目# 文档提取与清洗1年前064.3K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿综合介绍 LAMBDA(Local Auto MailBox Draft Assistant)是一个本地化的AI邮件自动化系统,旨在从用户的邮件风格中学习,并为Gmail收件箱中的每一封未读邮件生成草...最新AI资源# AI开源项目# AI生活效率助手1年前064.3K
Lux:几乎支持所有视频平台的命令行视频下载器综合介绍 Lux 是一个用 Go 语言编写的快速且简单的视频下载库和命令行工具。它支持从多个网站下载视频,包括 YouTube、Bilibili、优酷等。Lux 提供了多种下载选项和功能,如多线程下载...最新AI资源# AI开源项目1年前064.3K
WikiChat:使用维基百科数据检索知识的聊天工具综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人,旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型(如ChatGPT和GPT-4)在处理最新信息或不太流行的话题时,往往...最新AI资源# AI开源项目# 知识检索与RAG框架1年前064.3K
GPT-Crawler:自动爬取网站内容生成知识库文件综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新AI资源# AI开源项目# 文档提取与清洗12个月前064.2K
Ovis:视觉与文本对齐模型,精准反推图像提示词综合介绍 Ovis(Open VISion)是由阿里巴巴国际数字商业集团的 AIDC-AI 团队开发的一款开源多模态大语言模型(MLLM),托管于 GitHub。该模型采用创新的结构嵌入对齐技术,将视...最新AI资源# AI图像生成辅助工具# AI开源项目1年前064.2K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师综合介绍 CR-Mentor 是一个结合专业知识库与大语言模型(LLM)能力的智能代码审查工具。它不仅支持所有编程语言的代码审查,还能基于知识库积累的最佳实践,为团队定制专属审查标准和重点关注领域。通...最新AI资源# AI开源项目# AI编程2年前064.2K
SuperCoder:命令行终端运行的智能代码助手综合介绍 SuperCoder 是一个在终端运行的智能工具,专为程序员设计。它利用 AI 技术,帮助用户搜索代码、查看项目结构、编辑文件和修复 bug。项目由 huytd 在 GitHub 上开源,支...最新AI资源# AI开源项目# AI编程1年前064.1K
ColiVara:基于视觉嵌入的文档存储与检索服务综合介绍 ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别(OCR)或文本提取,避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式,包括 PDF...最新AI资源# AI开源项目# 知识检索与RAG框架1年前064.1K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量综合介绍 DeepEval是一个简单易用的开源LLM评估框架,用于评估和测试大语言模型系统。它类似于Pytest,但专注于LLM输出的单元测试。DeepEval结合最新的研究成果,通过G-Eval、幻...最新AI资源# AI开源项目# PROMPTS辅助工具1年前064.1K
Browse AI:无代码提取和监控结构化数据Browse介绍 Browse AI是一个无需编码的云端网页自动化软件,旨在帮助用户无需编程便能从任意网站提取和监控数据。您只需用鼠标指点一次,就可以训练一个机器人来执行数据提取、监控和自动化的任务...最新AI资源# AI开放服务# AI开源项目# 无代码开发2年前064.1K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试综合介绍 aisuite 是一个简单、统一的接口,旨在让开发者能够轻松调用多种生成式AI提供商的服务。通过类似于OpenAI的接口,aisuite 使得与最流行的LLM(大语言模型)进行交互变得更加容...最新AI资源# AI开源项目2年前064.1K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用综合介绍 Gemini Next Chat 是一个开源项目,旨在帮助用户轻松部署私人Gemini应用。该项目支持Gemini 1.5和Gemini 2.0多模态模型,用户可以通过一键部署在Vercel...最新AI资源# AI开源项目# AI本地化聊天应用1年前064K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手综合介绍 Devin.cursorrules 是一个创新的开源项目,旨在将价格实惠的Cursor或Windsurf IDE(约20美元)转换为类似 Devin 这样强大的AI编程助手。该项目提供了一套...最新AI资源# AI开源项目# AI编程1年前064K
AIEvo:创建多智能体协作应用的高效框架综合介绍 AIEvo是蚂蚁集团开源的多代理框架,旨在高效创建多代理应用。该框架严格遵循SOP任务图,提升复杂任务的执行成功率,并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产...最新AI资源# AI开源项目# 智能体开发框架1年前064K
CodeWeaver:将代码结构和内容自动生成Markdown文档综合介绍 CodeWeaver 是一个命令行工具,旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录,生成项目文件层次结构的结构化表示,并在代码块中嵌入每个文件的内容。这款工具...最新AI资源# AI开源项目# 文档提取与清洗1年前063.9K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流综合介绍 Director 是一个开源框架,旨在通过构建智能视频代理来简化和优化视频交互和工作流程。该框架基于 VideoDB 的“视频即数据”基础设施,能够处理复杂的视频任务,如搜索、编辑、编译和生...最新AI资源# AI开源项目# AI音视频编辑2年前063.9K
Atomic Agents:构建轻量级模块化AI智能体框架综合介绍 Atomic Agents 是一个围绕原子性概念设计的极其轻量级和模块化的框架,用于构建代理AI管道和应用程序。该框架提供了一组工具和代理,可以组合创建强大的应用程序。它基于 Instruc...最新AI资源# AI开源项目# 智能体开发框架1年前063.8K
R1-Omni:通过视频和音频分析情感的开源模型综合介绍 R1-Omni 是 HumanMLLM 团队在 GitHub 上推出的开源项目。它首次将强化学习与可验证奖励(RLVR)技术应用于多模态大语言模型,专注于情感识别。项目通过分析视频和音频数据...最新AI资源# AI开源项目1年前063.8K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前063.8K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站综合介绍 AutoFlow 是由 PingCAP 开发的开源工具,旨在通过 TiDB 无服务器向量存储构建基于图的知识库。它集成了 LlamaIndex 和 DSPy 框架,支持复杂的对话搜索和知识图...最新AI资源# AI客服机器人# AI开源项目# 知识图谱1年前063.8K
MTranServer:CPU即可运行的离线翻译服务综合介绍 MTranServer 是一个专注于离线翻译的开源服务器项目,托管于 GitHub,由开发者 xxnuo 创建。它最大的亮点是超低的资源需求,仅需 CPU 和 1GB 内存即可运行,无需 G...最新AI资源# AI开源项目# AI翻译1年前063.7K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型,专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本,显著降低了内存和显存需求...最新AI资源# AI图像转视频# AI开源项目1年前063.7K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单综合介绍 PydanticAI是一个基于Pydantic的Python代理框架,旨在简化生成式AI应用的开发。它由Pydantic团队开发,支持多种模型(如OpenAI、Gemini、Groq等),并...最新AI资源# AI开源项目2年前063.7K
Vibe Draw:将手绘草图转化为3D模型的创意工具综合介绍 Vibe Draw 是一个开源项目,它由 Martin Sit 开发,能让用户把手绘草图变成漂亮的 3D 模型。这个工具的目标很简单:让任何人都能轻松做 3D 建模,不需要高超的艺术技巧或复...最新AI资源# AI开源项目# AI文本与图片转3D# AI涂鸦生成绘画1年前063.6K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS...最新AI资源# AI开源项目# AI文本转语音1年前063.6K
Autiobooks:将epub电子书转换为m4b有声书综合介绍 Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由...最新AI资源# AI开源项目# AI文本转语音1年前063.6K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体1年前063.6K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件综合介绍 WhoDB 是一个轻量级(约20MB)、功能强大且用户友好的数据库管理工具,旨在简化数据库管理任务。它结合了 Adminer 的简洁性,并在用户体验和性能上进行了增强。WhoDB 使用 Go...最新AI资源# AI开源项目# AI数据分析2年前063.5K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案综合介绍 GPTMe是一款革命性的终端AI助手工具,专为提升开发者工作效率而设计。它将强大的AI能力与终端环境完美结合,支持代码执行、文件编辑、网页浏览和视觉识别等多样化功能。作为ChatGPT代码解...最新AI资源# AI开源项目# AI编程1年前063.5K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台综合介绍 AutoGPT是一个强大的平台,旨在帮助用户创建、部署和管理连续运行的AI代理,自动化复杂的工作流。该平台由Significant Gravitas开发,提供了多种工具和功能,使用户能够专注...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架1年前063.5K
PrivateGPT:完全本地化RAG处理流程的文档问答系统综合介绍 PrivateGPT是一个可用于生产环境的AI项目,允许用户在没有互联网连接的情况下,使用大型语言模型(LLMs)对文档进行问答。该项目确保100%的数据隐私,所有数据都在用户的执行环境中处...最新AI资源# AI开源项目# 知识检索与RAG框架1年前063.4K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架,专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发,采用先进的3D重建技术和音频特征提取方法,能够准确捕捉说话人的身份特征和表...最新AI资源# AI开源项目# AI数字人1年前063.4K
Knowledge Table:高效提取与探索结构化数据的开源工具综合介绍 知识表(Knowledge Table)是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。用户可以通过自然语言查询接口创建结构化的知识表示,如表格和图形。该工具支持自定义提...最新AI资源# AI开源项目# 知识图谱2年前063.4K
AI Podcast Generator:自动抓取新闻生成音频播客综合介绍 AI 播客生成器是一个智能化的播客生成工具,利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容,生成自然流畅的叙述,并将其转换为音频播客。项目基于 Next...最新AI资源# AI开源项目# AI文本与音频/视频总结工具2年前063.4K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面综合介绍 Mini-Cover 是一个开源的在线封面生成工具,专为博客、短视频和社交媒体等平台生成个性化封面。该工具由 JLinMr 开发,旨在提供一个简洁高效的解决方案,帮助用户快速生成符合自己需求...最新AI资源# AI开源项目# AI营销1年前063.3K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具综合介绍 TryOffAnyone是一款突破性的AI图像处理工具,专门用于解决电商领域中服装展示的难题。它能够将真人穿着状态下的服装照片智能转换为平铺展示效果图,这项技术基于最新的Latent Dif...最新AI资源# AI开源项目# AI换脸与换装1年前063.1K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具,旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行...最新AI资源# AI开源项目1年前063.1K
Open Operator:通过AI智能体在云浏览器中执行自动化操作综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术...最新AI资源# AI开源项目# 桌面自动化智能体1年前063.1K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频综合介绍 Thin-Plate-Spline-Motion-Model是一个在CVPR 2022会议上发表的开创性图像动画生成项目。该项目基于薄板样条变换理论,能够将静态图像根据驱动视频实现高质量的动...最新AI资源# AI开源项目# AI视频换脸1年前063.1K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件综合介绍 WordPress AI助手插件(wp-ai-chat)是一个开源的WordPress插件,旨在为用户提供多种AI功能,包括AI对话、文章生成、文章总结、文章翻译和内容朗读。该插件支持对接多...最新AI资源# AI写作# AI开源项目1年前063.1K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手综合介绍 Agent Laboratory 是一个端到端的自主研究工作流,旨在帮助研究人员实现他们的研究想法。该系统由大型语言模型驱动的专用代理组成,支持整个研究工作流——从进行文献综述和制定计划到执...最新AI资源# AI开源项目# 生成深度研究报告1年前063.1K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前063.1K
SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成综合介绍 SimGRAG(SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented G...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前063K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude综合介绍 Model Context Provider CLI(mcp-cli)是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...最新AI资源# AI开源项目# MCP服务1年前063K
DiffPortrait360:从单张人像生成360度头部视图综合介绍 DiffPortrait360 是一个开源项目,隶属于 CVPR 2025 论文《DiffPortrait360: Consistent Portrait Diffusion for 360...最新AI资源# AI图像风格控制# AI开源项目1年前063K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护综合介绍 Higress是阿里巴巴开发的一款云原生API网关,基于Istio和Envoy构建,旨在提供高效的流量调度、服务治理和安全防护解决方案。它支持多种编程语言的Wasm插件扩展,适用于AI业务...最新AI资源# AI开源项目2年前063K
DevDocs:快速抓取并整理技术文档的MCP服务综合介绍 DevDocs 是一个完全免费的开源工具,由 CyberAGI 团队开发,托管在 GitHub 上。它专为程序员和软件开发者设计,能从技术文档的网址开始,自动爬取相关页面并整理成简洁的 Ma...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗1年前062.9K
Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式综合介绍 Vision Parse是一个革命性的文档处理工具,它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术,能够将PDF文档智能转换为优质的Markdown格...最新AI资源# AI开源项目# 文档提取与清洗1年前062.9K
Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案综合介绍 Podcastfy 是一个开源的 Python 软件包,利用生成式人工智能(GenAI)技术,将网页内容、PDF 文件、文本、图像、youtube 视频等多种来源的内容转换为引人入胜的多语言...最新AI资源# AI开源项目# AI文本转语音2年前062.9K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具综合介绍 Crawl4LLM 是一个由清华大学和卡内基梅隆大学联合开发的开源项目,专注于优化大模型(LLM)预训练的网页爬取效率。它通过智能选择高质量网页数据,显著减少无效爬取,号称能将原本需要爬取1...最新AI资源# AI开源项目# 文档提取与清洗1年前062.8K
OpenDeepSearch:支持智能推理的开源搜索工具综合介绍 OpenDeepSearch 是一个开源的搜索工具,由 sentient-agi 团队开发。它结合了大型语言模型(LLM)和智能推理代理,让用户可以用简单的方式搜索网页信息并获取准确答案。这...最新AI资源# AI开源项目# AI搜索工具1年前062.8K
Crawlee:使用Node.js构建可靠的网络爬虫和浏览器自动化工具综合介绍 Crawlee 是一个由 Apify 开发的开源网络爬虫和浏览器自动化库,专为 Node.js 环境设计。它支持 JavaScript 和 TypeScript,能够与 Puppeteer...最新AI资源# AI开源项目2年前062.8K
ANUS:任务自动化与多代理协作的开源 AI 框架综合介绍 ANUS(Advanced Neural Understanding System,高级神经理解系统)是一个托管在 GitHub 上的开源 AI 代理框架,由用户 nikmcfly 通过提示...最新AI资源# AI开源项目# 智能体开发框架1年前062.8K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎综合介绍 dsRAG是一款高性能检索引擎,专门用于处理非结构化数据的复杂查询。它在处理密集文本(如财务报告、法律文件和学术论文)中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能:语...最新AI资源# AI开源项目# 知识检索与RAG框架1年前062.7K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作综合介绍 OmniParser是一个由微软开发的工具,旨在解析用户界面截图,将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...最新AI资源# AI开源项目1年前062.7K
MM-EUREKA:探索视觉推理的多模态强化学习工具综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心...最新AI资源# AI开源项目# 大模型微调1年前062.6K
RAIN:实时捕捉真人表情生成动漫形象视频流综合介绍 RAIN(Real-time Animation Of Infinite Video Stream)是一个开源项目,旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发,提...最新AI资源# AI开源项目# AI视频转换风格1年前062.6K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)综合介绍 Swarm是由OpenAI开发的一个实验性教育框架,旨在探索多代理系统的轻量级、可控和易于测试的接口。该框架主要用于展示代理之间的交接和例程模式,帮助开发者理解和实现多代理系统的协调与执行...最新AI资源# AI开源项目# 智能体开发框架1年前062.6K
BrownChat:开源实时语音聊天的AI助手综合介绍 BrownChat 是一个基于大型语言模型(LLM)技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发,旨在通过先进的自然语言处理技术提升用户的沟通体验。B...最新AI资源# AI开源项目# 多模态实时互动产品1年前062.6K
OpenSumi Lite:纯前端IDE解决方案,轻松实现代码查看与编辑综合介绍 OpenSumi Lite 是一个基于 OpenSumi 项目的纯前端 IDE 解决方案,旨在提供无需 Node.js 环境的代码查看与编辑功能。该项目由阿里巴巴集团和蚂蚁集团共同开发,采用...AI答疑# AI开源项目1年前062.6K
Story-Flicks:输入主题自动生成儿童短故事视频综合介绍 Story-Flicks 是一个开源的AI工具,专注于帮助用户快速生成高清故事视频。用户只需输入一个故事主题,系统会通过大语言模型生成故事内容,并结合AI生成的图像、音频和字幕,输出完整的视...最新AI资源# AI开源项目# AI视频生成工具1年前062.5K
Supermemory:导入书签和网页内容构建个人知识库综合介绍 Supermemory 是一个开源项目,旨在帮助用户构建自己的“第二大脑”。它通过一个功能强大的 Chrome 扩展程序和AI技术,让用户能够轻松保存、组织和检索来自网页、Twitter书签...最新AI资源# AI开源项目# 知识检索与RAG框架1年前062.5K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务综合介绍 Bambo是一个新型的代理框架,与主流框架相比,它更加轻量和灵活,能够处理各种负载任务。Bambo通过定义工具目录中的所有工具,并使用异步自定义函数来实现高效的代理功能。用户可以在llm_c...最新AI资源# AI开源项目# 智能体开发框架2年前062.4K
Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人综合介绍 GPT-Telegram-Worker 是一个基于 Cloudflare Workers 的多模型 AI Telegram 机器人,支持 OpenAI、Claude、Azure 等多个 AP...最新AI资源# AI开源项目# 智能体应用1年前062.4K
Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型综合介绍 Lumina-mGPT-2.0 是由上海人工智能实验室(Shanghai AI Laboratory)、香港中文大学(CUHK)等机构联合开发的开源项目,托管于 GitHub,由 Alpha...最新AI资源# AI开源项目1年前062.4K
OmAgent:构建多模态智能设备的智能体框架综合介绍 OmAgent是由Om AI Lab开发的一个多模态智能体框架,旨在为智能设备提供强大的AI驱动功能。该项目通过整合最先进的多模态基础模型和智能体算法,使开发者能够在各种智能设备上创建高效...最新AI资源# AI开源项目# 多模态实时互动产品# 智能体开发框架1年前062.4K
LLM API Engine:通过自然语言快速生成和部署API综合介绍 LLM API Engine 是一个开源项目,旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型(LLM)和智能网页抓取技术,允许用户通过自然语言描述来创建自定义API。其主...最新AI资源# AI开源项目1年前062.4K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话综合介绍 NoneBot DeepSeek 插件是一个集成了 DeepSeek 模型的 NoneBot 插件,旨在提供智能对话与问答功能。通过接入 DeepSeek 模型,用户可以在 NoneBot ...最新AI资源# AI客服机器人# AI开源项目1年前062.4K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目,旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM(NVID...AI新闻# AI开源项目# AI文本转语音1年前062.3K
BotSharp:基于.NET的多智能体AI应开发与管理平台综合介绍 BotSharp是基于.NET Core的一个开源项目,致力于提供一个全面的AI聊天机器人平台构建工具。它采用C#编程,支持跨平台操作,旨在简化机器学习算法的应用,使企业级开发者能够高效地将...最新AI资源# AI开源项目# 智能体开发框架1年前062.3K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)综合介绍 3FS(Fire-Flyer File System)是由DeepSeek团队开发的一款开源并行文件系统,专为现代SSD和RDMA网络设计,旨在大幅提升数据访问效率。它在180节点集群中实现...最新AI资源# AI开源项目1年前062.3K
TripoSF:快速生成高分辨率3D模型的实用工具综合介绍 TripoSF 是 VAST-AI-Research 团队打造的一个开源项目,专门用来从单张图像快速生成高分辨率的 3D 模型。它用了一种叫 SparseFlex 的技术,处理效率高,能在普...最新AI资源# AI开源项目# AI文本与图片转3D1年前062.3K
Text2Voice:基于硅基流动API的文本转语音图形界面综合介绍 Text2Voice 是一个开源工具,基于硅基流动 API 提供文本转语音功能,最大的特点是带有简洁的图形用户界面(GUI)。它由开发者 Sheldon Lee 在 GitHub 上创建,让...最新AI资源# AI开源项目# AI文本转语音1年前062.3K
HivisionIDPhotos:开源智能AI证件照制作工具综合介绍 HivisionIDPhotos 是一款开源的轻量级 AI 证件照制作工具,能够智能识别用户拍照场景并进行抠图,生成符合多种规格的标准证件照。该工具支持自定义背景色和尺寸,未来还将推出美颜和...最新AI资源# AI开源项目# AI抠图改背景2年前062.2K
PR Agent:自动化拉取请求分析工具综合介绍 PR-Agent 是一个由 Qodo 开发的开源工具,旨在通过 AI 技术自动化处理拉取请求(Pull Request)。该工具能够提供自动化的反馈、建议和分析,帮助开发者更高效地进行代码审...最新AI资源# AI开源项目1年前062.2K
AudioNotes:快速提取音视频内容并生成结构化笔记综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容,并调用大模型进行整理,生成一份结构化的 Markdown 笔记,方便用...最新AI资源# AI开源项目# AI语音转文本1年前062.2K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目,旨在通过集成空间编织注意力机制(Spatial Knitting Attentions)在扩散模型中嵌入高层次和高保真条...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格1年前062.2K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。综合介绍 Markdown to Image 是一个用于将Markdown文本渲染为视觉上吸引人的社交媒体图片的React组件。该项目还包括一个内置的网页编辑器,可以作为在线Markdown到海报编辑...最新AI资源# AI开源项目2年前062.2K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架综合介绍 InspireMusic 是一个基于 PyTorch 的开源工具包,专注于音乐、歌曲和音频生成。它提供了一个统一的框架,通过文本提示、音乐结构和音乐风格等控制生成高质量的音频。Inspire...最新AI资源# AI开源项目# AI音乐1年前062.2K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成综合介绍 SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地...最新AI资源# AI开源项目2年前062.1K
UltraPixel:革新超高分辨率图像生成技术,图像细节丰富综合介绍 UltraPixel 是一项先进的超高分辨率图像生成技术,旨在创造出极高质量、细节丰富的图像。该项目由 GitHub 用户 catcathh 开发,并在 NeurIPS 2024 上展示。U...最新AI资源# AI在线生成图像# AI开源项目2年前062.1K
DeepSeek-R1-FP4:FP4优化版DeepSeek-R1推理速度25倍综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型,基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Opt...最新AI资源# AI开源项目1年前062.1K
MoshiVis:实时语音对话和图像理解的开源模型综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...最新AI资源# AI开源项目# 多模态实时互动产品1年前062.1K
CortexON:开源多代理AI工具,支持复杂任务自动化综合介绍 CortexON 是一个开源的多代理 AI 系统,托管在 GitHub 上,网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...最新AI资源# AI开源项目# 智能体应用1年前062.1K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段综合介绍 MuseGAN是一个基于生成对抗网络(GAN)的音乐生成项目,旨在生成多轨(多种乐器)音乐。该项目能够从零开始生成音乐,或根据用户提供的轨道进行伴奏。MuseGAN使用Lakh Pianor...最新AI资源# AI开源项目# AI音乐2年前062K
Reactive Resume:支持多语言、多模板的开源免费简历生成器综合介绍 Reactive Resume 是一个免费且开源的简历生成器,旨在简化创建、更新和分享简历的过程。该平台注重用户隐私,没有任何用户跟踪或广告。用户可以在不到30秒内自托管应用程序,完全掌控自...最新AI资源# AI开源项目# AI生活效率助手1年前061.9K
Docs:开源的协作笔记和文档管理工具综合介绍 Docs 是一个开源的协作笔记和文档管理平台,由 suitenumerique 团队开发。它使用 Django 和 React 技术构建,目标是提供一个简单易用的工具,帮助用户记录笔记、管理...最新AI资源# AI开源项目# AI笔记1年前061.9K