Suna:集成浏览器操作与数据分析的智能代理综合介绍 Suna 是 Kortix AI 开发的一个开源通用 AI 代理,托管在 GitHub 上,基于 Apache 2.0 许可证,允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成...最新AI资源# AI开源项目# 桌面自动化智能体# 生成深度研究报告4个月前01.5K
Strawberry:自动化任务的AI智能浏览器综合介绍 Strawberry 是一款内置 AI 助手的智能浏览器,旨在帮助用户自动化日常工作,提升效率。它不同于传统浏览器,集成了 AI 技术,能实时理解网页内容,执行复杂任务,如快速研究、内容撰写...最新AI资源# 桌面自动化智能体4个月前01.1K
Fellou:自动化执行任务的原生AI浏览器综合介绍 Fellou是一款由Fellou AI公司推出的全球首个人工智能行动型浏览器。它不仅具备传统浏览器的网页浏览功能,还通过AI技术实现任务自动化和深度信息搜索。Fellou的核心是“深度行动...最新AI资源# 桌面自动化智能体4个月前01.2K
AiPy:自动化运行Python代码完成数据分析任务综合介绍 AiPy 是一个开源的 Python 命令行工具,由 Knownsec 团队开发。它结合大语言模型(LLM)和 Python 运行环境,让用户通过自然语言描述任务,自动生成并运行 Pytho...最新AI资源# AI开源项目# 桌面自动化智能体4个月前01.1K
DroidRun:AI自动操作安卓手机的开源工具综合介绍 DroidRun 是一个开源工具,让 AI 像人类一样操作安卓手机。它通过提取屏幕上的按钮、输入框等交互元素,帮助 AI 自动完成任务,比如打开应用、发送消息或浏览网页。DroidRun 结...最新AI资源# 桌面自动化智能体4个月前01.1K
Agent S:像人类一样操作电脑的开源智能体框架综合介绍 Agent S 是由 Simular AI 开发的开源框架,让智能体通过图形用户界面(GUI)像人类一样操作电脑。它使用多模态大语言模型和经验学习技术,能完成浏览网页、编辑文档、使用软件等任...最新AI资源# AI开源项目# 桌面自动化智能体4个月前01.2K
Libra:用对话生成本地AI智能体的客户端(内测)综合介绍 Libra 是 Greenbit.ai 推出的一款创新工具,核心功能是通过自然语言对话生成能在本地运行的 AI 智能体。它被称为“Vibe Agent”,能让用户用简单的话描述需求,快速创建...最新AI资源# 智能体应用# 桌面自动化智能体4个月前01K
Optexity:用人类演示训练AI执行网页操作的开源项目综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...最新AI资源# AI开源项目# 大模型微调# 桌面自动化智能体4个月前01.4K
RunRabbit:使用语音和文字操作智能体完成电脑操作综合介绍 RunRabbit 是一个基于人工智能的工具,它能让用户通过简单的语音或文字指令,控制浏览器完成各种任务。它最大的特点是理解用户的需求,然后自动操作网页,比如搜索信息、填写表单或执行重复性工...最新AI资源# 桌面自动化智能体4个月前01K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架,让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核...最新AI资源# AI开源项目# 桌面自动化智能体5个月前01.4K
Agent TARS:使用视觉和命令操作电脑的开源智能体综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自...最新AI资源# AI开源项目# 桌面自动化智能体5个月前01.4K
Playwright MCP:微软推出的浏览器自动化MCP服务综合介绍 Playwright MCP 是微软开发的一款开源工具,托管在 GitHub 上。它通过 Model Context Protocol(MCP)协议,让人工智能模型能直接控制浏览器,完成打开...最新AI资源# AI开源项目# MCP服务# 桌面自动化智能体5个月前01.9K
Airtop:使用自然语言控制的浏览器自动化工具综合介绍 Airtop 是一个基于人工智能的浏览器自动化工具。它让用户通过简单的自然语言命令,就能控制云端浏览器完成复杂的网页操作,比如登录网站、抓取数据或执行自动化任务。它解决了传统脚本编写复杂且容...最新AI资源# 桌面自动化智能体5个月前01.2K
BrowserAgent:在浏览器中创建和运行AI工作流的工具综合介绍 BrowserAgent 是一个能在浏览器中直接创建和运行AI工作流的工具。它简单易用,不需要写代码,用户只需描述想要的工作流程,AI就能自动生成。它的核心特点是完全私密,所有数据都在你的浏...最新AI资源# 低代码工作流# 桌面自动化智能体5个月前01.2K
Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手综合介绍 Highlight AI 是一款桌面人工智能助手,支持 Windows 和 macOS(移动版开发中),通过语音指令和屏幕内容分析,帮助用户在任意应用中快速完成任务。它能捕获屏幕内容、生成代...最新AI资源# 桌面自动化智能体2个月前01.3K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具综合介绍 autoMate 是一款由 yuruotong1 在 GitHub 上开源开发的本地自动化工具,以 AI+RPA(人工智能+机器人流程自动化)为核心特色。它将大型语言模型的智能理解与 RPA...最新AI资源# AI开源项目# 桌面自动化智能体5个月前01.4K
Nanobrowser:浏览器中实现任务自动化的多智能插件综合介绍 Nanobrowser 是一个开源的Chrome浏览器扩展,旨在通过AI驱动的多代理系统实现网页任务的自动化。它是一个免费替代OpenAI Operator的工具,用户只需提供自己的LLM...最新AI资源# AI开源项目# 桌面自动化智能体5个月前02.5K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具,作为 Proxy 的迷你版,采用开放权重设计。它基于 3B参数的视觉语言模型(VLM),能够自...最新AI资源# AI开源项目# 桌面自动化智能体5个月前01.3K
Rabbit Android Agent:语音控制安卓应用的智能体(未开放)综合介绍 Rabbit Android Agent 是由 Rabbit 公司开发的一款创新 AI 智能体,旨在通过语音和文字指令,帮助用户在安卓设备上完成单步或多步任务。该技术基于 Rabbit 的 ...最新AI资源# 桌面自动化智能体6个月前01.2K
Convergence:在代理浏览器中自动完成重复任务的AI助手综合介绍 Convergence 是一家致力于利用机器学习技术帮助人们重新掌控时间的公司。通过开发大型元学习模型(LMLMs),Convergence的AI代理(浏览器代理)能够在实时使用中获取新技能...最新AI资源# 桌面自动化智能体2个月前01.7K
mac assistant:macOS设备自动执行桌面操作的AI智能体综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 ...最新AI资源# AI开源项目# 桌面自动化智能体6个月前01.6K
Open Operator:通过AI智能体在云浏览器中执行自动化操作综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.3K
MobileAgent:多代理协作的移动设备操作助手综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.1K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体7个月前01.4K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.1K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建,支持GitHub集成和双因素认证(2FA)。Shortest的主要特点是...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02K
Midscene.js:用AI驱动浏览器自动化测试的开源插件综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具,能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本,简化了UI测...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02K
Stagehand:自然语言实现浏览器自动化操作框架综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础...最新AI资源# AI开源项目# 桌面自动化智能体7个月前01.7K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化综合介绍 Eko 是一个生产级的 JavaScript 框架,旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下,利用AI技术自动化日常任务。Eko提供了一个统...最新AI资源# AI开源项目# 低代码工作流# 智能体应用5个月前01.8K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...最新AI资源# AI开源项目# 桌面自动化智能体7个月前01.5K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架综合介绍 Browser Use Web UI是一个创新的开源项目,专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上,通过Gradio构建了一个用...最新AI资源# AI开源项目# 桌面自动化智能体2个月前02.8K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...最新AI资源# AI开源项目# 桌面自动化智能体7个月前01.5K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目综合介绍 NeoAI是一款创新的开源AI助手工具,它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码,用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.5K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体8个月前01.8K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作综合介绍 ClickClickClick是一个由BandarLabs开发的框架,旨在通过使用任何本地或远程的大型语言模型(LLM)实现安卓和电脑的自动化操作。该项目目前处于高度实验阶段,支持多种模型如...最新AI资源# AI开源项目# 桌面自动化智能体8个月前01.6K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器综合介绍 Browser-Use是一个创新的开源网页自动化工具,专门设计用于让语言模型(LLM)能够自然地与网站进行交互。它提供了一个强大而灵活的框架,支持多种主流语言模型,包括GPT-4、Claud...最新AI资源# AI开源项目# 桌面自动化智能体8个月前02.7K
Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)综合介绍 Project Mariner 是 Google DeepMind 推出的一个研究原型,旨在探索未来的人机交互方式。该项目利用 Gemini 2.0 强大的多模态理解和推理能力,通过浏览器自...最新AI资源# 桌面自动化智能体7个月前01.7K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)综合介绍 Dia Browser是由The Browser Company开发的一款全新智能浏览器,旨在通过集成先进的AI工具,为用户提供更高效的浏览体验。该浏览器预计于2025年初正式发布,主要特点...最新AI资源# 桌面自动化智能体8个月前02K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体综合介绍 Clevrr Computer 是一个开源项目,旨在通过使用 PyAutoGUI 库来实现系统操作的自动化。该项目受到 Anthropic 的启发,设计了一个自动化代理,可以精确高效地执行用...最新AI资源# AI开源项目# 桌面自动化智能体8个月前01.5K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AIGLM-PC(牛牛)简介 GLM-PC 是基于 CogAgent 模型的桌面应用,能通过自然语言指令快速执行复杂任务。它具备任务规划和界面理解能力,可根据用户指令自主完成各种计算机操作。 使用注意...最新AI资源# 桌面自动化智能体8个月前02.4K
Runner H:通过自然语言命令实现网页自动化执行任务(申请内测)综合介绍 Runner H是一家致力于开发前沿行动模型的公司,旨在通过先进的AI能力提升工人的生产力。其旗舰产品Runner H是一款先进的人工智能代理,旨在帮助用户自动化复杂的、多步骤的任务,减少重...最新AI资源# 桌面自动化智能体8个月前01.7K
AppAgent:利用多模态智能体自动操作智能手机综合介绍 AppAgent 是一个基于大语言模型(LLM)的多模态代理框架,旨在操作智能手机应用程序。该框架通过简化的操作空间,模仿人类的交互方式,如点击和滑动,从而无需系统后端访问,扩大了其在不同应...最新AI资源# AI开源项目# 桌面自动化智能体8个月前02K
Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流综合介绍 Skyvern 是一个利用大语言模型(LLM)和计算机视觉技术来自动化浏览器工作流的工具。它通过提供一个简单的API端点,能够替代那些脆弱或不可靠的自动化解决方案,从而高效地自动化大量网站上...最新AI资源# 智能体应用# 桌面自动化智能体5个月前02.4K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现综合介绍 Agent.exe 是一个开源的 Electron 应用程序,利用 Anthropic 的 Claude 3.5 Sonnet API,让用户可以通过 AI 直接控制本地计算机。该项目由 K...最新AI资源# AI开源项目# 桌面自动化智能体8个月前02.1K