🚀邀请体验：中国首家 AI IDE 智能编程软件 Trae 中文版下载，不限量使用 DeepSeek-R1 和 Doubao-pro!

共 44 篇文章

标签：桌面自动化智能体第2页

Convergence：在代理浏览器中自动完成重复任务的AI助手

综合介绍 Convergence 是一家致力于利用机器学习技术帮助人们重新掌控时间的公司。通过开发大型元学习模型（LMLMs），Convergence的AI代理（浏览器代理）能够在实时使用中获取新技能、采取行动并不断改进。其核心...

2025-02-20AI工具桌面自动化智能体

mac assistant：macOS设备自动执行桌面操作的AI智能体

综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目，旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ，并计划未来支持 Ollama 运行的本地大语言模型。mac_assista...

2025-02-16AI工具 AI开源项目桌面自动化智能体

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

开启 Builder 智能编程模式，无限量使用 DeepSeek-R1 和 DeepSeek-V3 ，对比海外版体验更加流畅。只需输入中文指令，不懂编程的小白也可以零门槛编写自己的应用。

2025-04-27

Open Operator：通过AI智能体在云浏览器中执行自动化操作

综合介绍 Open Operator 是一个开源项目，旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发，结合了 Stagehand 和 Browserbase 的技术，使得用户能够通过自然语言指令控制浏览器的行为。Ope...

2025-01-26AI工具 AI开源项目桌面自动化智能体

MobileAgent：多代理协作的移动设备操作助手

综合介绍 MobileAgent 是一个强大的移动设备操作助手，旨在通过多代理协作和增强的视觉感知模块，提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发，支持 Android 和 Harmony OS 系统，能够在复杂...

2025-01-24AI工具 AI开源项目桌面自动化智能体

TankWork：通过语音和文字操作电脑，并提供实时语音反馈的智能体

综合介绍 TankWork是一个开源的桌面代理框架，旨在通过计算机视觉和系统级交互，使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机，处理实时屏幕内容，并提供连续的音频视觉反馈和操...

2025-01-23AI工具 AI开源项目桌面自动化智能体

UI-TARS Desktop：使用自然语言控制电脑的桌面智能体应用

综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS（视觉语言模型）的图形界面代理应用。该应用允许用户通过自然语言来控制计算机，实现更直观和高效的人机交互。UI-TARS Desktop 支持跨平台操作，兼...

2025-01-22AI工具 AI开源项目桌面自动化智能体

Shortest：AI自动化测试工具，使用自然语言进行端到端测试

综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建，支持GitHub集成和双因素认证（2FA）。Shortest的主要特点是通过自然语言编写测试用例，并利用Anthropic Cl...

2025-01-20AI工具 AI开源项目桌面自动化智能体

Midscene.js：用AI驱动浏览器自动化测试的开源插件

综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具，能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本，简化了UI测试的编写和维护过程。通过利用多模态大...

2025-01-20AI工具 AI开源项目桌面自动化智能体

Stagehand：自然语言实现浏览器自动化操作框架

综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright，提供了三个简单的AI API（act、extract和observe），这些API构建在基础的Playwright Page类之上，为通过自然语言进行网...

2025-01-16AI工具 AI开源项目桌面自动化智能体

Eko：自然语言构建智能体工作流，实现桌面与浏览器自动化

综合介绍 Eko 是一个生产级的 JavaScript 框架，旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下，利用AI技术自动化日常任务。Eko提供了一个统一的接口，支持在计...

2025-01-16AI工具 AI开源项目低代码工作流智能体应用桌面自动化智能体

AutoMouser：生成浏览器自动化代码，将鼠标操作通过AI转为Selenium Python脚本

综合介绍 AutoMouser 是一个 Chrome 扩展程序，能够智能地跟踪用户交互，并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换为稳健、可维护的 Python Selenium 脚本，...

2025-01-15AI工具 AI开源项目桌面自动化智能体

Browser Use Web UI：运行AI智能体浏览网页，让AI能够自动操作网页的开源框架

综合介绍 Browser Use Web UI是一个创新的开源项目，专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上，通过Gradio构建了一个用户友好的Web界面，使得AI代理能够便捷地...

2025-01-13AI工具 AI开源项目桌面自动化智能体

E2B Open Computer Use：E2B沙盒中安全的运行AI操作系统

综合介绍 E2B Open Computer Use 是一个开源项目，旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境，用户可以将其连接到任何大型语言模型（LLM）上来控制计算机，支持...

2025-01-10AI工具 AI开源项目桌面自动化智能体

NeoAI：让AI接管电脑远程操作，使用自然语言控制电脑的开源项目

综合介绍 NeoAI是一款创新的开源AI助手工具，它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码，用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI支持Window...

2025-01-02AI工具 AI开源项目桌面自动化智能体

CogAgent：智谱开源的智能视觉语言模型，实现图形界面自动化操作

综合介绍 CogAgent是由清华大学数据挖掘研究组（THUDM）开发的开源视觉语言模型，旨在实现跨平台的图形用户界面（GUI）自动化操作。该模型基于CogVLM（GLM-4V-9B），支持中英文双语交互，能够通过屏幕截图和自然...

2024-12-27AI工具 AI开源项目桌面自动化智能体

ClickClickClick：启用任何LLM实现自动化安卓和电脑操作

综合介绍 ClickClickClick是一个由BandarLabs开发的框架，旨在通过使用任何本地或远程的大型语言模型（LLM）实现安卓和电脑的自动化操作。该项目目前处于高度实验阶段，支持多种模型如Ollama、Gemini和GPT 4o。用...

2024-12-23AI工具 AI开源项目桌面自动化智能体

Browser-Use：构建智能网页自动化工具，让AI智能体轻松操作浏览器

综合介绍 Browser-Use是一个创新的开源网页自动化工具，专门设计用于让语言模型(LLM)能够自然地与网站进行交互。它提供了一个强大而灵活的框架，支持多种主流语言模型，包括GPT-4、Claude等。该工具最显著的特点...

2024-12-21AI工具 AI开源项目桌面自动化智能体

Project Mariner：浏览器自动化，探索未来人机交互的研究原型（未发布）

综合介绍 Project Mariner 是 Google DeepMind 推出的一个研究原型，旨在探索未来的人机交互方式。该项目利用 Gemini 2.0 强大的多模态理解和推理能力，通过浏览器自动化来完成各种任务。Project Mariner 能够理...

2024-12-12AI工具桌面自动化智能体

Dia Browser：提供智能浏览体验，集成AI工具，在浏览器中自动化处理任务（未上线）

综合介绍 Dia Browser是由The Browser Company开发的一款全新智能浏览器，旨在通过集成先进的AI工具，为用户提供更高效的浏览体验。该浏览器预计于2025年初正式发布，主要特点包括智能写作辅助、自动化任务处理和...

2024-12-11AI工具桌面自动化智能体

上一页
1
2
3
下一页
共 3 页

标签：桌面自动化智能体第2页

Convergence：在代理浏览器中自动完成重复任务的AI助手

mac assistant：macOS设备自动执行桌面操作的AI智能体

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

Open Operator：通过AI智能体在云浏览器中执行自动化操作

MobileAgent：多代理协作的移动设备操作助手

TankWork：通过语音和文字操作电脑，并提供实时语音反馈的智能体

UI-TARS Desktop：使用自然语言控制电脑的桌面智能体应用

Shortest：AI自动化测试工具，使用自然语言进行端到端测试

Midscene.js：用AI驱动浏览器自动化测试的开源插件

Stagehand：自然语言实现浏览器自动化操作框架

Eko：自然语言构建智能体工作流，实现桌面与浏览器自动化

AutoMouser：生成浏览器自动化代码，将鼠标操作通过AI转为Selenium Python脚本

Browser Use Web UI：运行AI智能体浏览网页，让AI能够自动操作网页的开源框架

E2B Open Computer Use：E2B沙盒中安全的运行AI操作系统

NeoAI：让AI接管电脑远程操作，使用自然语言控制电脑的开源项目

CogAgent：智谱开源的智能视觉语言模型，实现图形界面自动化操作

ClickClickClick：启用任何LLM实现自动化安卓和电脑操作

Browser-Use：构建智能网页自动化工具，让AI智能体轻松操作浏览器

Project Mariner：浏览器自动化，探索未来人机交互的研究原型（未发布）

Dia Browser：提供智能浏览体验，集成AI工具，在浏览器中自动化处理任务（未上线）

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：桌面自动化智能体 第2页

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：桌面自动化智能体第2页