
Agent S:像人类一样操作电脑的开源智能体框架
综合介绍 Agent S 是由 Simular AI 开发的开源框架,让智能体通过图形用户界面(GUI)像人类一样操作电脑。它使用多模态大语言模型和经验学习技术,能完成浏览网页、编辑文档、使用软件等任务。项目在 GitHub 上...
综合介绍 Agent S 是由 Simular AI 开发的开源框架,让智能体通过图形用户界面(GUI)像人类一样操作电脑。它使用多模态大语言模型和经验学习技术,能完成浏览网页、编辑文档、使用软件等任务。项目在 GitHub 上...
综合介绍 Libra 是 Greenbit.ai 推出的一款创新工具,核心功能是通过自然语言对话生成能在本地运行的 AI 智能体。它被称为“Vibe Agent”,能让用户用简单的话描述需求,快速创建专属智能体,完成网页搜索、数据分...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:ComputerGYM、AgentAI 和 Playwright,用户可...
综合介绍 RunRabbit 是一个基于人工智能的工具,它能让用户通过简单的语音或文字指令,控制浏览器完成各种任务。它最大的特点是理解用户的需求,然后自动操作网页,比如搜索信息、填写表单或执行重复性工作。网站...
综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架,让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核心是“Computer Use Agent”(CUA),可以模拟人类...
综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自动执行浏览器...
综合介绍 Playwright MCP 是微软开发的一款开源工具,托管在 GitHub 上。它通过 Model Context Protocol(MCP)协议,让人工智能模型能直接控制浏览器,完成打开网页、点击元素、输入文字等操作。这个工具基于 Pl...
综合介绍 Airtop 是一个基于人工智能的浏览器自动化工具。它让用户通过简单的自然语言命令,就能控制云端浏览器完成复杂的网页操作,比如登录网站、抓取数据或执行自动化任务。它解决了传统脚本编写复杂且容易出...
综合介绍 BrowserAgent 是一个能在浏览器中直接创建和运行AI工作流的工具。它简单易用,不需要写代码,用户只需描述想要的工作流程,AI就能自动生成。它的核心特点是完全私密,所有数据都在你的浏览器里处理,不...
综合介绍 Highlight AI 是一款桌面人工智能助手,支持 Windows 和 macOS(移动版开发中),通过语音指令和屏幕内容分析,帮助用户在任意应用中快速完成任务。它能捕获屏幕内容、生成代码、回答问题,并与 GitHub...
综合介绍 autoMate 是一款由 yuruotong1 在 GitHub 上开源开发的本地自动化工具,以 AI+RPA(人工智能+机器人流程自动化)为核心特色。它将大型语言模型的智能理解与 RPA 的流程执行能力结合,用户只需用自然语言...
综合介绍 Nanobrowser 是一个开源的Chrome浏览器扩展,旨在通过AI驱动的多代理系统实现网页任务的自动化。它是一个免费替代OpenAI Operator的工具,用户只需提供自己的LLM(大型语言模型)API密钥即可使用,支持O...
综合介绍 Proxy Lite 是由 Convergence AI 开发的一款开源、轻量级网页自动化工具,作为 Proxy 的迷你版,采用开放权重设计。它基于 3B参数的视觉语言模型(VLM),能够自主完成网页导航与任务执行,例如查找信息...
综合介绍 Rabbit Android Agent 是由 Rabbit 公司开发的一款创新 AI 智能体,旨在通过语音和文字指令,帮助用户在安卓设备上完成单步或多步任务。该技术基于 Rabbit 的 LAM(Large Action Model,大型动作模型)...
综合介绍 Convergence 是一家致力于利用机器学习技术帮助人们重新掌控时间的公司。通过开发大型元学习模型(LMLMs),Convergence的AI代理(浏览器代理)能够在实时使用中获取新技能、采取行动并不断改进。其核心...
综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 Ollama 运行的本地大语言模型。mac_assista...
综合介绍 Open Operator 是一个开源项目,旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发,结合了 Stagehand 和 Browserbase 的技术,使得用户能够通过自然语言指令控制浏览器的行为。Ope...
综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 Harmony OS 系统,能够在复杂...
综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉反馈和操...