综合介绍
AI Web Operator 是一个开源的 AI 浏览器操作工具,旨在通过集成多种 AI 技术和 SDK,简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel AI SDK 构建,支持多种大型语言模型(LLMs),如 Anthropic Claude。用户可以通过简单的配置和安装,快速上手使用该工具,实现自动化浏览器操作、持久会话管理等功能。AI Web Operator 适用于开发者、研究人员和对 AI 技术感兴趣的用户,提供了灵活且可扩展的解决方案。
功能列表
- 自动化浏览器操作:通过集成 Browserbase API,实现自动化的浏览器操作。
- 持久会话管理:支持持久会话,保持任务历史记录。
- 多模型支持:兼容多种大型语言模型(LLMs),如 Anthropic Claude。
- 高效的开发环境:基于 Vercel AI SDK,提供高效的开发和运行环境。
- 开源和可扩展:完全开源,用户可以根据需求进行二次开发和扩展。
使用帮助
安装流程
- 克隆仓库:
git clone https://github.com/CognosysAI/browser.git
cd browser
- 安装依赖: 使用 pnpm 安装依赖:
pnpm install
- 配置环境变量: 创建
.env.local
文件,并添加以下内容:
BROWSERBASE_API_KEY=your_key_here
BROWSERBASE_PROJECT_ID=your_key_here
ANTHROPIC_API_KEY=your_key_here
UPSTASH_REDIS_REST_URL=optional_redis_url
UPSTASH_REDIS_REST_TOKEN=optional_redis_token
- 启动开发服务器:
pnpm run dev
打开浏览器访问 http://localhost:3000
。
功能操作指南
- 自动化浏览器操作:
- 配置 Browserbase API 密钥和项目 ID 后,用户可以通过 API 调用实现自动化浏览器操作,如页面导航、表单填写等。
- 持久会话管理:
- 通过配置 Upstash Redis,用户可以实现持久会话管理,保持任务历史记录,方便后续操作。
- 多模型支持:
- 配置 Anthropic API 密钥后,用户可以调用多种大型语言模型,进行自然语言处理任务。
- 高效的开发环境:
- 基于 Vercel AI SDK,提供高效的开发和运行环境,支持快速迭代和部署。