综合介绍
Airtop 是一个基于人工智能的浏览器自动化工具。它让用户通过简单的自然语言命令,就能控制云端浏览器完成复杂的网页操作,比如登录网站、抓取数据或执行自动化任务。它解决了传统脚本编写复杂且容易出错的问题,特别适合需要处理多重身份验证(像 OAuth 或双重认证)的场景。Airtop 的核心在于它的云浏览器技术,可以轻松扩展到多个浏览器实例,满足大规模任务需求。它还提供实时人工干预功能,让用户在必要时接手操作。简单来说,Airtop 把繁琐的网页自动化变得更直观、更高效。
功能列表
- 自然语言控制:用户可以用日常语言指挥浏览器,比如“登录网站”或“抓取页面数据”。
- 云浏览器支持:提供可扩展的云端浏览器,适合单次或大规模操作。
- 复杂身份验证处理:支持 OAuth、双重认证(2FA)和验证码解决,轻松访问需要登录的网站。
- 数据抓取与提取:能从网页提取结构化数据,比如产品信息或搜索结果。
- 实时人工干预:通过 Live View 功能,允许用户随时接管浏览器操作。
- 文件操作支持:支持上传、下载文件,以及复制粘贴等基本功能。
- API 集成:提供 TypeScript 和 Python 的 SDK,方便开发者集成到自己的项目中。
使用帮助
Airtop 的使用非常简单,不需要复杂的安装流程,只要注册账号并通过官网访问即可。下面详细介绍如何上手和操作它的主要功能。
如何开始使用
- 注册与登录
打开 https://www.airtop.ai/,点击右上角的“Sign Up”按钮,填写邮箱和密码完成注册。注册后登录账号,你会进入 Airtop 的控制面板。 - 创建浏览器会话
登录后,点击“Create Session”按钮,系统会自动为你分配一个云浏览器。你可以选择浏览器的分辨率(默认是人类常用尺寸,比如 1920x1080)。 - 使用自然语言命令
在控制面板中,找到输入框,直接输入命令。比如,想让浏览器打开谷歌,你可以输入“打开谷歌主页”。Airtop 的 AI 会解析命令并执行。
主要功能操作流程
1. 自然语言控制
- 操作步骤:
在输入框中输入具体的命令,比如“搜索 Airtop 的最新消息”。浏览器会自动打开搜索引擎,输入关键词并展示结果。你也可以输入“点击页面上的第一个链接”,AI 会模拟人类点击行为。 - 注意事项:
命令尽量清晰具体,避免模糊表述。如果命令没被正确执行,可以通过 Live View 检查浏览器状态。
2. 处理身份验证
- 操作步骤:
如果目标网站需要登录,先输入“打开 [网站地址]”。然后通过 Live View 功能(点击“Generate Live View URL”生成链接),手动完成登录,比如输入账号密码或扫描二维码。登录完成后,点击“Save Session Profile”,保存当前会话状态。之后可以用保存的会话直接访问已登录页面,无需再次手动操作。 - 特色用法:
对于需要双重认证的网站,Live View 能让你实时输入验证码。保存会话后,AI 代理可以继续操作,比如“抓取我的订单列表”。
3. 数据抓取与提取
- 操作步骤:
假设你要抓取电商网站的产品信息,先输入“打开 [电商网站] 并搜索手机”。等页面加载完成后,输入“提取页面上所有产品名称和价格”。Airtop 会返回结构化数据(比如 JSON 格式),你可以直接下载或通过 API 获取。 - 高级用法:
如果页面有分页,可以输入“点击下一页并继续提取数据”,Airtop 会自动翻页并汇总所有数据。
4. 实时人工干预
- 操作步骤:
在任何时候,如果 AI 操作遇到问题,点击“Live View”按钮,生成一个实时链接。打开链接后,你可以像操作本地浏览器一样接管,手动完成复杂任务,比如解决验证码或调整页面布局。完成后,保存会话,AI 会继续执行后续命令。 - 使用技巧:
Live View 链接可以嵌入到你的应用中,方便团队协作。
5. API 集成
- 准备工作:
在官网下载 Airtop 的 SDK(支持 TypeScript 和 Python)。比如 Python 用户可以运行:
pip install airtop
然后在代码中导入库:
from airtop import Airtop
- 创建会话示例:
用代码初始化会话:client = Airtop(api_key="你的API密钥") session = client.create_session() session.command("打开 https://www.google.com")
- 提取数据示例:
用 API 提取网页数据:data = session.extract("提取页面上的所有标题") print(data)
小贴士
- 获取 API 密钥:登录后,在控制面板的“Settings”中找到 API 密钥,复制后用于代码集成。
- 查看文档:官网的
/docs
页面有详细的 API 参考和示例代码。 - 节省资源:用完浏览器后,记得点击“End Session”关闭会话,避免浪费云资源。
通过以上步骤,你可以轻松上手 Airtop,无论是简单浏览还是复杂自动化任务都能搞定。
应用场景
- 市场研究
用 Airtop 抓取电商网站的新产品信息,去掉广告干扰,提取价格、型号等数据,方便分析市场趋势。 - 社交媒体监控
登录社交平台后,提取特定话题的帖子和评论,帮助品牌了解用户反馈。 - 自动化办公
用自然语言命令填写在线表格或下载文件,提升日常工作效率。
QA
- Airtop 支持哪些编程语言?
目前支持 TypeScript 和 Python,后续会增加更多语言的 SDK。 - 需要自己搭建浏览器吗?
不需要。Airtop 提供云浏览器,你只需通过官网或 API 控制即可。 - 遇到验证码怎么办?
用 Live View 功能手动输入验证码,保存会话后,AI 可以继续操作。