Opera,这家以创新精神著称的挪威科技公司,再次走在了浏览器技术的前沿。近日,Opera 宣布推出一项名为 Browser Operator 的全新 AI 代理功能,为用户带来前所未有的浏览体验。这项创新技术,如同为浏览器安装了一个智能助手,能够理解用户的自然语言指令,并主动执行各种在线任务,真正实现了浏览器从信息展示平台到主动服务工具的转变。
告别繁琐,AI 代理让浏览器“动”起来
长期以来,浏览器在我们的印象中,更多扮演的是一个被动的信息呈现角色。我们需要手动输入网址,手动点击链接,所有的操作都离不开用户的 “指令”。而 Opera 推出的 Browser Operator 则试图打破这种传统模式,让浏览器变得更智能、更主动。
想象一下,你只需要告诉浏览器 “帮我买几双白色网球袜,要 XXX 品牌和 L 码”,Browser Operator 就能自动完成从搜索商品、筛选尺寸、加入购物车到完成支付的整个购物流程。这不再是科幻电影里的场景,而是 Opera 正在努力实现的未来。
Opera 表示,Browser Operator 旨在将用户从繁琐的在线任务中解放出来,让他们能够将宝贵的时间投入到更有意义的事情上。无论是网购商品、预订机票酒店,还是收集网页信息填充表格,Browser Operator 都能成为用户的得力助手。在任务执行过程中,用户可以随时监控进度,并在需要时接管或取消任务,确保一切尽在掌控。
使用场景示例
- 场景一:轻松网购 对于繁忙的上班族来说,网购虽然方便,但挑选商品、比价、下单也需要花费不少时间。有了 Browser Operator,用户只需简单描述需求,例如 “在 [电商平台名称] 购买最新款的 [商品类型],价格在 [价格范围] 左右,评分要 4.5 星以上”,Browser Operator 就能自动完成商品筛选、排序、加入购物车等一系列操作,最终用户只需核对订单信息并确认支付即可。
- 场景二:信息快速收集 研究人员或数据分析师经常需要从网页上搜集信息,手动复制粘贴效率低下且容易出错。借助 Browser Operator,用户可以指定需要收集的信息类型和目标网站,例如 “从 [新闻网站] 抓取今天所有关于 [关键词] 的新闻标题和链接,保存到 [指定文档格式]”,Browser Operator 就能快速抓取相关信息并整理成结构化文档,大大提升信息收集效率。
Browser Operator 的用户体验
目前 Browser Operator 仍处于功能预览阶段,用户可以通过 Opera 浏览器的侧边栏和命令栏访问它。要使用 Browser Operator,只需输入你想让它为你执行的任务即可。
例如,你可以让它在网上购买商品、预订票务和活动,甚至从网站收集信息以填充到电子表格或文档中。
Browser Operator 会让你看到整个过程的进展,以及它为完成任务所采取的步骤:
当你以提示词的形式向 Browser Operator 发出任务指令后,它会开始工作以完成任务,并且偶尔可能需要你的输入才能完成,这就是所谓的 “人机协作”。然后,你可以直接与网页交互,或者通过 Browser Operator 的聊天界面提供更多信息。
例如,如果你需要填写表格,你可以直接在网页上输入信息,或者将信息提供给 Browser Operator,然后点击 “继续” 以便它恢复并完成任务。
此外,你可以随时取消 Browser Operator 正在执行的任务,只需点击取消按钮即可:
最后,当整个任务完成后,你可以选择结束任务,或者向 Browser Operator 提供进一步的指示,以详细说明刚刚完成的任务。 礼貌地说声 “谢谢” 总是好的 🙂,但例如,如果你下错了订单,你可以指示 Browser Operator 取消它。 届时,Browser Operator 将理解你指的是哪个订单并为你取消它。
立足本地,安全与效率并驾齐驱
在众多厂商纷纷探索 AI 代理技术的当下,Opera 的 Browser Operator 方案独树一帜。它采用了立足本地客户端的策略,与那些依赖屏幕截图、视频捕捉或云端服务器的解决方案截然不同。
Opera 的 AI 代理直接在用户的浏览器环境中运行,无需虚拟机或云端服务器的支持。这种本地化的运行方式,不仅最大限度地保护了用户的数据隐私,确保用户的登录信息等敏感数据不会被发送到第三方服务器,还大大提升了任务执行的效率。由于 Browser Operator 直接访问网页的 DOM 树和浏览器布局数据,它能够像人一样 “理解” 网页结构,无需像图像识别 AI 那样 “观看” 屏幕像素,从而实现更快速、更精准的操作。
更值得一提的是,Browser Operator 能够有效地处理网页中的各种弹窗,例如常见的 Cookie 同意弹窗和验证对话框,这得益于它可以与用户不可见的网页元素进行交互。这些优势使得 Browser Operator 在用户体验、安全性和效率方面都更胜一筹。
持续创新,Opera 的 AI 浏览器之路
Opera 一直以来都是浏览器创新领域的先锋。从最早的标签页浏览、地址栏搜索,到内置 VPN、侧边栏即时通讯工具,再到率先推出原生浏览器 AI —— Aria,Opera 不断突破浏览器的功能边界,致力于为用户提供更优质的上网体验。
在 AI 技术浪潮席卷全球的背景下,Opera 再次展现了其前瞻性的战略眼光。早在 2023 年,Opera 就率先将 AI 功能融入浏览器,并持续通过 AI Feature Drops 计划,不断迭代和完善 Aria 的功能,例如本地 LLM、图像生成、AI 标签页指令等创新功能都陆续在 Opera 浏览器中亮相。
而此次推出的 Browser Operator,无疑是 Opera 在 AI 浏览器领域的又一次重大突破。它标志着 Opera 正在将浏览器从一个工具,转变为一个能够主动为用户服务的智能代理,引领浏览器迈向 “Agentic Browsing” 的新时代。
预览在即,未来可期
目前,Browser Operator 尚处于功能预览阶段,用户可以通过 Opera 浏览器的侧边栏和命令栏体验这项前沿技术。Opera 计划在未来的 AI Feature Drops 计划中正式发布 Browser Operator,让更多用户能够体验到 AI 代理带来的便捷与高效。
随着 AI 技术的不断发展,我们有理由相信,Browser Operator 仅仅是一个开始。未来,AI 将在浏览器中扮演越来越重要的角色,为用户带来更加智能化、个性化、场景化的浏览体验。而 Opera,无疑将继续引领这场浏览器变革的潮流。