AI个人学习
和实操指南

Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)

综合介绍

Project Mariner 是 Google DeepMind 推出的一个研究原型,旨在探索未来的人机交互方式。该项目利用 Gemini 2.0 强大的多模态理解和推理能力,通过浏览器自动化来完成各种任务。Project Mariner 能够理解并实时导航复杂的网站,自动执行浏览器中的任务,同时保持用户的控制权。该项目目前仅对一小部分受信任的测试者开放,旨在测试和改进其功能。

Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)-1


 

功能列表

  • 多模态理解:能够理解浏览器屏幕上的所有内容,包括像素、文本、代码、图像和表单。
  • 浏览器交互:自动导航和操作网站,执行用户指令。
  • 推理能力:能够理解复杂指令并将其分解为可执行的步骤。
  • 实时反馈:在执行任务时提供视觉反馈和更新。
  • 安全控制:在执行任务时保持用户的控制权,确保安全性。

 

使用帮助

安装流程

  1. 下载扩展程序:访问 Project Mariner 的官方网站,下载并安装 Chrome 浏览器扩展程序。
  2. 设置账户:安装完成后,打开 Chrome 浏览器,点击扩展程序图标,按照提示设置账户并登录。
  3. 加入测试者队列:填写相关信息,申请加入受信任的测试者队列。

使用流程

  1. 启动扩展程序:登录后,点击浏览器右上角的扩展程序图标,启动 Project Mariner。
  2. 输入指令:在弹出的聊天窗口中输入指令,例如“创建购物车”或“查找航班”。
  3. 执行任务:Project Mariner 将自动导航到相关网站并执行任务。用户可以在浏览器中实时查看任务进度。
  4. 反馈与调整:如果 Project Mariner 需要更多信息或遇到问题,会在聊天窗口中请求用户反馈。用户可以根据需要提供更多指令或调整任务。

主要功能操作流程

  • 创建购物车:输入购物清单,Project Mariner 将自动导航到购物网站,搜索并添加商品到购物车。
  • 查找航班和酒店:输入旅行日期和目的地,Project Mariner 将自动搜索并显示相关航班和酒店信息。
  • 查找食谱:输入食材或菜名,Project Mariner 将自动搜索并显示相关食谱。

特色功能

  • 多模态理解:Project Mariner 能够理解和处理浏览器屏幕上的各种元素,包括文本、图像和表单。
  • 实时反馈:在执行任务时,Project Mariner 会提供实时的视觉反馈,确保用户了解任务进度。
  • 安全控制:Project Mariner 在执行任务时保持用户的控制权,确保任务的安全性和准确性。
未经允许不得转载:首席AI分享圈 » Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文