肉包 - 开源AI手机自动化助手,能看懂屏幕自动执行

堆友AI

肉包是什么

肉包(Roubao)是开源的AI手机助手,让用户用现有Android手机能体验类似"豆包手机"的智能自动化功能。肉包基于视觉语言模型,能看懂屏幕内容并自动执行复杂任务,从点外卖、发微信到跨App操作,只需一句话指令。肉包原生Kotlin开发,无需电脑中转或购买专用设备,通过Shizuku获取系统权限即可运行。工具支持多种大模型接入,界面精致且完全免费。

肉包 - 开源AI手机自动化助手,能看懂屏幕自动执行

肉包的功能特色

  • 视觉理解执行:基于VLM模型解析屏幕内容,将自然语言指令转化为点击、滑动、输入等具体操作。
  • 双模式任务处理:高置信度任务直接DeepLink跳转AI应用(Delegation),复杂任务启动自主决策循环(GUI自动化)。
  • 跨应用协同:打通应用壁垒,实现截图识别、内容搬运、信息跨App流转等联动操作。
  • 智能应用调度:支持拼音/语义搜索已安装应用,自动匹配最优执行路径。
  • 动态界面适配:实时感知UI元素变化,自动调整点击坐标与操作逻辑。
  • 安全执行机制:支付/密码页面自动暂停,全程悬浮窗可视可控,AES加密存储密钥。
  • マルチモデル対応:灵活接入通义千问、GPT-4V、Claude等云端模型,支持Ollama本地部署。
  • Root扩展能力:支持检测Shizuku权限等级,Root环境下解锁系统级深度操作。

肉包的核心优势

  • 零门槛部署:使用工具无需购买专用硬件,现有Android手机安装即用,摆脱Python环境的依赖束缚。
  • 纯端侧运行:Kotlin原生重构,截图分析与指令执行全在本地完成,告别电脑中转的低效链路。
  • 权限获取优雅:通过Shizuku无线调试获得ADB级控制能力,Root非必需,安全与功能兼顾。
  • 架构灵活解耦:Tools层原子能力可复用,Skills层意图映射易扩展,新场景开发成本低。
  • 模型选择自由:不绑定单一厂商,支持多厂商VLM及本地模型,避免生态锁定。
  • 执行路径智能:支持Delegation与GUI自动化双轨并行,简单任务一步直达,复杂任务深度操控。

肉包官网是什么

  • GitHubリポジトリ:https://github.com/Turbo1123/roubao

肉包的适用人群

  • 尝鲜型用户:想体验AI手机自动化但不愿高价抢购豆包手机,或错过发售时机的科技爱好者。
  • 效率追求者:厌倦重复性手机操作,希望用自然语言指令快速完成点外卖、发消息、查导航等日常任务。
  • 多设备使用者:拥有多部Android手机,希望将旧机改造为自动化执行终端的极客玩家。
  • 隐私敏感者:不愿将个人数据上传至云端处理,倾向本地VLM部署的离线使用场景。
  • 开发者/研究者:关注Mobile Agent架构实现,需要开源代码参考或二次创新的AI应用开发者。

© 著作権表示

関連記事

コメントなし

コメントに参加するにはログインが必要です!
今すぐログイン
なし
コメントはありません