肉包 Roubao
肉包 Roubao

肉包 Roubao最新版

官方版无广告31

肉包(Roubao) 是一个完全开源、免费、原生运行于 Android 的 AI 手机自动化助手。它基于视觉语言模型(VLM)+ 多 Agent 架构,让你用自然语言指挥手机完成复杂操作。

更新日期:
2025年12月17日
语言:
中文
平台:

12.4MB5 人已下载 手机查看

肉包 Roubao是首款无需电脑的开源 AI 手机自动化助手

一个 App,装上就能用。无需电脑、无需数据线、无需技术背景。

2025 年 12 月,字节跳动联合中兴推出「豆包手机助手」,售价 3499 元,可自动比价下单、投简历、刷视频甚至代打游戏——3 万台工程机当日售罄,二手价一度炒至 5000+。

买不到?那就自己做一个。

肉包(Roubao) 就是这样一个完全开源、免费、原生运行于 Android 的 AI 手机自动化助手。它基于视觉语言模型(VLM)+ 多 Agent 架构,让你用自然语言指挥手机完成复杂操作。

肉包(Roubao)

为什么叫「肉包」?因为作者不爱吃素。🥟

与同类方案对比

特性肉包豆包手机其他开源方案(如 MobileAgent)
需要电脑❌ 不需要❌ 不需要✅ 大多需要
需购买硬件❌ 不需要✅ 3499+❌ 不需要
原生 Android 实现✅ Kotlin✅ 原生❌ Python 脚本
开源协议✅ MIT❌ 闭源✅ 开源
Skills/Tools 架构✅ 完整❓ 未知❌ 无
UI 设计⭐⭐⭐½⭐⭐⭐⭐⭐⭐
自定义 VLM 模型✅ 支持❌ 仅豆包✅ 部分支持

❓ 解决了什么痛点?

传统手机自动化方案普遍存在:

  • 必须连接电脑运行 ADB 命令
  • 依赖 Python 环境与复杂依赖
  • 手机需通过 USB/WiFi 持续连接电脑
  • 技术门槛高,普通用户难以使用

肉包的解决方案:

一个 App,装上就能用。
打开 → 配置 API Key → 说出你想做的事 → 完成。

技术亮点

1. 原生 Android 实现(Kotlin)

市面上几乎所有开源手机自动化项目(包括阿里 MobileAgent)都是 Python 实现,需在电脑运行脚本,通过 ADB 传输截图与指令。

肉包完全重写为原生 Kotlin 应用

  • 截图、分析、执行全部在手机本地完成
  • 无电脑中转,延迟更低
  • 利用 Shizuku 获取系统级权限,替代繁琐 ADB

2. 为什么需要 Shizuku?

Android 默认禁止普通 App:

  • 模拟点击/滑动
  • 读取其他 App 界面
  • 执行 input tapscreencap 等系统命令

Shizuku 提供优雅解法

  • 通过无线调试或一次 ADB 启动服务
  • 之后 App 即可获得 ADB 级权限
  • 无需 Root,无需每次连电脑

这让肉包真正实现“一个 App 搞定一切”。

3. Tools + Skills 双层 Agent 架构(受 Claude Code 启发)

用户: "帮我点份外卖"
         │
         ▼
   ┌─────────────┐
   │ SkillManager │ ← 意图识别
   └─────────────┘
         │
    ┌────┴────┐
    ▼         ▼
🚀 快速路径    🤖 标准路径
(Delegation)  (GUI 自动化)
    │              │
    ▼              ▼
直接 DeepLink   Agent 循环
打开小美 AI     操作美团 App

🔧 Tools 层(原子能力)

Tool功能
search_apps智能搜索已安装应用(支持拼音/语义)
open_app启动应用
deep_link跳转到 App 特定页面
clipboard读写剪贴板
shell执行 Shell 命令
http调用外部 API

🎯 Skills 层(用户意图)

Skill类型说明
点外卖(小美)Delegation直接跳转小美 AI
点外卖(美团)GUI 自动化在美团 App 中一步步操作
导航(高德)DelegationDeepLink 直达高德搜索
生成图片(即梦)Delegation调用即梦 AI
发微信GUI 自动化自动操作微信发消息
  • Delegation 模式:高置信度匹配 → 一步跳转 AI App,快速高效
  • GUI 自动化模式:无 AI 能力的 App → 截图-分析-操作循环,逐步完成

核心特性

智能 AI Agent

  • 基于 VLM(Qwen-VL / GPT-4V / Claude)“看懂”屏幕
  • 自然语言指令,说人话就能操作
  • 根据屏幕状态自动规划下一步

精心设计的 UI

  • Material 3 设计语言
  • 深色/浅色主题自适应
  • 首次使用引导完善
  • 中英文双语支持

🔧 高度可定制

  • 支持多种 VLM:通义千问、GPT-4V、Claude、本地模型(Ollama/vLLM)
  • 一键切换 API 服务商(阿里云、OpenAI、OpenRouter)
  • 动态获取模型列表,支持模糊搜索
  • 可配置自定义 API 端点

安全保护

  • API Key 使用 AES-256-GCM 加密存储
  • 检测到支付、密码等敏感页面 自动停止
  • 任务执行全程可视(悬浮窗显示进度)
  • 可手动停止,崩溃上报可关闭

Root 模式支持

  • 当 Shizuku 以 Root 运行时,可启用 su 命令
  • 自动检测权限等级,非 Root 环境选项置灰

快速开始

前置要求

  • Android 8.0+(API 26)
  • 已连接 WiFi(Shizuku 无线调试依赖)
  • 安装 Shizuku
  • 获取 VLM API Key(如阿里云通义千问)

安装步骤

  1. 安装并启动 Shizuku
    • 无线调试(推荐,Android 11+)
      设置 > 开发者选项 > 无线调试 → 在 Shizuku 中启用
    • 电脑 ADB(旧版 Android)
      adb shell sh /storage/emulated/0/Android/data/moe.shizuku.privileged.api/start.sh
  2. 安装肉包
    从 Releases 下载 APK
  3. 授权与配置
    • 在 Shizuku 中授权肉包
    • 进入设置 → 填写 API Key

获取 API Key(示例)

  • 阿里云通义千问(国内推荐)
    访问 百炼平台 → 开通 DashScope → 创建 API Key
  • OpenAI(需代理)
    访问 OpenAI Platform → 创建 Key

使用示例

  • “帮我点个附近好吃的汉堡”
  • “打开网易云音乐播放每日推荐”
  • “帮我把最后一张照片发送到微博”
  • “在美团点一份猪脚饭”
  • “打开B站看热门视频”

工作流程

  1. 用户输入指令
  2. Skills 匹配 → 若为 Delegation,直接 DeepLink 跳转
  3. 否则进入标准 Agent 循环:
    • 截图(Shizuku)
    • VLM 分析状态(Manager)
    • 决策下一步(Executor)
    • 执行操作(tap/swipe/type)
    • 反思效果(Reflector)
    • 循环直至完成或触发安全限制

路线图

v1.x 已完成

  • 原生 Kotlin 重写,摆脱 Python 依赖
  • Tools + Skills 双层架构
  • 智能应用搜索(拼音/语义)
  • Delegation 快速路径

v2.0 开发中(roubao2.0+AccessibilityService 分支)

  • 无障碍服务混合模式:优先元素索引点击,失败自动回退坐标模式
  • UI 树感知:获取完整 UI 结构,减少视觉误判
  • 宏脚本系统:录制、存储、回放操作序列
  • 设置增强:无障碍开关引导、混合模式状态展示

近期计划

  • MCP(Model Context Protocol)接入日历、邮件等系统能力
  • 执行过程录屏(便于回顾/调试)
  • 更多内置 Skills + 用户自定义支持

长期愿景

  • 多应用协作工作流
  • 从用户习惯中学习优化策略
  • 语音唤醒与指令控制

相关软件

ChatLab

ChatLab - 最新版

ChatLab是一个免费、开源、本地化的,专注于分析聊天记录的应用。通过 AI Agent 和灵活的 SQL 引擎,你可以自由地拆解、查询甚至重构你的社交数据。
ChatWise

ChatWise - 最新版

ChatWise是一款集性能、隐私保护和用户体验于一身的AI聊天应用。它不仅支持多种LLM模型和多模态交互,还通过本地存储和优化设计,确保数据安全和高效使用。无论是日常聊天、文件处理还是专业创作,ChatWise都能满足你的需求。
BotGem

BotGem - 最新版

BotGem是一款智能聊天助手应用程序,使用先进的自然语言处理技术来理解和回复您的短信。您可以使用BotGem来提问、分享想法、寻求建议或只是进行随意的聊天。

暂无评论

none
暂无评论...