OMG-Agent
OMG-Agent

OMG-Agent 最新版

官方版无广告14

OMG-Agent 是一个开源的移动端 GUI Agent 桌面客户端,通过自然语言指令驱动 AI 自动操作 Android 手机。

更新日期:
2026年1月1日
分类标签:
语言:
中文
平台:

60.3MB0 人已下载 手机查看

OMG-Agent 是一个开源的桌面客户端,能让 AI 通过自然语言指令自动操作 Android 手机。它不依赖云端服务,所有控制逻辑运行在本地,适合对自动化、隐私和可定制性有要求的用户。

OMG-Agent

核心能力

  • 支持专用手机 GUI 模型:包括智谱 AI 的 AutoGLM-Phone-9B 和阶跃星辰的 GELab-Zero-4B-preview,这些模型专为理解手机界面而训练。
  • 实时操作与反馈:通过 ADB(Android Debug Bridge)获取手机实时截图,结合 AI 分析界面状态并执行任务。
  • 灵活的 API 接入:兼容 OpenAI 风格的 API,便于接入本地或自托管的大模型服务。
  • 多环境支持:不仅支持真机,也兼容主流 Android 模拟器,方便无物理设备时调试。
  • 用户友好界面:提供中英双语切换、深色/浅色主题,降低使用门槛。

使用流程

1. 安装 ADB 工具

ADB 是连接和控制 Android 设备的基础组件:

# Windows(通过 Scoop)
scoop install adb

# macOS(通过 Homebrew)
brew install android-platform-tools

# Linux(Ubuntu/Debian)
sudo apt install adb

2. 获取并运行 OMG-Agent

git clone https://github.com/safphere/OM0-Agent.git
cd OMG-Agent
pip install -r requirements.txt
python run.py

3. 配置 Android 设备

  • 在手机设置中启用 开发者选项 和 USB 调试
  • 安装 ADBKeyboard(用于模拟文本输入)。
  • 通过 USB 连接电脑,并在手机上允许调试授权

4. 开始自动化任务

  • 在 OMG-Agent 界面点击 “刷新设备”,确认设备已识别。
  • 点击 “开始投屏”,获取当前屏幕画面。
  • 在输入框中描述任务,例如:

    “打开微信,给张三发一条消息:会议推迟到明天。”

  • 点击 “执行”,AI 将解析指令并在手机上逐步操作。

推荐模型

模型名称提供方特点说明
AutoGLM-Phone-9B智谱 AI专为手机 GUI 理解优化
GELab-Zero-4B-preview阶跃星辰轻量级移动端 Agent 模型

这些模型经过针对性训练,能更准确地识别应用图标、按钮、输入框等界面元素,提升任务成功率。

注意事项

  • 仅限非商业用途:项目采用 Apache 2.0 + Commons Clause 许可,允许学习、研究和二次开发,但禁止商业使用
  • 遵守平台规则:自动操作可能违反部分 App 的服务条款,请在合法合规前提下使用。
  • 风险自担:所有操作由用户发起,项目开发者不承担由此产生的任何后果。

相关软件

Youtu-Tip

Youtu-Tip - 最新版

Youtu-Tip 是一个主动式端侧AI助手,一键调用,智能地理解您当前的工作内容。Tip 是 Youtu-Agent 的一个更易于使用的可视化应用,它集成了桌面自动化、代理调用等功能。它完全开源,支持离线设备使用,并保障您的隐私安全。

暂无评论

none
暂无评论...