OMG-Agent
OMG-Agent

OMG-Agent 最新版

官方版无广告10

OMG-Agent 是一个开源的移动端 GUI Agent 桌面客户端,通过自然语言指令驱动 AI 自动操作 Android 手机。

更新日期:
2026年1月1日
分类标签:
语言:
中文
平台:

60.3MB0 人已下载 手机查看

OMG-Agent 是一个开源的桌面客户端,能让 AI 通过自然语言指令自动操作 Android 手机。它不依赖云端服务,所有控制逻辑运行在本地,适合对自动化、隐私和可定制性有要求的用户。

OMG-Agent

核心能力

  • 支持专用手机 GUI 模型:包括智谱 AI 的 AutoGLM-Phone-9B 和阶跃星辰的 GELab-Zero-4B-preview,这些模型专为理解手机界面而训练。
  • 实时操作与反馈:通过 ADB(Android Debug Bridge)获取手机实时截图,结合 AI 分析界面状态并执行任务。
  • 灵活的 API 接入:兼容 OpenAI 风格的 API,便于接入本地或自托管的大模型服务。
  • 多环境支持:不仅支持真机,也兼容主流 Android 模拟器,方便无物理设备时调试。
  • 用户友好界面:提供中英双语切换、深色/浅色主题,降低使用门槛。

使用流程

1. 安装 ADB 工具

ADB 是连接和控制 Android 设备的基础组件:

# Windows(通过 Scoop)
scoop install adb

# macOS(通过 Homebrew)
brew install android-platform-tools

# Linux(Ubuntu/Debian)
sudo apt install adb

2. 获取并运行 OMG-Agent

git clone https://github.com/safphere/OM0-Agent.git
cd OMG-Agent
pip install -r requirements.txt
python run.py

3. 配置 Android 设备

  • 在手机设置中启用 开发者选项 和 USB 调试
  • 安装 ADBKeyboard(用于模拟文本输入)。
  • 通过 USB 连接电脑,并在手机上允许调试授权

4. 开始自动化任务

  • 在 OMG-Agent 界面点击 “刷新设备”,确认设备已识别。
  • 点击 “开始投屏”,获取当前屏幕画面。
  • 在输入框中描述任务,例如:

    “打开微信,给张三发一条消息:会议推迟到明天。”

  • 点击 “执行”,AI 将解析指令并在手机上逐步操作。

推荐模型

模型名称提供方特点说明
AutoGLM-Phone-9B智谱 AI专为手机 GUI 理解优化
GELab-Zero-4B-preview阶跃星辰轻量级移动端 Agent 模型

这些模型经过针对性训练,能更准确地识别应用图标、按钮、输入框等界面元素,提升任务成功率。

注意事项

  • 仅限非商业用途:项目采用 Apache 2.0 + Commons Clause 许可,允许学习、研究和二次开发,但禁止商业使用
  • 遵守平台规则:自动操作可能违反部分 App 的服务条款,请在合法合规前提下使用。
  • 风险自担:所有操作由用户发起,项目开发者不承担由此产生的任何后果。

相关软件

Open WebUI

Open WebUI - 最新版

Open WebUI 是一个功能丰富的开源工具,适合开发者、研究人员和组织,用于构建自定义 AI 聊天界面。其支持多种 LLM、插件扩展和自托管能力使其在 AI 交互领域具有吸引力。

暂无评论

none
暂无评论...