OMG-Agent
OMG-Agent

OMG-Agent 最新版

官方版无广告8

OMG-Agent 是一个开源的移动端 GUI Agent 桌面客户端,通过自然语言指令驱动 AI 自动操作 Android 手机。

更新日期:
2026年1月1日
分类标签:
语言:
中文
平台:

60.3MB0 人已下载 手机查看

OMG-Agent 是一个开源的桌面客户端,能让 AI 通过自然语言指令自动操作 Android 手机。它不依赖云端服务,所有控制逻辑运行在本地,适合对自动化、隐私和可定制性有要求的用户。

OMG-Agent

核心能力

  • 支持专用手机 GUI 模型:包括智谱 AI 的 AutoGLM-Phone-9B 和阶跃星辰的 GELab-Zero-4B-preview,这些模型专为理解手机界面而训练。
  • 实时操作与反馈:通过 ADB(Android Debug Bridge)获取手机实时截图,结合 AI 分析界面状态并执行任务。
  • 灵活的 API 接入:兼容 OpenAI 风格的 API,便于接入本地或自托管的大模型服务。
  • 多环境支持:不仅支持真机,也兼容主流 Android 模拟器,方便无物理设备时调试。
  • 用户友好界面:提供中英双语切换、深色/浅色主题,降低使用门槛。

使用流程

1. 安装 ADB 工具

ADB 是连接和控制 Android 设备的基础组件:

# Windows(通过 Scoop)
scoop install adb

# macOS(通过 Homebrew)
brew install android-platform-tools

# Linux(Ubuntu/Debian)
sudo apt install adb

2. 获取并运行 OMG-Agent

git clone https://github.com/safphere/OM0-Agent.git
cd OMG-Agent
pip install -r requirements.txt
python run.py

3. 配置 Android 设备

  • 在手机设置中启用 开发者选项 和 USB 调试
  • 安装 ADBKeyboard(用于模拟文本输入)。
  • 通过 USB 连接电脑,并在手机上允许调试授权

4. 开始自动化任务

  • 在 OMG-Agent 界面点击 “刷新设备”,确认设备已识别。
  • 点击 “开始投屏”,获取当前屏幕画面。
  • 在输入框中描述任务,例如:

    “打开微信,给张三发一条消息:会议推迟到明天。”

  • 点击 “执行”,AI 将解析指令并在手机上逐步操作。

推荐模型

模型名称提供方特点说明
AutoGLM-Phone-9B智谱 AI专为手机 GUI 理解优化
GELab-Zero-4B-preview阶跃星辰轻量级移动端 Agent 模型

这些模型经过针对性训练,能更准确地识别应用图标、按钮、输入框等界面元素,提升任务成功率。

注意事项

  • 仅限非商业用途:项目采用 Apache 2.0 + Commons Clause 许可,允许学习、研究和二次开发,但禁止商业使用
  • 遵守平台规则:自动操作可能违反部分 App 的服务条款,请在合法合规前提下使用。
  • 风险自担:所有操作由用户发起,项目开发者不承担由此产生的任何后果。

相关软件

EdgeBox 

EdgeBox  - 最新版

EdgeBox 是一个强大的桌面应用程序,它将 E2B (e2b.dev) 基于云的沙箱功能带到您的本地机器。基于开源的 E2B 代码解释器项目,EdgeBox 将沙箱转变为本地运行的环境,让您完全控制 AI 智能体的开发和执行环境。
LocalAI

LocalAI - 最新版

LocalAI 是一个功能强大、注重隐私的社区驱动 AI 平台,允许用户在本地运行多种 AI 模型。其与 OpenAI API 的兼容性、多任务支持以及近期在去中心化和多模态能力上的进步,使其成为开发者和创作者的理想选择。

暂无评论

none
暂无评论...