
Wasm-Agents
由 Mozilla AI 推出的 Wasm-Agents Blueprint,正在探索一种全新的 AI 代理部署方式 —— 在浏览器中直接运行 AI 代理,无需额外依赖或本地安装。
AgentDroid 是一个基于FastAPI的AI驱动移动设备自动化代理服务器,能够通过自然语言指令智能控制Android设备执行各种操作。项目采用双引擎架构设计,支持从简单的单智能体控制到复杂的多智能体协作任务。
AgentDroid 是一个基于 FastAPI 构建的开源服务器,旨在通过 自然语言指令 控制 Android 设备完成各类操作。它集成了视觉理解与语言模型能力,通过 ADB(Android Debug Bridge)实现对真实设备的底层控制,适用于自动化测试、电商操作、日常任务批量处理等场景。

项目采用 双引擎架构,兼顾轻量级快速响应与复杂任务的高可靠性执行,支持同步与异步调用,并提供了完整的 RESTful API 和 Docker 部署方案。
通过 ADB 与 Android 设备建立连接,支持点击、滑动、文本输入、应用启动等基础操作,并结合屏幕截图进行视觉感知,形成“观察–决策–执行”闭环。
后端可对接 OpenAI GPT-4V、Claude 3、阿里通义千问(Qwen)或本地部署的 vLLM 服务,支持视觉+语言联合推理,使模型能“看懂”界面并作出合理操作。
提供 /run-agent-v4-async 等异步接口,任务在后台运行,完成后可自动通知指定回调 URL,便于集成到工作流系统或 Web 应用中。
# 克隆项目
git clone https://github.com/sav7ng/AgentDroid.git
cd AgentDroid
# 安装依赖
pip install -r requirements.txt
# 确认设备连接
adb devices # 需显示授权设备
# 启动服务
python main.py
服务默认运行在 http://localhost:9777。
# 构建镜像
docker build -t agentdroid .
# 运行容器(需挂载 USB 总线以访问设备)
docker run -p 9777:9777 -v /dev/bus/usb:/dev/bus/usb --privileged agentdroid
| 领域 | 应用示例 |
|---|---|
| 电商自动化 | 商品搜索比价、自动下单、订单状态追踪 |
| 社交媒体 | 自动发布内容、批量回复消息、互动数据采集 |
| 应用测试 | UI 自动化测试、功能回归验证、性能监控 |
| 个人效率 | 定时提醒、文件整理、系统设置批量配置 |
项目大量借鉴了阿里巴巴 MobileAgent 的设计理念,并在其基础上扩展了 Web 服务、异步任务、回调机制和部署灵活性。代码遵循 MIT 开源协议,欢迎贡献与二次开发。







