GELab-Zero

4天前发布 46 00

阶跃星辰正式开源 GELab-Zero —— 一套面向 Android 设备的 本地化 GUI 智能体(GUI Agent)解决方案,包含 4B 参数预训练模型 与 即插即用的推理工程框架,支持在消费级硬件上完成复杂移动端任务,无需云端依赖。

所在地:
中国
收录时间:
2025-12-03
GELab-ZeroGELab-Zero

阶跃星辰开源的 GELab - Zero 是一款突破性的本地可部署手机GUI智能体,它凭借4B小模型搭配全套推理框架的轻量化组合,解决了移动端GUI Agent落地时的诸多工程难题,在生活化场景的任务执行上表现远超多款主流模型。目前开发者和企业用户可通过GitHub与HuggingFace平台获取并体验该智能体。

GELab-Zero

核心性能:小模型跑出超高性能

  • 测试成绩亮眼:在阶跃星辰自建的AndroidDaily基准测试静态测试中,GELab - Zero - 4B - preview面对3146个动作任务,准确率达到73.4%。这一成绩碾压众多知名模型,是GPT - 4o准确率的3.7倍,较UI - TARS - 1.5高出26.4%,同时也超越了GUI - Owl - 32B等参数量更大的模型。而且它在ScreenSpot、OSWorld等多个权威开源基准测试中,也拿下同尺寸模型的SOTA(最先进水平)成绩。
  • 复杂任务轻松胜任:该智能体能够精准执行各类移动端复杂指令,比如在饿了么完成多商品采购、在福利平台领取餐补、在淘宝搜索37码帆布鞋并收藏等。像点外卖、打车、报销、抢券这类用户日常高频需求,也能通过一句话指令完成。甚至面对“找经典电影”“推荐遛娃地点”这类模糊主观的需求,它也能自主判断执行标准并顺利完成任务。
GELab-Zero

核心能力:兼顾易用性与扩展性

  • 本地部署且无云端依赖:作为轻量级智能体,它支持4B规模模型在消费级硬件上运行,既保证了低延迟,又能避免数据上传云端,充分保障隐私安全。同时其提供类似开源GUI Agent MCP的一键启动体验,能自动处理环境依赖和设备管理,无需开发者耗费大量精力处理复杂的工程基建。
  • 多设备协同与轨迹追溯:具备多设备ADB自动连接能力,可将任务分发到多台手机,同时还能完整记录交互轨迹,方便开发者和用户观测任务执行过程,也能实现任务流程的复现,便于问题排查与方案优化。
  • 丰富的Agent运行模式:覆盖ReAct闭环、多Agent协作、定时任务等多种工作模式,能灵活适配不同场景下的任务需求。比如多Agent协作可应对跨App的复杂流程,定时任务则能满足抢票、定时领券等时效性需求。
GELab-Zero

配套基准测试:AndroidDaily贴合日常场景

为了更精准评估GUI Agent的实用价值,阶跃星辰打造了贴近日常生活的AndroidDaily基准测试,聚焦食、行、购、住、讯、娱六大核心维度,选取主流生活服务类应用设计测试任务,更符合用户真实使用场景。该测试包含两种模式:

测试模式核心内容评估目标
静态测试包含3146个动作,涵盖点击、文本输入、滑动等7类操作,提供任务描述和步骤截图,要求Agent预测动作类型和动作值评估Agent动作执行的数值准确性,无需复杂基建,可低成本实现大规模模型迭代测试
端到端基准测试包含235个任务,涵盖出行、购物、社交通讯等多个场景,在真机或模拟器中让Agent自主完成完整任务以任务成功率为指标,真实反映Agent在复杂环境中的综合实战能力

适用人群:覆盖开发者与企业用户

  • 面向开发者:GELab - Zero提供的完整推理工程基础设施,能帮开发者省去多设备连接、权限配置、推理服务部署等繁琐的基建工作,让他们可以专注于新想法、新策略的快速测试和交互方案的验证。
  • 面向企业用户:无需从零搭建系统,可直接复用这套基建,快速将MCP能力集成到自身产品业务中,大幅降低移动端AI智能交互功能的开发与落地成本,适配各类生活服务、电商等相关业务场景。

数据统计

相关导航

暂无评论

none
暂无评论...