GELab-Zero

4个月前发布 284 00

阶跃星辰正式开源 GELab-Zero —— 一套面向 Android 设备的本地化 GUI 智能体（GUI Agent）解决方案，包含 4B 参数预训练模型与即插即用的推理工程框架，支持在消费级硬件上完成复杂移动端任务，无需云端依赖。

所在地：

中国

收录时间：

2025-12-03

其他站点:

GitHub Hugging Face 魔塔

打开网站手机查看

智能体 # GELab-Zero # 阶跃星辰

GELab-Zero

打开网站

阶跃星辰开源的 GELab - Zero 是一款突破性的本地可部署手机GUI智能体，它凭借4B小模型搭配全套推理框架的轻量化组合，解决了移动端GUI Agent落地时的诸多工程难题，在生活化场景的任务执行上表现远超多款主流模型。目前开发者和企业用户可通过GitHub与HuggingFace平台获取并体验该智能体。

核心性能：小模型跑出超高性能

测试成绩亮眼：在阶跃星辰自建的AndroidDaily基准测试静态测试中，GELab - Zero - 4B - preview面对3146个动作任务，准确率达到73.4%。这一成绩碾压众多知名模型，是GPT - 4o准确率的3.7倍，较UI - TARS - 1.5高出26.4%，同时也超越了GUI - Owl - 32B等参数量更大的模型。而且它在ScreenSpot、OSWorld等多个权威开源基准测试中，也拿下同尺寸模型的SOTA（最先进水平）成绩。
复杂任务轻松胜任：该智能体能够精准执行各类移动端复杂指令，比如在饿了么完成多商品采购、在福利平台领取餐补、在淘宝搜索37码帆布鞋并收藏等。像点外卖、打车、报销、抢券这类用户日常高频需求，也能通过一句话指令完成。甚至面对“找经典电影”“推荐遛娃地点”这类模糊主观的需求，它也能自主判断执行标准并顺利完成任务。

核心能力：兼顾易用性与扩展性

本地部署且无云端依赖：作为轻量级智能体，它支持4B规模模型在消费级硬件上运行，既保证了低延迟，又能避免数据上传云端，充分保障隐私安全。同时其提供类似开源GUI Agent MCP的一键启动体验，能自动处理环境依赖和设备管理，无需开发者耗费大量精力处理复杂的工程基建。
多设备协同与轨迹追溯：具备多设备ADB自动连接能力，可将任务分发到多台手机，同时还能完整记录交互轨迹，方便开发者和用户观测任务执行过程，也能实现任务流程的复现，便于问题排查与方案优化。
丰富的Agent运行模式：覆盖ReAct闭环、多Agent协作、定时任务等多种工作模式，能灵活适配不同场景下的任务需求。比如多Agent协作可应对跨App的复杂流程，定时任务则能满足抢票、定时领券等时效性需求。

配套基准测试：AndroidDaily贴合日常场景

为了更精准评估GUI Agent的实用价值，阶跃星辰打造了贴近日常生活的AndroidDaily基准测试，聚焦食、行、购、住、讯、娱六大核心维度，选取主流生活服务类应用设计测试任务，更符合用户真实使用场景。该测试包含两种模式：

测试模式	核心内容	评估目标
静态测试	包含3146个动作，涵盖点击、文本输入、滑动等7类操作，提供任务描述和步骤截图，要求Agent预测动作类型和动作值	评估Agent动作执行的数值准确性，无需复杂基建，可低成本实现大规模模型迭代测试
端到端基准测试	包含235个任务，涵盖出行、购物、社交通讯等多个场景，在真机或模拟器中让Agent自主完成完整任务	以任务成功率为指标，真实反映Agent在复杂环境中的综合实战能力

适用人群：覆盖开发者与企业用户

面向开发者：GELab - Zero提供的完整推理工程基础设施，能帮开发者省去多设备连接、权限配置、推理服务部署等繁琐的基建工作，让他们可以专注于新想法、新策略的快速测试和交互方案的验证。
面向企业用户：无需从零搭建系统，可直接复用这套基建，快速将MCP能力集成到自身产品业务中，大幅降低移动端AI智能交互功能的开发与落地成本，适配各类生活服务、电商等相关业务场景。

数据统计

暂无评论

暂无评论...

GELab-Zero

核心性能：小模型跑出超高性能

核心能力：兼顾易用性与扩展性

配套基准测试：AndroidDaily贴合日常场景

适用人群：覆盖开发者与企业用户

数据统计

相关导航

Enterprise Deep Research

SmallClaw

Agnes

Kimi Claw

旅途星辰 (TripStar)

Context

心响

Claude Scholar

暂无评论

网址

S.H.I.T

waoo

Joker of Academics（小丑学术期刊）

新Flova

ITELLOU

Impeccable

S.H.I.T

waoo

Joker of Academics（小丑学术期刊）

新Flova

ITELLOU

Impeccable

GELab-Zero

核心性能：小模型跑出超高性能

核心能力：兼顾易用性与扩展性

配套基准测试：AndroidDaily贴合日常场景

适用人群：覆盖开发者与企业用户

数据统计

相关导航

Enterprise Deep Research

SmallClaw

Agnes

Kimi Claw

旅途星辰 (TripStar)

Context

心响

Claude Scholar

暂无评论

网址

S.H.I.T

waoo

Joker of Academics（小丑学术期刊 ）

新Flova

ITELLOU

Impeccable

标签云

网址

S.H.I.T

waoo

Joker of Academics（小丑学术期刊 ）

新Flova

ITELLOU

Impeccable

Joker of Academics（小丑学术期刊）

Joker of Academics（小丑学术期刊）