过去一年,人形机器人在实验室环境中的“场景理解”与“任务规划”能力突飞猛进。然而,一旦进入真实的工业产线,它们便常常陷入“想得到但抓不准、算得出但跟不上”的困境。这背后,是长期存在的鸿沟:空间层面的度量失准与时间层面的响应迟滞。
为弥合这一鸿沟,优必选对其具身智能大模型 Thinker 进行了架构升级,并宣布将其全量开源。本次升级聚焦“小参数、高性能、全开源”三大核心,旨在打造一个能为工业人形机器人提供快速反应与精准空间感知的下一代智能大脑。

性能标杆:9项权威评测全球第一
当前,机器人领域的大模型普遍面临三大挑战:关键任务(如空间理解)精度不足、参数量过大导致实时性差、以及训练数据质量参差不齐。Thinker 正是为解决这些问题而生。
在近期一项涵盖10B参数以下具身智能模型的权威基准评测中,Thinker 一举斩获9项第一。该评测全面衡量了两大核心能力:
- 第一视角下的场景认知与任务规划。
- 支撑物理交互的精准感知与空间理解。
其竞争对手包括英伟达、字节跳动、北京智源等顶尖团队的最新模型,Thinker 的表现重新定义了轻量化具身智能模型的性能上限。

从20B到10M:高质量数据的“精炼提纯”之道
具身智能的竞争力根植于高质量数据,但行业普遍受困于原始数据噪声大、多模态对齐难、标注成本高等痛点。优必选构建了一套覆盖“精炼提纯 - 自动化标注 - 数据驱动训练”的全链路解决方案。
- 广度筛选:面对高达20B的原始多模态数据(视觉、语言、动作、环境),通过定制化规则快速过滤,筛选出约1%的高质量候选数据池。
- 深度评分:引入大模型作为多维度评分模块,从质量、任务、场景等角度进行精细评价,最终提炼出千万级(10M)的高价值训练数据。

人工参与率<1%:自动化标注闭环
为攻克标注难题,优必选搭建了“弱监督 + 自监督 + 少量人工校验”的自动化体系:
- 核心技术:采用“大模型辅助标注 + 多模型交叉验证”策略,实现端到端自动化标注。
- 高效校验:仅对低置信度样本进行人工复核,将人工参与率控制在1%以下,成本降低99%,效率提升超百倍。
- 动态迭代:建立“标注-训练-反馈-迭代”闭环,利用模型训练误差持续优化标注算法,使标注准确率稳步提升。

Data-centric 范式:小样本撬动强泛化
Thinker 的训练范式通过三个维度保障模型在复杂真实场景中的泛化能力:
- 样本多样性:10M高质量数据全面覆盖任务规划、视觉定位、空间理解、通用知识四大核心任务。
- 任务导向采样:针对“感知-决策-执行”闭环中的关键环节(如精细操作、模糊指令理解),进行动态采样,强化核心能力。
- L4级标注标准:从任务、功能、分类、模态四个维度进行精确划分,实现对训练数据配比的精准把控。
转动数据飞轮:从工厂到模型的双向进化
Thinker 的价值不仅在于模型本身,更在于其与真实场景的深度耦合。优必选已将其部署于工厂搬运、工件分拣等场景,并建立了双向数据回流机制:
- 回收真实数据:系统持续收集长尾案例(如料箱识别失败、抓取轨迹动态调整)。
- 反哺模型迭代:这些宝贵的真实世界数据被转化为训练资源,直接注入Thinker的迭代过程,驱动其基础性能与场景适应能力不断增强。
- 落地成果:基于Thinker大模型,优必选的Walker S2机器人在箱体搬运、工件分拣等任务中实现了 99.99% 的作业准确率。
为加速具身智能技术的普及,优必选秉持开源共享理念,全量开放Thinker的模型权重、训练工具链与应用案例。此举旨在降低行业技术门槛与成本,携手广大开发者与企业,共同推动人形机器人在工业智造、商用服务等千行百业的落地与进化。















