Helix 升级:Figure 推动人形机器人迈向“类人分拣”新高度

早报6个月前发布 小马良
267 0

美国明星机器人公司 Figure发布了一段长达 60 分钟的无删减视频中展示了其旗舰产品 Figure 2 人形机器人 在真实物流环境(快递分拣)中持续工作的能力。

Figure 2 搭载的是Figure自己训练的新一代通用视觉-语言-动作(VLA)神经网络模型——Helix,这段视频没有任何人为干预,也未使用传统硬编码控制逻辑,完全依赖训练所得的Helix进行自主决策与操作。

如今,Helix 已能处理更复杂、更多样的包裹类型,在速度和准确性方面持续提升,接近人类操作员水平,标志着基于学习的机器人方法正在从实验室走向现实世界。

Helix 是什么?它为何重要?

Helix 是 Figure 自主研发的统一神经网络系统,集成了:

  • 视觉感知
  • 语言理解
  • 动作控制

这套系统不依赖传统硬编码逻辑,而是通过大规模演示数据训练出一个具备触觉反馈短期记忆能力自适应行为的智能体。

它的核心目标是:让机器人像人一样观察、思考并执行复杂的物理任务,特别是在高度变化的物流环境中。

三大核心性能提升

✅ 更广泛的包裹处理能力

除了传统的刚性盒子,Helix 现已能够灵活应对多种新型包裹,包括:

  • 聚乙烯袋(PE 袋)
  • 加垫信封
  • 平信封
  • 易变形或起皱的软质包装

它会根据包裹形态动态调整抓取策略,例如:

  • 对塑料袋进行轻拍以消除褶皱
  • 对平信封采用捏握方式精准定位条码

这种灵活性使得 Helix 能够在面对多样化物流场景时保持高效作业。

✅ 处理速度大幅提升

尽管包裹种类更加多样,Helix 的平均处理时间仍从 5.0 秒/件 缩短至 4.05 秒/件,整体效率提升约 20%

这意味着:

Helix 已经在单位时间内实现了更高的吞吐量,并且仍在持续进化。

✅ 条形码扫描成功率显著提高

通过增强视觉识别与动作控制协同能力,Helix 将条形码扫描的成功率从 70% 提升至约 95%

其中一大亮点是:机器人学会了“拍平包裹”这一精细动作,用于消除标签区域的褶皱,从而提升扫描效果。这种行为并非编程所得,而是通过大量人类演示自主学习而来。

架构层面的技术演进

这些性能飞跃的背后,是 Helix 模型在多个关键维度上的深度优化。

🧠 视觉记忆模块:赋予状态感知能力

Helix 不再仅依赖当前帧图像,而是引入了视觉记忆机制,可以从最近的视频帧中提取特征,形成对环境的连续认知。

这使得机器人可以:

  • 记录已检查过的包裹面
  • 回忆之前视角下的条形码位置
  • 避免重复查看同一面,减少冗余动作

视觉记忆极大提升了多步骤任务的连贯性和成功率。

⏳ 状态历史输入:增强时间上下文感知

除了视觉信息,Helix 还整合了机器人本体状态的历史记录,包括手臂、躯干和头部的位置变化。

这让策略具备更强的时间连续性,即使频繁重新规划路径,也不会丢失任务上下文。在面对突发干扰(如包裹滑动)时,Helix 可以更快做出反应并修正动作。

🤖 力反馈集成:引入触觉感知

Figure 2 机器人现在能够感知与物体接触时的力反馈,并将其作为策略输入的一部分。

这项改进带来了多项优势:

  • 准确判断首次接触时刻
  • 调整施力以避免压坏包裹
  • 实现更稳定的抓取与放置动作

这种“触觉闭环”机制,使 Helix 在处理不同材质、重量和形状的包裹时更具鲁棒性。

数据扩展 + 架构优化 = 性能跃迁

为了验证这些改进的实际影响,团队进行了系统的消融实验和数据扩展分析。

数据扩展的影响

随着训练数据从 10 小时增加到 60 小时:

指标10 小时60 小时
包裹处理时间6.84 秒4.31 秒
条形码成功率88.2%94.4%

这表明:Helix 仍在处于数据驱动的学习红利期,未来仍有巨大提升空间。

架构改进的贡献

通过对不同模块的组合测试,团队确认了各功能组件的具体贡献:

模块改善方向
视觉记忆消除冗余动作,提升成功率
状态历史增强时间连续性,加快响应
力反馈提高抓取稳定性与动作一致性

最终,结合视觉记忆 + 状态历史 + 力反馈 + 网络容量扩展,Helix 达到了目前最佳表现:平均每包裹处理时间 4.05 秒,准确率稳定在 92% 以上

从物流迈向通用交互:Helix 的泛化潜力

除了物流分拣任务,Helix 还展现出强大的泛化能力。

例如,通过少量新增演示片段,Helix 学会了识别人类伸手交接的动作信号,并据此作出正确的递送行为——无需额外编程,仅依靠已有模型权重即可完成新任务。

这说明:

Helix 正在逐步成为一个通用的视觉-动作控制器,具备跨任务迁移的能力

从演示中学习,向人类靠拢

Helix 的最新进展再次证明了基于学习的机器人方法的巨大潜力。通过高质量演示数据和持续的架构优化,Figure 正在构建一个能够在真实世界中自主决策、灵活操作的人形机器人系统。

未来,Helix 将继续扩展技能边界,挑战更高密度的工作负载,并进一步缩小“AI 控制机器人”与“人类操作员”之间的差距。

© 版权声明

相关文章

暂无评论

none
暂无评论...