Hugging Face 推出轻量级机器人AI模型SmolVLA:可在MacBook运行

多模态模型6个月前更新 小马良
302 0

随着AI与机器人技术的融合不断深入,构建个人机器人项目正变得前所未有的容易。近日,知名AI平台 Hugging Face 正式发布了其最新研发的机器人AI模型——SmolVLA,这一模型不仅小巧高效,还可在消费级硬件甚至 Mac 笔记本上运行,为个人开发者和研究者打开了新的可能性。

SmolVLA 是什么?

SmolVLA 是一个视觉-语言-动作(Vision-Language-Action, VLA)模型,专为推动通用机器人代理的发展而设计。它基于 Hugging Face 社区共享的“兼容许可”数据集训练,在虚拟和现实环境中均展现出优于更大模型的表现。

尽管参数规模仅为 4.5亿,但 SmolVLA 并不逊色于那些动辄数十亿甚至上百亿参数的竞争对手。它的出现标志着机器人AI模型开始向更轻量化、更易部署的方向演进。

 核心特性一览

特性描述
小巧高效参数规模仅 4.5 亿,可在单一消费级 GPU 上运行,甚至支持在 MacBook 等设备上部署。
多模态能力支持视觉、语言理解与动作控制一体化处理,适用于复杂任务场景。
异步推理栈可将机器人的动作处理与其感知(视觉、听觉)系统分离,提升在动态环境中的响应速度。
社区驱动基于 LeRobot 社区数据集训练,所有数据均由开源社区贡献,并遵循开放许可协议。

背后生态:LeRobot 与低成本机器人硬件

SmolVLA 的推出是 Hugging Face 构建完整机器人生态系统的重要一环。此前,该公司已推出 LeRobot,一个专注于机器人AI模型、工具和数据集的开源项目。此外,Hugging Face 还收购了法国机器人初创公司 Pollen Robotics,并推出了多款价格亲民的机器人平台,包括人形机器人,进一步降低了机器人开发门槛。

这意味着,无论是学生、独立开发者还是小型创业团队,都可以在较低成本下进行机器人研究和应用开发。

行业背景:开源机器人竞争升温

虽然 Hugging Face 在 SmolVLA 的发布中走在前列,但它并非唯一一位参与者:

  • NVIDIA 提供了一整套开源机器人开发工具,涵盖仿真、训练和部署全流程。
  • K-Scale Labs 正致力于打造“开源人形机器人”的核心组件。
  • Dyna Robotics、由杰夫·贝索斯支持的 Physical Intelligence  RLWRLD 等也在积极布局。

这表明,开源机器人领域正在迎来一波快速发展期,未来我们或将看到更多平民化、模块化的智能机器人产品进入家庭和小型企业。

© 版权声明

相关文章

暂无评论

none
暂无评论...