Holo Company 发布 Holo3:开源企业级计算机使用模型新标杆

Holo Company 正式推出 Holo3,一款专为企业自动化设计的尖端计算机使用模型(Computer Use Model)。该模型在权威的 OSWorld-Verified 基准测试中取得了 78.85% 的惊人分数,刷新了行业纪录,超越了包括 GPT-5.4 和 Claude Opus 4.6 在内的众多更大规模专有模型。

  • 模型:https://huggingface.co/Hcompany/Holo3-35B-A3B
  • API:https://hcompany.ai/holo-models-api

更令人振奋的是,Holo Company 宣布将 Holo3-35B-A3B 变体的权重在 Apache 2.0 许可下完全开源,并提供免费 API 层级,极大地降低了企业部署自主 AI 代理的门槛。

Holo Company 发布 Holo3:开源企业级计算机使用模型新标杆

核心亮点:更小、更强、更开放

1. SOTA 性能:78.85% OSWorld 得分

Holo3 在复杂的桌面操作任务中展现了卓越的感知与决策能力,能够精准执行多步骤、跨应用的企业工作流(如解析邮件、处理 PDF、操作 Excel 并发送报告)。其表现证明了专用训练策略比单纯堆砌参数更有效。

Holo Company 发布 Holo3:开源企业级计算机使用模型新标杆

2. 极致效率:MoE 架构

  • 总参数量:122B (1220 亿)
  • 激活参数量:仅 10B (100 亿)
  • 优势:采用混合专家(MoE)架构,Holo3 在推理时仅激活少量参数,使其运行成本仅为同类大模型的一小部分,同时保持了顶级的智能水平。这使得它在资源受限的企业环境中也能轻松部署。

3. 完全开源与免费 API

  • 开源权重Holo3-35B-A3B 版本已在 Hugging Face 上线,遵循宽松的 Apache 2.0 协议,允许商业自由使用、修改和分发。
  • 免费 API:Holo Company 提供带有免费层级的推理 API,让开发者可以零成本开始构建和测试自动化应用。

核心技术:代理学习飞轮 (Agent Learning Flywheel)

Holo3 的强大并非偶然,而是源于其独特的持续训练闭环——代理学习飞轮。该方法专注于提升模型的两大核心支柱:感知(Perception) 和 决策(Decision Making)

训练三大支柱:

  1. 合成导航数据 (Synthetic Navigation Data)
    • 利用人类指令和生成式 AI,创建海量特定场景的 UI 导航示例,覆盖各种软件界面。
  2. 域外增强 (Out-of-Distribution Augmentation)
    • 通过编程方式随机扩展场景、改变 UI 布局、引入意外干扰,确保模型具备极强的泛化能力,能处理从未见过的界面变化。
  3. 精选强化学习 (Curated Reinforcement Learning)
    • 对每个数据样本进行严格过滤,并利用高级强化学习算法优化决策路径,最大化任务成功率。

验证体系:从合成工厂到真实基准

为了证明 Holo3 不仅会“做题”,更能“干活”,Holo Company 构建了严苛的验证体系:

1. 合成环境工厂 (Synthetic Environment Factory)

这是一个专有的自动化系统,能根据场景规范从头编程生成真实的网站和企业软件界面

  • 作用:产生无限多样的训练环境,模拟真实世界的复杂性和不确定性。
  • 结果:确保 Holo3 不是在死记硬背,而是真正学会了“如何操作软件”。

2. H Corporate 基准

包含 486 个 真实世界多步骤任务的评估套件,涵盖四大类:

  • 电子商务
  • 商业软件 (ERP/CRM)
  • 协作工具
  • 多应用混合工作流

典型任务示例

“从 PDF 发票中提取设备价格,对照 Excel 中的员工预算表进行核对,若预算充足则自动发送批准邮件,否则发送拒绝邮件并抄送经理。”
这类任务要求模型具备跨应用的状态保持、逻辑推理和精准操作能力。

应用场景

Holo3 专为解决企业痛点而生:

  • 流程自动化 (RPA 2.0):替代传统僵硬的 RPA 脚本,自主处理非结构化数据和动态界面。
  • 数据整合与分析:自动跨邮件、文档、表格抓取数据,生成报表。
  • 智能客服与支持:自主操作后台系统查询订单、处理退款、更新状态。
  • IT 运维助手:自动执行系统巡检、日志分析、故障排查等复杂操作。
  • 财务与合规:自动审核单据、核对账目、生成合规报告。

未来展望:迈向通用自适应代理

Holo3 只是一个里程碑。Holo Company 的终极目标是构建通用自适应代理

  • 实时学习:未来的模型不仅能操作已知软件,还能在面对全新的、定制化的企业系统时,实时自主地学习其界面逻辑和操作方式。
  • 零样本适应:无需重新训练,即可无缝接入客户独有的数字生态。
© 版权声明

相关文章

暂无评论

none
暂无评论...