Action Agent

4个月前发布 217 00

Writer 的 Action Agent 是一款自主的“超级智能体”,旨在执行跨多个软件平台的复杂多步骤业务任务,标志着企业 AI 领域的重要进步。Action Agent 由 Writer 的 Palmyra X5 模型提供支持,超越了传统的 AI 聊天机器人,提供从任务规划到执行的全程自动化。

所在地:
美国
收录时间:
2025-08-04
Action AgentAction Agent

在 AI 从“辅助问答”迈向“自主执行”的关键转折点,企业 AI 公司 Writer 正式发布 Action Agent——一个能独立完成复杂多步骤任务的自主代理。

这不仅是一次功能升级,更是对企业 AI 定位的根本性转变:从“告诉我怎么做”,到“我来帮你做完”

该代理可在数百个软件平台间自主协调,浏览网页、分析数据、生成报告、编写代码,全程无需人工干预。其背后是 Writer 对企业级 AI 的深度思考:安全性、可审计性、可控性,比单纯的“智能”更重要

Action Agent

什么是 Action Agent?

Action Agent 并非传统意义上的聊天机器人,而是一个运行在独立虚拟环境中的自主执行系统。它被设计用于执行完整的业务流程,例如:

“分析过去三个月的客户评论,识别主要痛点,并为管理层生成一份带数据可视化的演示文稿。”

传统 AI 工具会列出步骤或提供草稿,而 Action Agent 会直接完成整个任务:抓取数据、执行情感分析、生成 PPT 并保存至指定位置。

这种能力源于 Writer 所称的“第四级编排(Level 4 Orchestration)”——当前企业 AI 自动化的最高层级。

编排等级能力
Level 1回答问题、检索文档
Level 2执行简单自动化(如填写表单)
Level 3多步骤任务协调
Level 4自主决策、调用子代理、即时生成工具、全程可追溯

Action Agent 是目前少数达到 Level 4 的系统之一。

Action Agent

技术实力:在关键基准上超越 OpenAI

Writer 的声明得到了权威基准测试的支持。

📊 GAIA Level 3 测试

  • 得分:61%
  • 超过 OpenAI 的 Deep Research 等竞争系统
  • GAIA Level 3 要求代理:
    • 跨多个工具和数据源操作
    • 综合信息并做出推理
    • 完成复杂、开放式的多步骤任务

🖥️ CUB(Computer Use Benchmark)

  • 得分:10.4%
  • 在浏览器与操作系统交互任务中位列顶尖
  • 证明其具备真实的“计算机使用”能力,而非仅文本生成

这些成绩的背后是 Writer 的 Palmyra X5 模型,其拥有百万级上下文窗口,可同时处理数百页文档、完整代码库或大型数据集,始终保持任务连贯性。

企业级安全:与消费者 AI 的根本区别

ChatGPT、Copilot 等面向消费者的工具不同,Action Agent 从设计之初就聚焦企业需求。

🔐 核心安全特性

特性说明
完整审计追踪每一步操作均有记录,可追溯代理如何得出结论
精细化权限控制管理员可为每个代理设置具体权限(如:允许在 Slack 发消息,禁止删除)
虚拟隔离环境每个会话运行在独立沙箱中,防止横向渗透
数据不出域支持私有化部署,敏感数据无需上传云端

“在银行、制药或医疗行业,不透明的‘黑箱’AI 是不可接受的。”Writer 产品负责人 Matan-Paul Shetrit 强调。

Action Agent

连接 600+ 工具,用 MCP 实现企业级集成

Action Agent 已预集成超过 600 个企业工具,覆盖 CRM、ERP、代码仓库、设计平台、财务系统等。

其集成基于 模型上下文协议(MCP)——一个新兴的 AI 工具互联标准。但 Writer 并未止步于此,而是通过以下方式将其提升至企业级:

  • 按代理授权:权限不仅基于用户,还可精确到具体代理
  • 动态策略控制:IT 管理员可设置数据访问策略与操作白名单
  • 与 AWS 等合作:共同推动 MCP 成为企业标准

“MCP 还需要努力才能达到企业级。”Shetrit 指出,“我们正在填补这一空白。”

免费提供:挑战传统软件定价模式

一个令人意外的决定是:Action Agent 将向现有客户免费提供

这在高计算成本的 AI 时代显得尤为激进。但 Writer 的逻辑清晰:

“企业需要可预测的预算。基于 token 的计费模式对大型组织来说风险过高。”

这一策略的背后是 Writer 在模型训练上的成本效率优势

  • Palmyra X4 模型训练成本仅 70 万美元
  • 相比之下,OpenAI 同等规模模型估算成本达 460 万美元
  • 差距源于合成数据与创新训练方法

“我们认为,这展示了平台的全部价值。”Shetrit 表示,“我们正在兑现 AI 的承诺。”

与 Uber 合作:在真实场景中打磨代理

Writer 与 Uber 的合作是其“真实世界验证”策略的典范。

Uber 的 AI 团队为其提供了:

  • 跨复杂系统的高质量数据标注经验
  • 对代理在生产环境中的表现验证

Uber AI 解决方案负责人 Megha Yethadka 表示:

“我们的合作帮助塑造了一个能应对最复杂企业挑战的代理。”

这种伙伴关系确保 Action Agent 解决的是真实业务问题,而非理论用例。

适用场景:从优化到创造

Shetrit 将企业 AI 用例分为两类:

类型示例
90% 工作流 + 10% AI自动化现有流程(如周报生成)
90% AI + 10% 工作流开启全新能力(如自动筛选候选人、临床试验选址)

后者才是 Action Agent 的真正潜力所在。

“能力不再是瓶颈。”Shetrit 分享了一个内部案例:

当产品经理说“没时间”时,他用 Action Agent 生成了 70% 的工作成果。

这标志着组织从“稀缺心态”向“充裕心态”的转变。

数据统计

相关导航

暂无评论

none
暂无评论...