Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4

大语言模型2个月前发布 小马良
83 0

Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是,在保持与Claude Sonnet 4相当编码性能的同时,将成本压缩至前者的三分之一,速度提升超过两倍,为对延迟、成本敏感的AI应用场景提供了新选择。

Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4

核心性能:编码能力追平,部分场景反超

Claude Haiku 4.5的性能表现通过多项权威基准测试验证,核心数据可总结为“对标Sonnet 4,部分场景超越”。

1. 编码与工具使用性能

在衡量AI编码能力的SWE-Bench Verified测试中,Haiku 4.5平均得分73.3%;在聚焦命令行操作的Terminal-Bench测试中,得分41%。这两项成绩虽低于更新的Sonnet 4.5,但已与Sonnet 4、GPT-5、Gemini 2.5等主流模型持平,满足多数开发场景的编码需求。

2. 计算机使用能力突破

在支持GUI/浏览器操作的“计算机使用”任务中,Haiku 4.5表现更优——直接超越Sonnet 4,能显著提升Claude for Chrome插件、多代理协作项目的响应速度,尤其适合需要实时交互的自动化场景。

测试方法说明

为确保数据可信度,Anthropic公开了详细测试方法:

  • SWE-Bench Verified:使用bash、文件编辑工具,50次试验,128K思考预算;
  • Terminal-Bench:基于Terminus-2代理,11次运行(含6次无思考、5次32K思考预算);
  • OSWorld-Verified:100步最大限制,4次运行,128K总思考预算。
    用户可根据自身工具栈、编排逻辑复现测试,验证模型适配性。
Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4Anthropic发布Claude Haiku 4.5:三分之一成本+两倍速度,编码性能追平Sonnet 4

定位与场景:瞄准低延迟、高性价比需求

Anthropic对Haiku 4.5的定位非常清晰——不追求“全能顶尖”,而是成为“成本敏感型场景的最优解”,核心适配三类场景:

1. 实时交互场景

包括AI实时助手、客户支持自动化系统等,这类场景对延迟要求严格,Haiku 4.5的高速度能避免用户等待,提升交互流畅度。

2. 开发协作场景

在结对编程、快速原型设计中,Haiku 4.5可作为Claude Code的“轻量搭档”,快速响应代码生成、调试需求,降低多代理协作的服务器负载。

3. 协同部署场景

Anthropic推荐“Sonnet 4.5+Haiku 4.5”的组合模式:由Sonnet 4.5负责复杂的多步骤规划(如大型项目架构设计),Haiku 4.5通过工作线程池并行执行具体任务(如代码片段生成、文件编辑),实现“规划-执行”分离,兼顾效率与成本。

可用性与定价:多平台覆盖,成本透明

Haiku 4.5从发布首日起就开放全面使用,开发者可通过多种渠道快速接入,定价模式也清晰明确。

1. 接入渠道

  • 官方API:直接通过Anthropic API调用,模型标识符为“claude-haiku-4-5”;
  • 云平台:同步在Amazon Bedrock、Google Cloud Vertex AI上线,后续将根据区域需求更新覆盖范围;
  • 免费计划:所有Anthropic免费用户可直接使用,适合个人开发者测试、轻量应用开发。

2. 详细定价

按token计费,成本远低于同类模型,具体标准如下:

服务类型定价(每百万token)
输入内容100美元
输出内容500美元
提示缓存(写入)125美元
提示缓存(读取)10美元
Anthropic明确表示,Haiku 4.5可作为Haiku 3.5、Sonnet 4的“即插即用替代品”,无需修改架构即可替换,降低迁移成本。

战略意义:完善模型矩阵,降低企业部署门槛

Haiku 4.5的发布,是Anthropic对自身AI模型矩阵的重要补充,背后有两层关键战略考量:

1. 填补“性价比”空白

此前Anthropic的模型矩阵中,Opus 4.1主打顶尖性能、Sonnet 4.5聚焦编码前沿,而Haiku系列则瞄准轻量场景。Haiku 4.5通过“性能升级+成本下降”,进一步填补了“中高性能+低价格”的市场空白,让中小企业、个人开发者也能负担高质量AI服务。

2. 降低企业部署阻力

一方面,Haiku 4.5基于ASL-2协议发布,开源兼容性更强;另一方面,其测试中显示出比Sonnet 4.5、Opus 4.1更低的“错位率”(即输出与需求偏离的概率),在安全门槛高的金融、医疗等领域,能减少合规风险。

正如Anthropic首席产品官Mike Krieger所说:“我们正在为用户提供完整的代理工具箱,每个模型都针对工作的不同部分,具备智力、速度和成本的最佳组合。”而Zencoder首席执行官Andrew Filev也评价,Haiku 4.5“开启了全新用例集合”,尤其将推动低延迟AI工具的普及。

发布节奏:延续高频更新,强化产品竞争力

Haiku 4.5的发布,延续了Anthropic近期密集的产品更新节奏:

  • 2025年X月(距本次发布两周前):推出Sonnet 4.5,定位“全球最佳编码模型”;
  • 2025年X月(距本次发布两个月前):更新Opus 4.1,强化顶尖性能;
  • 2024年10月:上一版Haiku模型发布。
    高频更新不仅让产品性能持续迭代,也帮助Anthropic在竞争激烈的AI市场中,通过“全价位、全场景”的模型矩阵,巩固自身竞争力。
© 版权声明

相关文章

暂无评论

none
暂无评论...