Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是,在保持与Claude Sonnet 4相当编码性能的同时,将成本压缩至前者的三分之一,速度提升超过两倍,为对延迟、成本敏感的AI应用场景提供了新选择。
- 系统卡:https://www.anthropic.com/claude-haiku-4-5-system-card
- 模型:https://www.anthropic.com/claude/haiku
- 文档:https://docs.claude.com/en/docs/about-claude/models/overview

核心性能:编码能力追平,部分场景反超
Claude Haiku 4.5的性能表现通过多项权威基准测试验证,核心数据可总结为“对标Sonnet 4,部分场景超越”。
1. 编码与工具使用性能
在衡量AI编码能力的SWE-Bench Verified测试中,Haiku 4.5平均得分73.3%;在聚焦命令行操作的Terminal-Bench测试中,得分41%。这两项成绩虽低于更新的Sonnet 4.5,但已与Sonnet 4、GPT-5、Gemini 2.5等主流模型持平,满足多数开发场景的编码需求。
2. 计算机使用能力突破
在支持GUI/浏览器操作的“计算机使用”任务中,Haiku 4.5表现更优——直接超越Sonnet 4,能显著提升Claude for Chrome插件、多代理协作项目的响应速度,尤其适合需要实时交互的自动化场景。
测试方法说明
为确保数据可信度,Anthropic公开了详细测试方法:
- SWE-Bench Verified:使用bash、文件编辑工具,50次试验,128K思考预算;
- Terminal-Bench:基于Terminus-2代理,11次运行(含6次无思考、5次32K思考预算);
- OSWorld-Verified:100步最大限制,4次运行,128K总思考预算。
用户可根据自身工具栈、编排逻辑复现测试,验证模型适配性。


定位与场景:瞄准低延迟、高性价比需求
Anthropic对Haiku 4.5的定位非常清晰——不追求“全能顶尖”,而是成为“成本敏感型场景的最优解”,核心适配三类场景:
1. 实时交互场景
包括AI实时助手、客户支持自动化系统等,这类场景对延迟要求严格,Haiku 4.5的高速度能避免用户等待,提升交互流畅度。
2. 开发协作场景
在结对编程、快速原型设计中,Haiku 4.5可作为Claude Code的“轻量搭档”,快速响应代码生成、调试需求,降低多代理协作的服务器负载。
3. 协同部署场景
Anthropic推荐“Sonnet 4.5+Haiku 4.5”的组合模式:由Sonnet 4.5负责复杂的多步骤规划(如大型项目架构设计),Haiku 4.5通过工作线程池并行执行具体任务(如代码片段生成、文件编辑),实现“规划-执行”分离,兼顾效率与成本。
可用性与定价:多平台覆盖,成本透明
Haiku 4.5从发布首日起就开放全面使用,开发者可通过多种渠道快速接入,定价模式也清晰明确。
1. 接入渠道
- 官方API:直接通过Anthropic API调用,模型标识符为“claude-haiku-4-5”;
- 云平台:同步在Amazon Bedrock、Google Cloud Vertex AI上线,后续将根据区域需求更新覆盖范围;
- 免费计划:所有Anthropic免费用户可直接使用,适合个人开发者测试、轻量应用开发。
2. 详细定价
按token计费,成本远低于同类模型,具体标准如下:
| 服务类型 | 定价(每百万token) |
|---|---|
| 输入内容 | 100美元 |
| 输出内容 | 500美元 |
| 提示缓存(写入) | 125美元 |
| 提示缓存(读取) | 10美元 |
| Anthropic明确表示,Haiku 4.5可作为Haiku 3.5、Sonnet 4的“即插即用替代品”,无需修改架构即可替换,降低迁移成本。 |
战略意义:完善模型矩阵,降低企业部署门槛
Haiku 4.5的发布,是Anthropic对自身AI模型矩阵的重要补充,背后有两层关键战略考量:
1. 填补“性价比”空白
此前Anthropic的模型矩阵中,Opus 4.1主打顶尖性能、Sonnet 4.5聚焦编码前沿,而Haiku系列则瞄准轻量场景。Haiku 4.5通过“性能升级+成本下降”,进一步填补了“中高性能+低价格”的市场空白,让中小企业、个人开发者也能负担高质量AI服务。
2. 降低企业部署阻力
一方面,Haiku 4.5基于ASL-2协议发布,开源兼容性更强;另一方面,其测试中显示出比Sonnet 4.5、Opus 4.1更低的“错位率”(即输出与需求偏离的概率),在安全门槛高的金融、医疗等领域,能减少合规风险。
正如Anthropic首席产品官Mike Krieger所说:“我们正在为用户提供完整的代理工具箱,每个模型都针对工作的不同部分,具备智力、速度和成本的最佳组合。”而Zencoder首席执行官Andrew Filev也评价,Haiku 4.5“开启了全新用例集合”,尤其将推动低延迟AI工具的普及。
发布节奏:延续高频更新,强化产品竞争力
Haiku 4.5的发布,延续了Anthropic近期密集的产品更新节奏:
- 2025年X月(距本次发布两周前):推出Sonnet 4.5,定位“全球最佳编码模型”;
- 2025年X月(距本次发布两个月前):更新Opus 4.1,强化顶尖性能;
- 2024年10月:上一版Haiku模型发布。
高频更新不仅让产品性能持续迭代,也帮助Anthropic在竞争激烈的AI市场中,通过“全价位、全场景”的模型矩阵,巩固自身竞争力。















