Anthropic发布Claude Haiku 4.5：三分之一成本+两倍速度，编码性能追平Sonnet 4

157 0

Anthropic正式推出轻量级模型Claude Haiku的最新版本——Claude Haiku 4.5。这款模型的核心亮点的是，在保持与Claude Sonnet 4相当编码性能的同时，将成本压缩至前者的三分之一，速度提升超过两倍，为对延迟、成本敏感的AI应用场景提供了新选择。

系统卡：https://www.anthropic.com/claude-haiku-4-5-system-card
模型：https://www.anthropic.com/claude/haiku
文档：https://docs.claude.com/en/docs/about-claude/models/overview

Anthropic发布Claude Haiku 4.5：三分之一成本+两倍速度，编码性能追平Sonnet 4

核心性能：编码能力追平，部分场景反超

Claude Haiku 4.5的性能表现通过多项权威基准测试验证，核心数据可总结为“对标Sonnet 4，部分场景超越”。

1. 编码与工具使用性能

在衡量AI编码能力的SWE-Bench Verified测试中，Haiku 4.5平均得分73.3%；在聚焦命令行操作的Terminal-Bench测试中，得分41%。这两项成绩虽低于更新的Sonnet 4.5，但已与Sonnet 4、GPT-5、Gemini 2.5等主流模型持平，满足多数开发场景的编码需求。

2. 计算机使用能力突破

在支持GUI/浏览器操作的“计算机使用”任务中，Haiku 4.5表现更优——直接超越Sonnet 4，能显著提升Claude for Chrome插件、多代理协作项目的响应速度，尤其适合需要实时交互的自动化场景。

测试方法说明

为确保数据可信度，Anthropic公开了详细测试方法：

SWE-Bench Verified：使用bash、文件编辑工具，50次试验，128K思考预算；
Terminal-Bench：基于Terminus-2代理，11次运行（含6次无思考、5次32K思考预算）；
OSWorld-Verified：100步最大限制，4次运行，128K总思考预算。
用户可根据自身工具栈、编排逻辑复现测试，验证模型适配性。

定位与场景：瞄准低延迟、高性价比需求

Anthropic对Haiku 4.5的定位非常清晰——不追求“全能顶尖”，而是成为“成本敏感型场景的最优解”，核心适配三类场景：

1. 实时交互场景

包括AI实时助手、客户支持自动化系统等，这类场景对延迟要求严格，Haiku 4.5的高速度能避免用户等待，提升交互流畅度。

2. 开发协作场景

在结对编程、快速原型设计中，Haiku 4.5可作为Claude Code的“轻量搭档”，快速响应代码生成、调试需求，降低多代理协作的服务器负载。

3. 协同部署场景

Anthropic推荐“Sonnet 4.5+Haiku 4.5”的组合模式：由Sonnet 4.5负责复杂的多步骤规划（如大型项目架构设计），Haiku 4.5通过工作线程池并行执行具体任务（如代码片段生成、文件编辑），实现“规划-执行”分离，兼顾效率与成本。

可用性与定价：多平台覆盖，成本透明

Haiku 4.5从发布首日起就开放全面使用，开发者可通过多种渠道快速接入，定价模式也清晰明确。

1. 接入渠道

官方API：直接通过Anthropic API调用，模型标识符为“claude-haiku-4-5”；
云平台：同步在Amazon Bedrock、Google Cloud Vertex AI上线，后续将根据区域需求更新覆盖范围；
免费计划：所有Anthropic免费用户可直接使用，适合个人开发者测试、轻量应用开发。

2. 详细定价

按token计费，成本远低于同类模型，具体标准如下：

服务类型	定价（每百万token）
输入内容	100美元
输出内容	500美元
提示缓存（写入）	125美元
提示缓存（读取）	10美元
Anthropic明确表示，Haiku 4.5可作为Haiku 3.5、Sonnet 4的“即插即用替代品”，无需修改架构即可替换，降低迁移成本。

战略意义：完善模型矩阵，降低企业部署门槛

Haiku 4.5的发布，是Anthropic对自身AI模型矩阵的重要补充，背后有两层关键战略考量：

1. 填补“性价比”空白

此前Anthropic的模型矩阵中，Opus 4.1主打顶尖性能、Sonnet 4.5聚焦编码前沿，而Haiku系列则瞄准轻量场景。Haiku 4.5通过“性能升级+成本下降”，进一步填补了“中高性能+低价格”的市场空白，让中小企业、个人开发者也能负担高质量AI服务。

2. 降低企业部署阻力

一方面，Haiku 4.5基于ASL-2协议发布，开源兼容性更强；另一方面，其测试中显示出比Sonnet 4.5、Opus 4.1更低的“错位率”（即输出与需求偏离的概率），在安全门槛高的金融、医疗等领域，能减少合规风险。

正如Anthropic首席产品官Mike Krieger所说：“我们正在为用户提供完整的代理工具箱，每个模型都针对工作的不同部分，具备智力、速度和成本的最佳组合。”而Zencoder首席执行官Andrew Filev也评价，Haiku 4.5“开启了全新用例集合”，尤其将推动低延迟AI工具的普及。

发布节奏：延续高频更新，强化产品竞争力

Haiku 4.5的发布，延续了Anthropic近期密集的产品更新节奏：

2025年X月（距本次发布两周前）：推出Sonnet 4.5，定位“全球最佳编码模型”；
2025年X月（距本次发布两个月前）：更新Opus 4.1，强化顶尖性能；
2024年10月：上一版Haiku模型发布。
高频更新不仅让产品性能持续迭代，也帮助Anthropic在竞争激烈的AI市场中，通过“全价位、全场景”的模型矩阵，巩固自身竞争力。