今天,Anthropic 宣布推出下一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4。这两个模型在编码、高级推理和 AI 代理方面设定了新的行业标准,为开发者和用户带来了更强大的工具和更高效的工作流程。
Claude 4:新一代模型介绍
Claude Opus 4:全球顶尖的编码模型
Claude Opus 4 是 Anthropic 迄今为止最强大的模型,也是全球最佳的编码模型。它在多个基准测试中表现出色,例如在 SWE-bench(72.5%)和 Terminal-bench(43.2%)上领先。Opus 4 在需要专注和数千步骤的长时间任务中展现出持续的高性能,能够连续工作数小时,显著扩展了 AI 代理的能力。

Claude 4模型在SWE-bench Verified上表现出色,SWE-bench Verified是衡量实际软件工程任务性能的基准。
关键特点
- 卓越的编码能力:Opus 4 在复杂代码库理解方面实现了飞跃,能够处理多文件复杂更改,显著提升精度。
- 长时间任务处理:在长时间任务中保持高性能,能够独立运行数小时,大幅超越所有 Sonnet 模型。
- 强大的推理能力:Opus 4 擅长解决其他模型无法应对的复杂挑战,成功处理之前模型遗漏的关键操作。
Claude Sonnet 4:卓越的性能与效率平衡
Claude Sonnet 4 是 Claude Sonnet 3.7 的重大升级,在 SWE-bench 上达到顶尖的 72.7%。该模型在内部和外部用例中平衡了性能和效率,增强了可控性以更好地控制实现方式。

Claude 4模型在编码、推理、多模态能力和代理任务方面表现出强劲的性能。
关键特点
- 性能与效率平衡:Sonnet 4 在大多数领域无法与 Opus 4 匹敌,但它提供了能力和实用性的最佳组合。
- 代理场景优化:Sonnet 4 在代理场景中表现出色,被 GitHub 选为 GitHub Copilot 新编码代理的基础模型。
- 改进的指令遵循:Sonnet 4 在遵循复杂指令、清晰推理和美观输出方面表现出色,显著降低了导航错误。
模型改进
扩展思维与工具使用
两种模型均可在扩展思维过程中使用工具(如网络搜索),使 Claude 能在推理和工具使用间切换,以提升响应质量。

记忆:当获得访问本地文件的权限时,Claude Opus 4会记录关键信息,以帮助改善其游戏体验。上图所示的笔记是Opus 4在玩《精灵宝可梦》时真实记录的笔记。
并行工具执行和记忆能力改进
- 并行工具执行:两种模型支持并行使用工具,显著提高了任务处理效率。
- 记忆能力改进:当开发者提供本地文件访问权限时,模型能够提取并保存关键信息,以保持连续性并随时间构建隐性知识。
减少捷径和漏洞利用
Anthropic 显著减少了模型利用捷径或漏洞完成任务的行为。在特别容易出现捷径和漏洞的代理任务中,两种模型的此类行为比 Sonnet 3.7 减少了 65%。
思维摘要功能
Anthropic 为 Claude 4 模型引入了思维摘要功能,使用较小的模型压缩冗长的思维过程。仅约 5% 的情况需要这种摘要,大多数思维过程足够简短可完整显示。
Claude Code:全面可用
Claude Code 现已全面可用,将 Claude 的能力融入更多开发工作流程。它支持通过 GitHub Actions 执行后台任务,并与 VS Code 和 JetBrains 原生集成,直接在您的文件中显示编辑内容,实现无缝的结对编程。
关键特点
- VS Code 和 JetBrains 集成:新的测试版扩展将 Claude Code 直接集成到您的 IDE 中,简化了在熟悉编辑器界面中的审查和跟踪。
- 可扩展的 Claude Code SDK:Anthropic 发布了可扩展的 Claude Code SDK,让您可以使用与 Claude Code 相同的核心代理构建自己的代理和应用。
- GitHub 集成:Claude Code on GitHub 现为测试版,支持在 PR 中标记 Claude Code 以响应审稿者反馈、修复 CI 错误或修改代码。
快速入门
定价与可用性
- 定价:Opus 4 为每百万 token 输入/输出 $15/$75,Sonnet 4 为 $3/$15。
- 可用性:两种模型均可在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用。
开始使用
这些模型是迈向虚拟协作伙伴的重要一步,能够保持完整上下文、在更长期项目中持续专注,并产生变革性影响。它们经过广泛测试和评估,以最小化风险并最大化安全性,包括实施更高 AI 安全级别(如 ASL-3)的措施。
Anthropic 期待看到您的创作。今天即可在 Claude、Claude Code 或您选择的平台上开始使用。















