OpenAI 发布 GPT-5.3-Codex:速度提升 25%,创下编码基准测试新纪录

早报2小时前更新 小马良
4 0

今日,OpenAI 宣布推出 GPT-5.3-Codex,这是其迄今为止最强大的智能体编码模型。公司表示,该模型在 SWE-bench Pro 和 Terminal-Bench 上取得了创纪录的分数。除了编码性能提升,OpenAI 还宣称 GPT-5.3-Codex 比 GPT-5.2-Codex 快 25%。

OpenAI 发布 GPT-5.3-Codex:速度提升 25%,创下编码基准测试新纪录

OpenAI 的 Codex 系列模型主要面向开发者。在 SWE-bench Pro 基准测试上,GPT-5.3-Codex 得分为 56.8%(相比之下,GPT-5.2-Codex 为 56.4%,GPT-5.2 为 55.6%)。在 Terminal-Bench 2.0 上,其得分为 77.3%(相比之下,GPT-5.2-Codex 为 64.0%,GPT-5.2 为 62.2%)。在 OSWorld-Verified 智能体计算机使用基准测试中,该模型得分为 64.7%(相比之下,GPT-5.2-Codex 为 38.2%,GPT-5.2 为 37.9%)。

OpenAI 还表示,GPT-5.3-Codex 在取得这些结果的同时,使用的令牌数量比之前的 Codex 模型更少。得益于推理堆栈的改进,公司宣称该模型为 Codex 用户提供了 25% 的速度提升。

OpenAI 还将 GPT-5.3-Codex 定位为开发者更好的协作者。公司表示,在模型处理任务时,用户可以“引导和互动”,而“不会丢失上下文”。在 Codex 应用中,GPT-5.3-Codex 在工作时会提供频繁的进度更新,使开发者能够实时提问、讨论方法并引导其达成期望的解决方案。

OpenAI 补充道,GPT-5.3-Codex 的早期版本表现足够出色,以至于公司曾使用它们来改进训练并支持后续模型版本的部署。

OpenAI 在公告博客文章中关于 Codex 写道:

最初专注于成为最佳编码智能体的目标,如今已成为计算机上更通用协作者的基础,既扩展了可以使用 Codex 的人群,也拓展了使用 Codex 的可能性边界。

GPT-5.3-Codex 现已面向所有 ChatGPT 付费计划 用户开放。用户可通过 Codex 应用、命令行界面、IDE 扩展以及网页端访问。OpenAI 还表示,该模型将通过 API 很快提供。

最后,OpenAI 指出,GPT-5.3-Codex 是与英伟达 GB200 NVL72 系统共同设计、训练并部署于其上的。

© 版权声明

相关文章

暂无评论

none
暂无评论...