OpenAI 发布 GPT-5.3-Codex：速度提升 25%，创下编码基准测试新纪录

早报2个月前更新小马良

21 0

今日，OpenAI 宣布推出 GPT-5.3-Codex，这是其迄今为止最强大的智能体编码模型。公司表示，该模型在 SWE-bench Pro 和 Terminal-Bench 上取得了创纪录的分数。除了编码性能提升，OpenAI 还宣称 GPT-5.3-Codex 比 GPT-5.2-Codex 快 25%。

OpenAI 发布 GPT-5.3-Codex：速度提升 25%，创下编码基准测试新纪录

OpenAI 的 Codex 系列模型主要面向开发者。在 SWE-bench Pro 基准测试上，GPT-5.3-Codex 得分为 56.8%（相比之下，GPT-5.2-Codex 为 56.4%，GPT-5.2 为 55.6%）。在 Terminal-Bench 2.0 上，其得分为 77.3%（相比之下，GPT-5.2-Codex 为 64.0%，GPT-5.2 为 62.2%）。在 OSWorld-Verified 智能体计算机使用基准测试中，该模型得分为 64.7%（相比之下，GPT-5.2-Codex 为 38.2%，GPT-5.2 为 37.9%）。

OpenAI 还表示，GPT-5.3-Codex 在取得这些结果的同时，使用的令牌数量比之前的 Codex 模型更少。得益于推理堆栈的改进，公司宣称该模型为 Codex 用户提供了 25% 的速度提升。

OpenAI 还将 GPT-5.3-Codex 定位为开发者更好的协作者。公司表示，在模型处理任务时，用户可以“引导和互动”，而“不会丢失上下文”。在 Codex 应用中，GPT-5.3-Codex 在工作时会提供频繁的进度更新，使开发者能够实时提问、讨论方法并引导其达成期望的解决方案。

OpenAI 补充道，GPT-5.3-Codex 的早期版本表现足够出色，以至于公司曾使用它们来改进训练并支持后续模型版本的部署。

OpenAI 在公告博客文章中关于 Codex 写道：

最初专注于成为最佳编码智能体的目标，如今已成为计算机上更通用协作者的基础，既扩展了可以使用 Codex 的人群，也拓展了使用 Codex 的可能性边界。

GPT-5.3-Codex 现已面向所有 ChatGPT 付费计划 用户开放。用户可通过 Codex 应用、命令行界面、IDE 扩展以及网页端访问。OpenAI 还表示，该模型将通过 API 很快提供。

最后，OpenAI 指出，GPT-5.3-Codex 是与英伟达 GB200 NVL72 系统共同设计、训练并部署于其上的。

早报 # GPT-5.3-Codex # OpenAI

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

谷歌联手印度信实集团，向 Jio 用户免费提供 18 个月 AI Pro 服务

谷歌联手印度信实集团，向 Jio 用户免费提供 18 个月 AI Pro 服务

早报 # Jio # 信实集团 # 谷歌

5个月前

0250

马斯克重组xAI：一半联合创始人离开，我们只是在不同阶段需要不同的人

马斯克重组xAI：一半联合创始人离开，我们只是在不同阶段需要不同的人

早报 # xAI # 马斯克

2个月前

0120

微软测试 Edge 与 Copilot 深度集成：AI 将能使用你的浏览器个人资料

微软测试 Edge 与 Copilot 深度集成：AI 将能使用你的浏览器个人资料

早报 # Copilot # Edge # 微软

6个月前

0670

阿里发布全模态可控视频生成模型Wan2.7-Video：不仅是生成器，更是你的“AI 导演套件”

阿里发布全模态可控视频生成模型Wan2.7-Video：不仅是生成器，更是你的“AI 导演套件”

早报视频模型 # Wan2.7-Video # 阿里巴巴

5天前

0220

暂无评论

none

暂无评论...