OpenAI于今天宣布,为旗下AI编程工具Codex推出基于GPT-5的新版本——GPT-5-Codex。这款专为软件工程场景优化的模型,以“动态调整思考时间”为核心突破,可根据编程任务复杂度灵活分配几秒到7小时的处理时长,同时在代码生成、重构、审查等全流程实现性能提升。目前,该版本已面向所有ChatGPT付费用户(Plus/Pro/Business/Edu/Enterprise)开放,后续还将推进API接入,进一步加码AI编程工具市场竞争。

核心突破:GPT-5-Codex的“动态思考”能力
不同于传统AI编程模型“固定资源分配”的模式,GPT-5-Codex的核心优势在于实时调整任务处理时间与计算资源——无需提前通过“路由器”预设资源分配方案,而是在任务执行中根据复杂度动态决策:简单的代码片段生成可能仅需几秒,而大规模代码重构、完整项目开发等复杂任务,可自主延长至7小时,通过多轮迭代优化、测试验证,确保最终输出质量。

这一设计直接体现在性能数据上:在衡量代理编程能力的“SWE-bench Verified”基准测试中,GPT-5-Codex不仅覆盖了全部500个任务(此前GPT-5因基础设施限制仅能运行477个),整体表现更超越前代模型;在“大型成熟仓库代码重构”测试中,该模型可独立完成类似“Gitea项目232个文件、3541行代码的ctx变量传递优化”这类高复杂度任务。

从资源效率来看,GPT-5-Codex还实现了“按需分配”的精细化管控:在OpenAI内部员工使用数据中,处理简单任务的用户轮次(按生成令牌数排序最低10%),其令牌消耗比GPT-5减少93.7%;而处理复杂任务的轮次(最高10%),则通过双倍时长的推理、编辑与测试,实现更优输出效果,兼顾“快速响应”与“深度处理”双重需求。

功能升级:覆盖编程全流程,聚焦软件工程场景
除核心的“动态思考”能力外,GPT-5-Codex还针对软件工程全场景进行优化,新增或强化了三大关键功能:
1. 代码审查:精准捕获关键缺陷,减少无效反馈
OpenAI专门为GPT-5-Codex训练了“代码审查能力”,使其可模拟资深工程师的审查逻辑:不仅能对比PR(拉取请求)的“声明意图”与“实际代码差异”,还能联动整个代码库的依赖关系,通过自动运行代码与测试用例验证功能正确性。
在基于热门开源仓库的评估中,经验丰富的软件工程师反馈:GPT-5-Codex的审查评论“错误率更低”,且能聚焦“高影响问题”(如安全漏洞、性能瓶颈、依赖项过时等),避免冗余反馈分散团队注意力。目前,该功能已在OpenAI内部落地,每天为数百个PR提前捕获问题,大幅减轻人工审查负担。
2. 多场景适配:从本地到云端,无缝衔接开发流程
为贴合开发者实际工作习惯,GPT-5-Codex实现了“全工具链适配”,覆盖终端、IDE、云端、GitHub等核心开发场景:
- 本地开发:通过Codex CLI(命令行工具)和IDE扩展(支持VS Code、Cursor等编辑器),可直接调用模型生成代码、优化逻辑,且能利用“打开文件”“选中代码”等上下文信息,减少提示词撰写成本;CLI还支持附加截图、线框图,辅助模型理解设计需求。
- 云端协作:Codex云环境通过“缓存容器”将任务启动时间缩短90%,还能自动扫描设置脚本、安装依赖(如自动执行pip install);开发者可在云端创建任务,通过IDE扩展实时跟踪进度,甚至让模型启动浏览器预览效果、生成截图反馈。
- GitHub集成:在GitHub仓库启用功能后,PR从草稿转为“就绪状态”时会自动触发审查,也可通过“@codex review”手动调用,支持定向审查(如“@codex review for security vulnerabilities”),审查后还能直接要求模型修改代码。

3. 视觉交互:支持图像输入输出,优化前端开发体验
GPT-5-Codex新增“视觉交互”能力:开发者可上传UI设计图、截图,模型能基于图像理解需求并生成对应代码;在云端开发时,模型还能自主启动浏览器,查看前端页面效果,迭代优化后生成截图反馈,大幅提升移动网站、桌面应用等视觉相关开发场景的效率。

市场背景:瞄准拥挤的AI编程赛道,强化竞争壁垒
此次升级,也是OpenAI在AI编程工具市场“巩固优势”的关键动作。过去一年,该赛道因“开发者效率需求激增”变得异常拥挤:Anysphere的Cursor在2025年初ARR(年度经常性收入)已突破5亿美元,成为现象级产品;另一款代码编辑器Windsurf虽因收购争议导致团队分裂(成员分别加入Google和Cognition),仍侧面反映市场热度;此外,Anthropic的Claude Code、微软的GitHub Copilot等竞品,也在持续迭代功能。

而GPT-5-Codex的推出,通过“动态思考时间”“全流程功能覆盖”“多工具链适配”三大差异化优势,进一步强化Codex的竞争力——相比聚焦“轻量编程辅助”的工具,它能处理更复杂的独立任务;相比侧重“单一场景”(如IDE插件)的产品,它实现了“本地-云端-GitHub”的无缝衔接,更贴近完整开发流程。
可用性与安全:分层开放权限,筑牢数据防护
1. 用户权限与定价
目前,GPT-5-Codex已集成至Codex产品中,可通过终端、IDE、GitHub、ChatGPT等入口访问,所有ChatGPT Plus、Pro、Business、Edu、Enterprise用户可直接使用:
- Plus/Edu/Business用户:可覆盖每周数次专注编程会话;
- Pro用户:支持多项目全周开发需求;
- Business/Enterprise用户:可额外购买信用额度,Enterprise还提供“共享信用池”,按实际使用量计费。
针对API客户,OpenAI表示“计划很快开放GPT-5-Codex接入”,满足企业级定制化需求。
2. 安全防护措施
为避免代码泄露与误用,OpenAI为Codex设计了多层安全机制:
- 沙盒运行:默认在本地/云端沙盒环境运行,禁用网络访问,防止执行有害命令;
- 权限管控:危险操作需提前获得开发者许可,CLI支持“只读模式”“自动模式”“完全访问模式”三级权限,可按需限制文件读取、网络访问范围;
- 可追溯性:为每个任务生成引文、终端日志、测试结果,方便开发者审查;
- 高危场景防护:针对生物、化学等敏感领域,额外实施防护措施,降低技术滥用风险。
OpenAI特别强调:Codex代码审查可作为“人工审查的补充”,但不能替代人类对生产环境部署前的最终核验。(来源)















