OpenAI 发布 GPT-5-Codex：动态调整思考时间，覆盖编码 / 审查全场景，ChatGPT 付费用户率先可用

320 0

OpenAI于今天宣布，为旗下AI编程工具Codex推出基于GPT-5的新版本——GPT-5-Codex。这款专为软件工程场景优化的模型，以“动态调整思考时间”为核心突破，可根据编程任务复杂度灵活分配几秒到7小时的处理时长，同时在代码生成、重构、审查等全流程实现性能提升。目前，该版本已面向所有ChatGPT付费用户（Plus/Pro/Business/Edu/Enterprise）开放，后续还将推进API接入，进一步加码AI编程工具市场竞争。

OpenAI 发布 GPT-5-Codex：动态调整思考时间，覆盖编码 / 审查全场景，ChatGPT 付费用户率先可用

核心突破：GPT-5-Codex的“动态思考”能力

不同于传统AI编程模型“固定资源分配”的模式，GPT-5-Codex的核心优势在于实时调整任务处理时间与计算资源——无需提前通过“路由器”预设资源分配方案，而是在任务执行中根据复杂度动态决策：简单的代码片段生成可能仅需几秒，而大规模代码重构、完整项目开发等复杂任务，可自主延长至7小时，通过多轮迭代优化、测试验证，确保最终输出质量。

这一设计直接体现在性能数据上：在衡量代理编程能力的“SWE-bench Verified”基准测试中，GPT-5-Codex不仅覆盖了全部500个任务（此前GPT-5因基础设施限制仅能运行477个），整体表现更超越前代模型；在“大型成熟仓库代码重构”测试中，该模型可独立完成类似“Gitea项目232个文件、3541行代码的ctx变量传递优化”这类高复杂度任务。

从资源效率来看，GPT-5-Codex还实现了“按需分配”的精细化管控：在OpenAI内部员工使用数据中，处理简单任务的用户轮次（按生成令牌数排序最低10%），其令牌消耗比GPT-5减少93.7%；而处理复杂任务的轮次（最高10%），则通过双倍时长的推理、编辑与测试，实现更优输出效果，兼顾“快速响应”与“深度处理”双重需求。

功能升级：覆盖编程全流程，聚焦软件工程场景

除核心的“动态思考”能力外，GPT-5-Codex还针对软件工程全场景进行优化，新增或强化了三大关键功能：

1. 代码审查：精准捕获关键缺陷，减少无效反馈

OpenAI专门为GPT-5-Codex训练了“代码审查能力”，使其可模拟资深工程师的审查逻辑：不仅能对比PR（拉取请求）的“声明意图”与“实际代码差异”，还能联动整个代码库的依赖关系，通过自动运行代码与测试用例验证功能正确性。

在基于热门开源仓库的评估中，经验丰富的软件工程师反馈：GPT-5-Codex的审查评论“错误率更低”，且能聚焦“高影响问题”（如安全漏洞、性能瓶颈、依赖项过时等），避免冗余反馈分散团队注意力。目前，该功能已在OpenAI内部落地，每天为数百个PR提前捕获问题，大幅减轻人工审查负担。

2. 多场景适配：从本地到云端，无缝衔接开发流程

为贴合开发者实际工作习惯，GPT-5-Codex实现了“全工具链适配”，覆盖终端、IDE、云端、GitHub等核心开发场景：

本地开发：通过Codex CLI（命令行工具）和IDE扩展（支持VS Code、Cursor等编辑器），可直接调用模型生成代码、优化逻辑，且能利用“打开文件”“选中代码”等上下文信息，减少提示词撰写成本；CLI还支持附加截图、线框图，辅助模型理解设计需求。
云端协作：Codex云环境通过“缓存容器”将任务启动时间缩短90%，还能自动扫描设置脚本、安装依赖（如自动执行pip install）；开发者可在云端创建任务，通过IDE扩展实时跟踪进度，甚至让模型启动浏览器预览效果、生成截图反馈。
GitHub集成：在GitHub仓库启用功能后，PR从草稿转为“就绪状态”时会自动触发审查，也可通过“@codex review”手动调用，支持定向审查（如“@codex review for security vulnerabilities”），审查后还能直接要求模型修改代码。

3. 视觉交互：支持图像输入输出，优化前端开发体验

GPT-5-Codex新增“视觉交互”能力：开发者可上传UI设计图、截图，模型能基于图像理解需求并生成对应代码；在云端开发时，模型还能自主启动浏览器，查看前端页面效果，迭代优化后生成截图反馈，大幅提升移动网站、桌面应用等视觉相关开发场景的效率。

市场背景：瞄准拥挤的AI编程赛道，强化竞争壁垒

此次升级，也是OpenAI在AI编程工具市场“巩固优势”的关键动作。过去一年，该赛道因“开发者效率需求激增”变得异常拥挤：Anysphere的Cursor在2025年初ARR（年度经常性收入）已突破5亿美元，成为现象级产品；另一款代码编辑器Windsurf虽因收购争议导致团队分裂（成员分别加入Google和Cognition），仍侧面反映市场热度；此外，Anthropic的Claude Code、微软的GitHub Copilot等竞品，也在持续迭代功能。

而GPT-5-Codex的推出，通过“动态思考时间”“全流程功能覆盖”“多工具链适配”三大差异化优势，进一步强化Codex的竞争力——相比聚焦“轻量编程辅助”的工具，它能处理更复杂的独立任务；相比侧重“单一场景”（如IDE插件）的产品，它实现了“本地-云端-GitHub”的无缝衔接，更贴近完整开发流程。