OpenAI 在周四宣布推出两款新型 AI 推理模型——o3 和 o4-mini。这两款模型的设计目标是在回答问题前能够暂停并深入思考,从而提供更准确、更可靠的答案。

o3:最先进的推理模型
o3 是 OpenAI 迄今为止最先进的推理模型,在数学、编码、推理、科学及视觉理解能力的测试中,它超越了公司此前所有模型。o3 的主要特点包括:
强大的推理能力:在 Codeforces、SWE-bench 和 MMMU 等基准测试中,o3 达到了最先进的性能。 低错误率:在现实世界任务中,o3 的错误率比前代模型 o1 低 20%。 图像处理能力:o3 是 OpenAI 首批能够“以图像思考”的模型之一。用户可以向 ChatGPT 上传图像(如白板草图或 PDF 中的图表),模型将在“思维链”阶段分析这些图像后再作答。它能够理解模糊或低质量图像,并在推理过程中执行缩放或旋转图像等任务。 代码执行能力:o3 可以通过 ChatGPT 的 Canvas 功能直接在浏览器中运行和执行 Python 代码。 网页搜索能力:当用户询问时事时,o3 可以进行网页搜索,提供最新的信息。
o4-mini:平衡价格、速度和性能
o4-mini 是一款在价格、速度和性能之间提供竞争力平衡的模型。它特别适合开发者在选择 AI 模型驱动应用时考虑的三大因素。o4-mini 的主要特点包括:
高效性能:o4-mini 在保持高性能的同时,提供了更快的响应速度和更低的成本。 图像处理能力:与 o3 一样,o4-mini 也支持图像处理功能,能够分析和理解用户上传的图像。 代码执行能力:o4-mini 同样可以通过 ChatGPT 的 Canvas 功能直接在浏览器中运行和执行 Python 代码。 网页搜索能力:o4-mini 也支持网页搜索功能,能够提供最新的信息。
此外,OpenAI 还推出了 o4-mini 的变体 o4-mini-high,通过延长生成时间来提升回答的可靠性,适合对准确性要求更高的场景。
模型的可用性
从即日起,o3、o4-mini 和 o4-mini-high 将向 OpenAI 的 Pro、Plus 和 Team 计划订阅者开放。这些模型不仅可以通过 ChatGPT 使用,还将通过 OpenAI 面向开发者的端点——Chat Completions API 和 Responses API 提供,允许工程师以基于使用的费率构建应用程序。
未来几周,OpenAI 还将推出 o3-pro,这是一款使用更多计算资源生成回答的 o3 版本,专为 ChatGPT Pro 订阅者提供。
竞争背景
o3 和 o4-mini 的推出是 OpenAI 在全球 AI 竞争中力图超越谷歌、Meta、xAI、Anthropic 和 DeepSeek 的努力之一。尽管 OpenAI 率先推出了推理模型 o1,但竞争对手迅速跟进,推出了性能匹配甚至超越 OpenAI 模型的产品。随着各 AI 实验室寻求从系统中榨取更多性能,推理模型已开始主导这一领域。
值得注意的是,o3 险些未在 ChatGPT 中发布。OpenAI 首席执行官 Sam Altman 在二月曾表示,公司计划投入更多资源开发一款整合 o3 技术的更复杂替代方案。然而,竞争压力最终促使 OpenAI 改变了策略,提前推出了 o3 和 o4-mini。
未来展望
OpenAI 首席执行官萨姆·奥尔特曼表示,o3 和 o4-mini 可能是 ChatGPT 在 GPT-5 推出前最后独立的 AI 推理模型。GPT-5 是公司宣称将统一传统模型(如 GPT-4.1)与推理模型的新一代模型,预计将进一步提升 AI 的综合性能和用户体验。















