OpenAI 推出两款新型 AI 推理模型：o3 和 o4-mini

早报12个月前发布小马良

289 0

OpenAI 在周四宣布推出两款新型 AI 推理模型——o3 和 o4-mini。这两款模型的设计目标是在回答问题前能够暂停并深入思考，从而提供更准确、更可靠的答案。

o3：最先进的推理模型

o3 是 OpenAI 迄今为止最先进的推理模型，在数学、编码、推理、科学及视觉理解能力的测试中，它超越了公司此前所有模型。o3 的主要特点包括：

强大的推理能力：在 Codeforces、SWE-bench 和 MMMU 等基准测试中，o3 达到了最先进的性能。
低错误率：在现实世界任务中，o3 的错误率比前代模型 o1 低 20%。
图像处理能力：o3 是 OpenAI 首批能够“以图像思考”的模型之一。用户可以向 ChatGPT 上传图像（如白板草图或 PDF 中的图表），模型将在“思维链”阶段分析这些图像后再作答。它能够理解模糊或低质量图像，并在推理过程中执行缩放或旋转图像等任务。
代码执行能力：o3 可以通过 ChatGPT 的 Canvas 功能直接在浏览器中运行和执行 Python 代码。
网页搜索能力：当用户询问时事时，o3 可以进行网页搜索，提供最新的信息。

o4-mini：平衡价格、速度和性能

o4-mini 是一款在价格、速度和性能之间提供竞争力平衡的模型。它特别适合开发者在选择 AI 模型驱动应用时考虑的三大因素。o4-mini 的主要特点包括：

高效性能：o4-mini 在保持高性能的同时，提供了更快的响应速度和更低的成本。
图像处理能力：与 o3 一样，o4-mini 也支持图像处理功能，能够分析和理解用户上传的图像。
代码执行能力：o4-mini 同样可以通过 ChatGPT 的 Canvas 功能直接在浏览器中运行和执行 Python 代码。
网页搜索能力：o4-mini 也支持网页搜索功能，能够提供最新的信息。

此外，OpenAI 还推出了 o4-mini 的变体 o4-mini-high，通过延长生成时间来提升回答的可靠性，适合对准确性要求更高的场景。

模型的可用性

从即日起，o3、o4-mini 和 o4-mini-high 将向 OpenAI 的 Pro、Plus 和 Team 计划订阅者开放。这些模型不仅可以通过 ChatGPT 使用，还将通过 OpenAI 面向开发者的端点——Chat Completions API 和 Responses API 提供，允许工程师以基于使用的费率构建应用程序。

未来几周，OpenAI 还将推出 o3-pro，这是一款使用更多计算资源生成回答的 o3 版本，专为 ChatGPT Pro 订阅者提供。

竞争背景

o3 和 o4-mini 的推出是 OpenAI 在全球 AI 竞争中力图超越谷歌、Meta、xAI、Anthropic 和 DeepSeek 的努力之一。尽管 OpenAI 率先推出了推理模型 o1，但竞争对手迅速跟进，推出了性能匹配甚至超越 OpenAI 模型的产品。随着各 AI 实验室寻求从系统中榨取更多性能，推理模型已开始主导这一领域。

值得注意的是，o3 险些未在 ChatGPT 中发布。OpenAI 首席执行官 Sam Altman 在二月曾表示，公司计划投入更多资源开发一款整合 o3 技术的更复杂替代方案。然而，竞争压力最终促使 OpenAI 改变了策略，提前推出了 o3 和 o4-mini。