OpenAI 的 o3 模型运行成本可能比最初估计的更高

40 0

当 OpenAI 在去年 12 月推出其 o3“推理”模型时，它与 ARC-AGI 的创建者合作，通过这一基准测试来展示 o3 的强大能力。然而，几个月后，随着测试结果的修订，o3 的运行成本似乎比最初估计的更高，这引发了对复杂 AI 模型成本效益的进一步讨论。

成本估算的调整

上周，Arc Prize 基金会（负责维护和管理 ARC-AGI 的组织）更新了 o3 的计算成本估算。最初，该基金会估计 o3 的最佳配置版本（o3 high）解决单个 ARC-AGI 问题的成本约为 3000 美元。然而，最新的估算显示，这个成本可能高达每个任务 3 万美元。

这一调整值得注意，因为它揭示了当今最复杂的 AI 模型在某些任务上的运行成本可能非常高昂，尤其是在早期阶段。尽管 OpenAI 尚未为 o3 定价，甚至尚未正式发布该模型，但 Arc Prize 基金会认为，OpenAI 的 o1-pro 模型定价可以作为一个合理的参考。

背景与参考模型

o1-pro 是 OpenAI 目前最昂贵的模型，其定价和计算资源使用情况为 o3 的成本估算提供了重要参考。Arc Prize 基金会的联合创始人 Mike Knoop 在接受 TechCrunch 采访时表示：“我们认为 o1-pro 更接近 o3 的真实成本，因为它在测试时使用了大量的计算资源。但这仍然只是一个代理值，我们在排行榜上将 o3 标记为预览版，以反映在官方定价公布前的这种不确定性。”

资源使用与成本分析

根据 Arc Prize 基金会的数据，o3 high 在处理 ARC-AGI 时使用的计算资源是最低计算配置（o3 low）的 172 倍。这种巨大的资源消耗使得其高昂的价格并不令人意外。此外，长期以来有传言称 OpenAI 正在考虑为企业客户推出昂贵的计划。据 The Information 在 3 月初报道，该公司可能计划为专门的 AI“代理”（例如软件开发代理）每月收取高达 2 万美元的费用。

成本效益的讨论

尽管 OpenAI 的模型可能非常强大，但高昂的成本引发了对其实际效益的讨论。一些人认为，即使是 OpenAI 最昂贵的模型，其成本也远低于典型人类承包商或员工的费用。然而，AI 研究人员 Toby Ord 在 X 上的帖子中指出，这些模型的效率可能并不高。例如，o3 high 在 ARC-AGI 的每个任务上需要尝试 1024 次才能达到最佳得分，这表明其在某些任务上的效率仍有待提高。