当 OpenAI 在去年 12 月推出其 o3“推理”模型时,它与 ARC-AGI 的创建者合作,通过这一基准测试来展示 o3 的强大能力。然而,几个月后,随着测试结果的修订,o3 的运行成本似乎比最初估计的更高,这引发了对复杂 AI 模型成本效益的进一步讨论。
成本估算的调整
上周,Arc Prize 基金会(负责维护和管理 ARC-AGI 的组织)更新了 o3 的计算成本估算。最初,该基金会估计 o3 的最佳配置版本(o3 high)解决单个 ARC-AGI 问题的成本约为 3000 美元。然而,最新的估算显示,这个成本可能高达每个任务 3 万美元。

这一调整值得注意,因为它揭示了当今最复杂的 AI 模型在某些任务上的运行成本可能非常高昂,尤其是在早期阶段。尽管 OpenAI 尚未为 o3 定价,甚至尚未正式发布该模型,但 Arc Prize 基金会认为,OpenAI 的 o1-pro 模型定价可以作为一个合理的参考。
背景与参考模型
o1-pro 是 OpenAI 目前最昂贵的模型,其定价和计算资源使用情况为 o3 的成本估算提供了重要参考。Arc Prize 基金会的联合创始人 Mike Knoop 在接受 TechCrunch 采访时表示:“我们认为 o1-pro 更接近 o3 的真实成本,因为它在测试时使用了大量的计算资源。但这仍然只是一个代理值,我们在排行榜上将 o3 标记为预览版,以反映在官方定价公布前的这种不确定性。”
资源使用与成本分析
根据 Arc Prize 基金会的数据,o3 high 在处理 ARC-AGI 时使用的计算资源是最低计算配置(o3 low)的 172 倍。这种巨大的资源消耗使得其高昂的价格并不令人意外。此外,长期以来有传言称 OpenAI 正在考虑为企业客户推出昂贵的计划。据 The Information 在 3 月初报道,该公司可能计划为专门的 AI“代理”(例如软件开发代理)每月收取高达 2 万美元的费用。
成本效益的讨论
尽管 OpenAI 的模型可能非常强大,但高昂的成本引发了对其实际效益的讨论。一些人认为,即使是 OpenAI 最昂贵的模型,其成本也远低于典型人类承包商或员工的费用。然而,AI 研究人员 Toby Ord 在 X 上的帖子中指出,这些模型的效率可能并不高。例如,o3 high 在 ARC-AGI 的每个任务上需要尝试 1024 次才能达到最佳得分,这表明其在某些任务上的效率仍有待提高。
未来展望
随着 AI 技术的不断发展,模型的复杂性和计算需求也在增加。OpenAI 的 o3 模型的高成本提醒我们,虽然 AI 有巨大的潜力,但在实际应用中需要考虑成本效益。企业客户在选择 AI 解决方案时,需要权衡模型的性能和运行成本。此外,OpenAI 未来对 o3 的定价策略也将对市场产生重要影响。