埃隆·马斯克近日在 X 平台上向知名 AI 研究员 Andrej Karpathy 发起公开挑战:让 xAI 最新模型 Grok 5 与 Karpathy 本人进行一场编程对决,并将此比作 1997 年卡斯帕罗夫对阵 IBM深蓝 的历史性人机对抗。
然而,Karpathy 礼貌回绝,称自己在这样的对决中“贡献趋近于零”,并强调:他更愿将大模型视为合作者,而非竞争对手。
背景:一场被误读的“性能之争”
马斯克的挑战源于 Karpathy 在 Dwarkesh 播客中的评论。Karpathy 表示,通用人工智能(AGI)可能仍需十年,并认为 Grok 5 的能力“落后 GPT-4 约几个月”。马斯克对此回应:“你愿意参加一场 AI 编程竞赛吗?”

但 Karpathy 的立场代表了当前 AI 社区的主流转向:不再执着于“人 vs AI”的胜负,而是关注 AI 如何增强人类生产力。
真正的基准:ICPC 算法竞赛
事实上,编程能力已有客观衡量标准。今年早些时候:
- DeepMind 的 Gemini 2.5 在 ICPC 世界决赛条件下解决了 12 题中的 10 题,达到金牌水平;
- OpenAI 与 DeepMind 的 GPT-4/GPT-5 后续在相同基准上实现 12/12 完美得分。
这些题目来自大学级算法竞赛,评判标准包括正确性、时间与空间复杂度,并在严格资源限制下运行。
更值得注意的是,今年一名波兰程序员在 AtCoder 世界巡回赛决赛中击败了 OpenAI 的定制模型——这可能是人类在顶级算法竞赛中对 AI 的“最后一胜”。
如果 Grok 5 想被认真对待?
马斯克若希望 Grok 5 被视为与 GPT-4 同级,公开参与 ICPC 或类似基准测试才是正道。真正的“Deep Blue 时刻”需要:
- 使用公开问题集
- 设定固定时长与资源限制
- 禁止外部工具或人类干预
- 结果由第三方独立验证并完整公布
截至目前,xAI 尚未公布 Grok 5 在任何标准编程基准上的成绩。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...









