马斯克邀 Karpathy 与 Grok 5 编程对决,遭婉拒:AI 时代不需要“深蓝式”表演

百科2个月前发布 小马良
27 0

埃隆·马斯克近日在 X 平台上向知名 AI 研究员 Andrej Karpathy 发起公开挑战:让 xAI 最新模型 Grok 5 与 Karpathy 本人进行一场编程对决,并将此比作 1997 年卡斯帕罗夫对阵 IBM深蓝 的历史性人机对抗。

然而,Karpathy 礼貌回绝,称自己在这样的对决中“贡献趋近于零”,并强调:他更愿将大模型视为合作者,而非竞争对手

背景:一场被误读的“性能之争”

马斯克的挑战源于 Karpathy 在 Dwarkesh 播客中的评论。Karpathy 表示,通用人工智能(AGI)可能仍需十年,并认为 Grok 5 的能力“落后 GPT-4 约几个月”。马斯克对此回应:“你愿意参加一场 AI 编程竞赛吗?”

马斯克邀 Karpathy 与 Grok 5 编程对决,遭婉拒:AI 时代不需要“深蓝式”表演

但 Karpathy 的立场代表了当前 AI 社区的主流转向:不再执着于“人 vs AI”的胜负,而是关注 AI 如何增强人类生产力

真正的基准:ICPC 算法竞赛

事实上,编程能力已有客观衡量标准。今年早些时候:

  • DeepMind 的 Gemini 2.5 在 ICPC 世界决赛条件下解决了 12 题中的 10 题,达到金牌水平;
  • OpenAI 与 DeepMind 的 GPT-4/GPT-5 后续在相同基准上实现 12/12 完美得分

这些题目来自大学级算法竞赛,评判标准包括正确性、时间与空间复杂度,并在严格资源限制下运行。

更值得注意的是,今年一名波兰程序员在 AtCoder 世界巡回赛决赛中击败了 OpenAI 的定制模型——这可能是人类在顶级算法竞赛中对 AI 的“最后一胜”。

如果 Grok 5 想被认真对待?

马斯克若希望 Grok 5 被视为与 GPT-4 同级,公开参与 ICPC 或类似基准测试才是正道。真正的“Deep Blue 时刻”需要:

  • 使用公开问题集
  • 设定固定时长与资源限制
  • 禁止外部工具或人类干预
  • 结果由第三方独立验证并完整公布

截至目前,xAI 尚未公布 Grok 5 在任何标准编程基准上的成绩。

© 版权声明

相关文章

暂无评论

none
暂无评论...