马斯克邀 Karpathy 与 Grok 5 编程对决，遭婉拒：AI 时代不需要“深蓝式”表演

46 0

埃隆·马斯克近日在 X 平台上向知名 AI 研究员 Andrej Karpathy 发起公开挑战：让 xAI 最新模型 Grok 5 与 Karpathy 本人进行一场编程对决，并将此比作 1997 年卡斯帕罗夫对阵 IBM深蓝 的历史性人机对抗。

然而，Karpathy 礼貌回绝，称自己在这样的对决中“贡献趋近于零”，并强调：他更愿将大模型视为合作者，而非竞争对手。

背景：一场被误读的“性能之争”

马斯克的挑战源于 Karpathy 在 Dwarkesh 播客中的评论。Karpathy 表示，通用人工智能（AGI）可能仍需十年，并认为 Grok 5 的能力“落后 GPT-4 约几个月”。马斯克对此回应：“你愿意参加一场 AI 编程竞赛吗？”

马斯克邀 Karpathy 与 Grok 5 编程对决，遭婉拒：AI 时代不需要“深蓝式”表演

但 Karpathy 的立场代表了当前 AI 社区的主流转向：不再执着于“人 vs AI”的胜负，而是关注 AI 如何增强人类生产力。

真正的基准：ICPC 算法竞赛

事实上，编程能力已有客观衡量标准。今年早些时候：

DeepMind 的 Gemini 2.5 在 ICPC 世界决赛条件下解决了 12 题中的 10 题，达到金牌水平；
OpenAI 与 DeepMind 的 GPT-4/GPT-5 后续在相同基准上实现 12/12 完美得分。

这些题目来自大学级算法竞赛，评判标准包括正确性、时间与空间复杂度，并在严格资源限制下运行。

更值得注意的是，今年一名波兰程序员在 AtCoder 世界巡回赛决赛中击败了 OpenAI 的定制模型——这可能是人类在顶级算法竞赛中对 AI 的“最后一胜”。

如果 Grok 5 想被认真对待？

马斯克若希望 Grok 5 被视为与 GPT-4 同级，公开参与 ICPC 或类似基准测试才是正道。真正的“Deep Blue 时刻”需要：

使用公开问题集
设定固定时长与资源限制
禁止外部工具或人类干预
结果由第三方独立验证并完整公布

截至目前，xAI 尚未公布 Grok 5 在任何标准编程基准上的成绩。

文章版权归作者所有，未经允许请勿转载。

谷歌为 13 岁以下儿童推出 Gemini 应用，家长需注意这些事项

早报 # Gemini # 谷歌

11个月前

02460

基于扩散模型的面部匿名化技术：匿名化后的面部与原始照片无缝融合，使其非常适合各种现实世界应用

新技术 # 面部匿名化技术

1年前

03300

Google Photos上线对话式编辑：用文字描述改图，C2PA凭证溯源AI编辑痕迹

早报 # Google Photos # 对话式编辑

7个月前

04080

BroadWay：提升文生视频模型的质量，而且不需要额外的训练

新技术 # BroadWay # 文生视频模型

1年前

07810

暂无评论

暂无评论...

马斯克邀 Karpathy 与 Grok 5 编程对决，遭婉拒：AI 时代不需要“深蓝式”表演

背景：一场被误读的“性能之争”

真正的基准：ICPC 算法竞赛

如果 Grok 5 想被认真对待？

Gemini in Chrome 正式上线，Workspace 用户可享 AI 浏览助手

杨立昆拟离职Meta，计划创办专注“世界模型”的AI公司

相关文章

谷歌为 13 岁以下儿童推出 Gemini 应用，家长需注意这些事项

基于扩散模型的面部匿名化技术：匿名化后的面部与原始照片无缝融合，使其非常适合各种现实世界应用

Google Photos上线对话式编辑：用文字描述改图，C2PA凭证溯源AI编辑痕迹

BroadWay：提升文生视频模型的质量，而且不需要额外的训练

暂无评论

文章

ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

PaCo-RL：西安交大首创“一致性裁判”强化学习框架，让AI生成四张图也能保持角色与风格完美统

LMArena 最新排名出炉！阿里千问杀入全球前五，Qwen3.5-Max-Preview 力压豆包、Kimi 成国产最强

腾讯微信「ClawBot」插件正式上线：扫码一键接入 OpenClaw，支持语音/图片/文件全交互

紧急安全警报：LiteLLM 遭供应链攻击，v1.82.7/1.82.8 窃取凭证并植入后门

新阿里通义千问发布 Qwen3.5-Omni：全模态原生大模型，215 项 SOTA 碾压 Gemini 3.1 Pro

S.H.I.T

ITELLOU

OpenMAIC

Alaya Code

抓虾吧

Jellyfish AI短剧工厂

马斯克邀 Karpathy 与 Grok 5 编程对决，遭婉拒：AI 时代不需要“深蓝式”表演

背景：一场被误读的“性能之争”

真正的基准：ICPC 算法竞赛

如果 Grok 5 想被认真对待？

Gemini in Chrome 正式上线，Workspace 用户可享 AI 浏览助手

杨立昆拟离职Meta，计划创办专注“世界模型”的AI公司

相关文章

文章

标签云

网址

S.H.I.T

ITELLOU

OpenMAIC

Alaya Code

抓虾吧

Jellyfish AI短剧工厂