北京时间周四午间,伊隆·马斯克旗下的xAI团队正式发布了其最新旗舰AI模型——Grok 4,并同步推出了每月300美元的高端订阅服务SuperGrok Heavy。此举标志着xAI在大模型竞争中迈出了关键一步,也进一步明确了其商业化路径。

Grok 4来了,性能如何?
Grok 4是xAI对标OpenAI的GPT系列和谷歌Gemini的产品。它不仅具备文本理解能力,还能分析图像、回答问题,并已在社交平台X上实现深度集成。
据马斯克在直播中介绍:“在学术问题上,Grok 4在每个学科的表现都超过博士水平,没有例外。”尽管如此,他也坦言,目前模型仍缺乏常识判断能力,尚未能“发明新技术”或“发现新物理”。
为了提升推理质量,xAI还推出了一款更高性能的变体:Grok 4 Heavy。该版本采用“多代理机制”,即多个AI同时处理一个问题,再通过类似“学习小组”的方式比较结果,以找到最优解。
在多项权威基准测试中,Grok 4表现亮眼:
- 在“人类的最后考试”(涵盖数学、人文、自然科学等领域的难题)中:
- Grok 4无工具得分为25.4%,优于Gemini 2.5 Pro(21.6%)和OpenAI o3(21%)。
- Grok 4 Heavy启用工具后得分达44.4%,远超Gemini 2.5 Pro(26.9%)。
- 在Arc Prize组织的ARC-AGI-2视觉模式识别测试中,Grok 4取得16.2%的成绩,几乎是Claude Opus 4(8.4%)的两倍。
这些成绩表明,Grok 4在技术层面已具备与主流模型一较高下的实力。

商业化路线:300美元/月的SuperGrok Heavy
除了模型本身,xAI还推出了面向高端用户的订阅计划——SuperGrok Heavy,价格为每月300美元,是当前主要AI供应商中最贵的订阅方案之一。

订阅用户将获得以下权益:
- 提前体验Grok 4 Heavy
- 优先使用即将推出的新功能
- 更高的调用频率和更强的计算资源支持
xAI表示,未来几个月内将陆续推出一系列新产品:
- 8月:AI代码生成模型
- 9月:多模态代理系统
- 10月:视频生成模型
此外,xAI也开始通过API开放Grok 4,供开发者构建应用。虽然企业部门成立仅两个月,但公司已计划与大型云服务商合作,将其模型部署至更多平台。

面临挑战:争议事件与公众信任
尽管技术表现出色,xAI近期却陷入舆论风波。几天前,Grok驱动的自动化账号在X平台上发表了涉及反犹太主义的内容,引发广泛批评。随后,xAI删除相关推文并对账户进行限制。
这一事件也让xAI重新审视其系统的安全机制。有消息称,公司已从Grok的公共提示词中移除了此前加入的一条规则——要求AI不回避“政治不正确”的表达。
面对外界压力,马斯克及xAI高层并未对此事公开回应,而是将重点放在模型性能展示上。不过,要让企业和公众真正接受Gro















