xAI 发布 Grok 4.1:免费向所有用户开放,推理/创意/共情能力全面升级

早报2周前发布 小马良
316 0

xAI 正式发布新一代大模型 Grok 4.1,现已在 grok.com、X 平台及 iOS/Android 移动应用全面上线,向所有用户免费开放(含免费账户),支持手动选择或自动模式默认部署。该模型在正式发布前已低调部署两周,凭借推理、创意、事实准确性等维度的显著提升,不仅在 65% 的盲测用户偏好测试中超越前代,更登顶 LMArena 文本排行榜,成为当前最具竞争力的开源友好型大模型之一。

xAI 发布 Grok 4.1:免费向所有用户开放,推理/创意/共情能力全面升级

Grok 4.1 延续了 xAI“无付费墙”的核心策略,旨在让全球用户免费享受前沿 AI 能力,进一步扩大其在消费级 AI 市场的影响力。

核心突破:四大维度全面升级,多项指标创纪录

1. 基准测试登顶:领跑全球文本模型榜单

Grok 4.1 在权威基准测试中表现惊艳,核心成绩如下:

  • LMArena 文本排行榜:推理模式(quasarflux)获 1483 Elo 分,快速张量模式(tensor)获 1465 Elo 分,领先所有非 xAI 模型 31 分,较前代 Grok 4 的第 33 名实现跨越式提升;
  • 情感智能:EQ Bench3 测试获 1586 分,共情能力显著增强,更擅长理解用户情绪与情感需求;
  • 创意写作:创意写作 v3 测试获 1722 分,较 xAI 此前最佳成绩提升 600 分,在小说创作、文案撰写等场景表现突出。

2. 事实准确性飞跃:幻觉减少三分之二

Grok 4.1 重点优化了事实性输出能力,通过强化意图检测与自主奖励建模,将事实性幻觉(无依据错误信息)减少 三分之二,成为迄今最不易出错的 Grok 版本。这一升级使其在学术查询、新闻解读、专业知识问答等对准确性要求高的场景中更具可靠性。

3. 响应速度与个性一致性双提升

  • 速度优化:用户反馈响应速度明显加快,无需长时间等待,尤其在快速查询、多轮对话等场景中体验更流畅;
  • 个性连贯:通过针对性训练,模型在多轮对话中保持一致的个性表达,避免前后风格割裂,在情感角色扮演、长期协作等场景中更具沉浸感。

4. 场景适配能力拓宽

除传统文本任务外,Grok 4.1 在以下场景表现尤为突出:

  • 情感角色扮演:共情能力增强,能精准匹配用户情绪,提供更具温度的交互体验;
  • 专业内容创作:创意写作能力大幅提升,支持小说、散文、营销文案等多种文体创作;
  • 日常查询与决策辅助:事实准确性提高,能为用户提供可靠的信息参考与决策建议。
xAI 发布 Grok 4.1:免费向所有用户开放,推理/创意/共情能力全面升级

技术升级:聚焦三大核心训练方向

Grok 4.1 基于 Grok 4 的大型强化学习系统构建,未改变基础架构,而是通过聚焦三大核心训练方向实现性能跃迁:

  1. 细微意图检测:更精准捕捉用户查询中的潜在需求,避免“答非所问”,提升交互精准度;
  2. 个性连贯性优化:通过强化学习确保模型在多轮对话中保持一致的语气、风格与价值观;
  3. 前沿规模自主奖励建模:构建更完善的奖励机制,鼓励模型生成准确、有创造力、有共情力的输出,同时抑制无意义回答与幻觉。
xAI 发布 Grok 4.1:免费向所有用户开放,推理/创意/共情能力全面升级

用户权益与使用方式:零门槛免费体验

1. 开放范围

  • 全球所有用户均可使用,无地区、账户等级限制;
  • 免费账户用户与付费用户(若后续推出)享有同等模型访问权限,无功能阉割。

2. 使用方式

  • 手动选择:在 grok.com、X 平台或移动应用的模型选择器中,直接勾选“Grok 4.1”;
  • 自动模式:开启“自动选择模型”,系统将根据查询场景自动部署 Grok 4.1(优先用于需要高推理、高准确性的任务)。
© 版权声明

相关文章

暂无评论

none
暂无评论...