近日,据用户反馈和功能日志显示,xAI 正在为其 AI 助手 Grok 的网页语音模式 测试一项新功能:屏幕共享。这是继支持语音输入之后,xAI 推动 Grok 向多模态交互迈进的又一重要进展。

目前,该功能通过一个新增的“相机按钮”触发,允许用户将当前屏幕画面分享给 Grok。尽管模型尚无法真正“理解”或“处理”所共享的内容,但这一设计表明 xAI 正在为未来引入视觉感知能力做准备。
屏幕共享功能现状与意义
- 访问方式:点击语音模式界面中新出现的“相机图标”
- 当前状态:
- 用户可上传屏幕截图
- 模型尚无法解析图像内容(即不能“看懂”屏幕)
- 无交互能力,仅作为功能原型测试
虽然功能仍处于早期阶段,但它的出现标志着 Grok 正逐步向具备视觉理解能力的多模态助手演进。未来一旦实现对图像内容的理解,Grok 将能够帮助用户完成诸如解释图表、分析界面问题等任务。
新增两项 X 平台搜索功能测试
除了屏幕共享外,Grok 的内部配置中还出现了两个新的工具调用参考:
- 关键词搜索
- 语义搜索
这意味着 Grok 可能即将支持更加精细和上下文相关的 X 平台内容检索能力。目前 Grok 已可通过 API 访问 X 数据流,而这两项新功能将进一步增强其信息获取能力:
- 关键词搜索:用于快速定位特定话题或事件
- 语义搜索:基于意图和语境匹配相关内容,提升搜索准确性
由于这些工具对终端用户不可见,具体使用哪种搜索方式可能由系统自动决定,无需用户干预。

这些更新意味着什么?
如果上述功能最终上线,将为以下用户群体带来显著便利:
- 社交媒体研究人员:可快速检索 X 上的趋势话题
- 内容创作者:实时追踪热点、获取灵感
- 企业用户:监测品牌舆情、市场动态
更重要的是,屏幕共享 + 高级搜索的结合,将使 Grok 在 AI 助手领域具备独特优势,尤其是在需要结合视觉信息与社交数据的场景中。
Grok 3.5 更新仍未公布时间表
尽管功能持续迭代,但备受期待的 Grok 3.5 版本 至今仍未发布,xAI 也尚未透露具体时间安排。不过从近期动作来看,xAI 显然正在采取一种渐进式升级策略:
- 强化与 X 平台的深度整合
- 探索语音、图像、搜索等新型交互方式
- 提升助手对现实世界信息的响应能力
这种策略不仅有助于保持产品持续进化,也为后续大版本更新打下基础。(来源)
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















