xAI 测试 Grok 网页语音模式中的屏幕共享功能，迈向更深层交互体验

早报10个月前发布小马良

273 0

近日，据用户反馈和功能日志显示，xAI 正在为其 AI 助手 Grok 的网页语音模式 测试一项新功能：屏幕共享。这是继支持语音输入之后，xAI 推动 Grok 向多模态交互迈进的又一重要进展。

目前，该功能通过一个新增的“相机按钮”触发，允许用户将当前屏幕画面分享给 Grok。尽管模型尚无法真正“理解”或“处理”所共享的内容，但这一设计表明 xAI 正在为未来引入视觉感知能力做准备。

屏幕共享功能现状与意义

访问方式：点击语音模式界面中新出现的“相机图标”
当前状态：
- 用户可上传屏幕截图
- 模型尚无法解析图像内容（即不能“看懂”屏幕）
- 无交互能力，仅作为功能原型测试

虽然功能仍处于早期阶段，但它的出现标志着 Grok 正逐步向具备视觉理解能力的多模态助手演进。未来一旦实现对图像内容的理解，Grok 将能够帮助用户完成诸如解释图表、分析界面问题等任务。

新增两项 X 平台搜索功能测试

除了屏幕共享外，Grok 的内部配置中还出现了两个新的工具调用参考：

关键词搜索
语义搜索

这意味着 Grok 可能即将支持更加精细和上下文相关的 X 平台内容检索能力。目前 Grok 已可通过 API 访问 X 数据流，而这两项新功能将进一步增强其信息获取能力：

关键词搜索：用于快速定位特定话题或事件
语义搜索：基于意图和语境匹配相关内容，提升搜索准确性

由于这些工具对终端用户不可见，具体使用哪种搜索方式可能由系统自动决定，无需用户干预。

这些更新意味着什么？

如果上述功能最终上线，将为以下用户群体带来显著便利：

社交媒体研究人员：可快速检索 X 上的趋势话题
内容创作者：实时追踪热点、获取灵感
企业用户：监测品牌舆情、市场动态

更重要的是，屏幕共享 + 高级搜索的结合，将使 Grok 在 AI 助手领域具备独特优势，尤其是在需要结合视觉信息与社交数据的场景中。

Grok 3.5 更新仍未公布时间表

尽管功能持续迭代，但备受期待的 Grok 3.5 版本 至今仍未发布，xAI 也尚未透露具体时间安排。不过从近期动作来看，xAI 显然正在采取一种渐进式升级策略：

强化与 X 平台的深度整合
探索语音、图像、搜索等新型交互方式
提升助手对现实世界信息的响应能力

这种策略不仅有助于保持产品持续进化，也为后续大版本更新打下基础。（来源）

早报 # Grok # xAI

文章版权归作者所有，未经允许请勿转载。

Gemini迎来谷歌标志性彩虹主题图标，视觉风格正式融入生态

早报 # Gemini # 谷歌

9个月前

02070

Anthropic 推出 AI 代码审查工具：多智能体架构直击逻辑漏洞，单次审查成本约 20 美元

早报 # AI 代码审查 # Anthropic # Claude Code

3周前

0630

Vidu Q2 上线：聚焦图像生成一致性与编辑实用性，开启限免一个月活动

早报 # Vidu Q2

4个月前

01240

WordPress.com 正式向 AI 智能体“开门”：全自动建站时代来临，人类只需“审批”

早报 # WordPress.com

2周前

0140

暂无评论

暂无评论...

xAI 测试 Grok 网页语音模式中的屏幕共享功能，迈向更深层交互体验

屏幕共享功能现状与意义

新增两项 X 平台搜索功能测试

这些更新意味着什么？

Grok 3.5 更新仍未公布时间表

YouTube 正式将 Veo 3 视频模型引入 Shorts，AI 创作工具再进一步

Claude Code 正式支持远程 MCP 服务器：无缝连接开发工具生态

相关文章

Gemini迎来谷歌标志性彩虹主题图标，视觉风格正式融入生态

Anthropic 推出 AI 代码审查工具：多智能体架构直击逻辑漏洞，单次审查成本约 20 美元

Vidu Q2 上线：聚焦图像生成一致性与编辑实用性，开启限免一个月活动

WordPress.com 正式向 AI 智能体“开门”：全自动建站时代来临，人类只需“审批”

暂无评论

文章

ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

新阿里通义千问发布 Qwen3.5-Omni：全模态原生大模型，215 项 SOTA 碾压 Gemini 3.1 Pro

PaCo-RL：西安交大首创“一致性裁判”强化学习框架，让AI生成四张图也能保持角色与风格完美统

智谱突袭发布GLM-5.1：编码能力暴涨 30%，直逼 Claude Opus，手把手教你接入 Claude Code 与 OpenClaw

ComfyUI 动态显存革命：告别显存不足，让 56GB 模型在 32GB 显存上丝滑运行

LMArena 最新排名出炉！阿里千问杀入全球前五，Qwen3.5-Max-Preview 力压豆包、Kimi 成国产最强

ITELLOU

OpenMAIC

S.H.I.T

Alaya Code

抓虾吧

Tripo

xAI 测试 Grok 网页语音模式中的屏幕共享功能，迈向更深层交互体验

屏幕共享功能现状与意义

新增两项 X 平台搜索功能测试

这些更新意味着什么？

Grok 3.5 更新仍未公布时间表

YouTube 正式将 Veo 3 视频模型引入 Shorts，AI 创作工具再进一步

Claude Code 正式支持远程 MCP 服务器：无缝连接开发工具生态

相关文章

文章

标签云

网址

ITELLOU

OpenMAIC

S.H.I.T

Alaya Code

抓虾吧

Tripo