谷歌正在为 桌面网页版 Gemini 开发 Gemini Live 的完整支持。目前该功能仅限移动设备使用,但近期网页界面中出现的新按钮表明,屏幕共享与实时翻译即将登陆桌面端。

新功能预览
在最新版 Gemini 网页界面中,用户已可看到一个明确标注为 “开始共享您的屏幕以进行实时翻译” 的按钮。该功能允许用户:
- 共享整个屏幕或单个窗口
- 由 Gemini 实时分析画面内容
- 即时翻译屏幕上的外语文本(如网页、PDF、视频字幕等)
这一能力此前仅在 Gemini 移动 App 中可用,用户可通过摄像头或屏幕录制与 AI 进行多模态语音对话。
企业版先行,桌面版跟进
值得注意的是,类似功能已在 面向企业的 Gemini for Workspace 中出现,Gemini Live 被直接集成至导航栏。这表明谷歌正系统性地将实时交互能力从移动端向全平台扩展。
桌面端的初期重点聚焦于实时翻译,而非完整的摄像头对话,可能出于性能、隐私或使用场景的考量。该功能尤其适用于:
- 外语学习者
- 阅读外文文献的研究人员
- 处理多语言材料的教育或专业用户
模型升级预期
当前移动版 Gemini Live 由 Gemini 2.5 驱动,支持音频与视频输入的实时处理。桌面版的推出很可能伴随模型升级——Gemini 3 Pro 或即将发布的 Nano Banana 2 Flash 均有可能成为新后端。
后者尤其值得关注:若采用 Flash 变体,可在保持高多模态理解能力的同时,显著降低推理成本与延迟,更适合高频率的实时交互场景。
战略意义
此举符合谷歌 “统一 Gemini 跨平台体验” 的整体战略:
- 移动端主打语音+摄像头交互
- 桌面端聚焦屏幕内容+生产力集成
- 企业版强化协作与工作流嵌入
通过将实时辅助能力扩展至桌面,谷歌正进一步将 Gemini 从“问答助手”转变为 “实时认知协作者”。
注:谷歌尚未公布正式发布时间,但界面元素已进入测试阶段,预计将在 2025 年底前 随 Gemini 3 系列更新逐步上线。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















