Gemini Live将带来重大更新：让谷歌的 AI 模型通过摄像头“看”世界

早报1年前发布小马良

271 0

谷歌正在为旗下的 AI 助手 Gemini 带来重大更新，使其具备更强的互动性和情境感知能力。通过引入实时视频分析和屏幕共享功能，Gemini 不再是一个简单的聊天机器人，而是一个能够“看”到并理解用户环境的智能助手。然而，这些功能的推出也引发了关于隐私和数据安全的讨论。

Gemini Live 的新功能

在2025巴塞罗那的移动世界大会（MWC）上，谷歌展示了 Gemini 的两项新功能：

实时视频分析
用户可以通过智能手机摄像头将 Gemini 指向物体、周围环境，甚至是电脑屏幕，以获取即时分析和反馈。例如，Gemini 可以帮助用户识别物品、解决技术问题，甚至提供实时指导。谷歌希望通过这些功能，让 Gemini 成为一个能够“看”到并理解用户需求的实用 AI 助手。
屏幕共享功能
用户可以将手机屏幕共享给 Gemini，AI 助手可以实时分析屏幕内容，提供特定于应用程序的帮助，指导用户完成任务，甚至总结屏幕上的信息。谷歌希望借此让 Gemini 更像一个随时可用的 AI 助手，而不仅仅是一个聊天机器人。

隐私与数据安全的考量

尽管这些功能带来了显著的便利性，但用户隐私和数据安全问题不容忽视。当用户与 Gemini 分享摄像头和屏幕时，数据滥用或过度干预的可能性令人担忧。谷歌需要确保用户数据的安全性和隐私性，同时让用户明确了解数据的使用方式和范围。

定价与行业趋势

谷歌将这些新功能锁定在其 AI Premium 计划中，每月收费 20 美元。这一策略与行业趋势一致，例如 OpenAI 通过 ChatGPT Plus 提供高级功能的付费模式。然而，这也引发了用户对隐私和数据安全的担忧，尤其是当谷歌需要访问用户手机摄像头时。

用户反馈与未来展望

谷歌在去年的 MWC 上曾展示过类似功能（当时称为 Astra 项目），尽管当时的演示令人印象深刻，但 Ars Technica 指出，AI 在非脚本化条件下进行视频分析时仍存在问题。此次更新更加成熟，早期测试用户对 Gemini 的反馈积极，称赞其能够“看”到并响应环境的能力。

谷歌确认，这些更新将于本月晚些时候在安卓系统的 Gemini 应用中推出，iOS 版本的推出预计会紧随其后。随着这些功能的推广，用户将能够更直观地体验到 AI 助手的强大潜力。

早报 # Gemini # 谷歌

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Anthropic 发布 Claude Opus 4.6：支持“智能体团队”、100 万上下文，并深度集成 PowerPoint

Anthropic 发布 Claude Opus 4.6：支持“智能体团队”、100 万上下文，并深度集成 PowerPoint

早报 # Anthropic # Claude Opus 4.6

2个月前

0300

在 Gemini 应用中获得最佳图像生成和编辑的技巧

在 Gemini 应用中获得最佳图像生成和编辑的技巧

提示词 # Gemini # Gemini 2.5 Flash Image # nano-banana

6个月前

0680

TikTok 推出 AI 生成替代文本与无障碍功能，助力视力障碍用户

TikTok 推出 AI 生成替代文本与无障碍功能，助力视力障碍用户

早报 # TikTok # 无障碍

11个月前

01990

OpenAI提议将《芯片法案》税收抵免扩展至AI数据中心

OpenAI提议将《芯片法案》税收抵免扩展至AI数据中心

早报 # OpenAI # 芯片法案

5个月前

0210

暂无评论

none

暂无评论...