Gemini Live将带来重大更新:让谷歌的 AI 模型通过摄像头“看”世界

早报5天前发布 小马良
17 0

谷歌正在为旗下的 AI 助手 Gemini 带来重大更新,使其具备更强的互动性和情境感知能力。通过引入实时视频分析和屏幕共享功能,Gemini 不再是一个简单的聊天机器人,而是一个能够“看”到并理解用户环境的智能助手。然而,这些功能的推出也引发了关于隐私和数据安全的讨论。

Gemini Live 的新功能

在2025巴塞罗那的移动世界大会(MWC)上,谷歌展示了 Gemini 的两项新功能:

  1. 实时视频分析
    用户可以通过智能手机摄像头将 Gemini 指向物体、周围环境,甚至是电脑屏幕,以获取即时分析和反馈。例如,Gemini 可以帮助用户识别物品、解决技术问题,甚至提供实时指导。谷歌希望通过这些功能,让 Gemini 成为一个能够“看”到并理解用户需求的实用 AI 助手。
  2. 屏幕共享功能
    用户可以将手机屏幕共享给 Gemini,AI 助手可以实时分析屏幕内容,提供特定于应用程序的帮助,指导用户完成任务,甚至总结屏幕上的信息。谷歌希望借此让 Gemini 更像一个随时可用的 AI 助手,而不仅仅是一个聊天机器人。

隐私与数据安全的考量

尽管这些功能带来了显著的便利性,但用户隐私和数据安全问题不容忽视。当用户与 Gemini 分享摄像头和屏幕时,数据滥用或过度干预的可能性令人担忧。谷歌需要确保用户数据的安全性和隐私性,同时让用户明确了解数据的使用方式和范围。

Gemini Live将带来重大更新:让谷歌的 AI 模型通过摄像头“看”世界

定价与行业趋势

谷歌将这些新功能锁定在其 AI Premium 计划中,每月收费 20 美元。这一策略与行业趋势一致,例如 OpenAI 通过 ChatGPT Plus 提供高级功能的付费模式。然而,这也引发了用户对隐私和数据安全的担忧,尤其是当谷歌需要访问用户手机摄像头时。

用户反馈与未来展望

谷歌在去年的 MWC 上曾展示过类似功能(当时称为 Astra 项目),尽管当时的演示令人印象深刻,但 Ars Technica 指出,AI 在非脚本化条件下进行视频分析时仍存在问题。此次更新更加成熟,早期测试用户对 Gemini 的反馈积极,称赞其能够“看”到并响应环境的能力。

谷歌确认,这些更新将于本月晚些时候在安卓系统的 Gemini 应用中推出,iOS 版本的推出预计会紧随其后。随着这些功能的推广,用户将能够更直观地体验到 AI 助手的强大潜力。

© 版权声明

相关文章

暂无评论

none
暂无评论...