谷歌将Gemini 深度集成到Chrome浏览器,用AI重塑浏览器

早报3个月前发布 小马良
77 0

谷歌正在将 AI 深度融入 Chrome 浏览器,不是为了堆砌功能,而是让浏览器真正“理解”你在做什么,并据此提供实用帮助。

从最初追求速度与安全,到如今尝试构建一个能主动协助用户的工具,Chrome 的角色正在发生变化:它不再只是一个打开网页的窗口,而逐渐成为你在线活动中的上下文感知助手

这一轮更新并非简单的功能叠加,而是系统性地引入 AI 能力,在任务执行、信息获取和安全防护三个维度上提升体验。

AI 助手嵌入浏览流程:Gemini 来了

Chrome 正式集成 Gemini,作为其内置的 AI 浏览助手。不同于独立应用中的 Gemini,这次的版本深度绑定浏览行为,能够访问当前页面、标签页群组乃至历史记录(需授权),实现基于上下文的交互。

✅ 当前可用能力(已上线)

  • 解释复杂内容:选中文本或直接提问,Gemini 可以为你总结文章、解释术语。
  • 跨标签页理解:当你同时打开多个研究资料时,Gemini 可综合信息回答问题,例如:“这三篇论文对气候变化的影响结论是否一致?”
  • 快速定位过往页面:未来支持自然语言查询历史访问记录,比如:“上周我看的那个胡桃木餐桌是哪个网站?”

首批面向美国地区使用英语的 Mac 和 Windows 用户开放,Android 与 iOS 版本陆续上线。

🔜 即将推出:代理式任务处理

团队正在开发更进一步的能力——由 Gemini 代为完成多步骤操作

设想场景:

“帮我订一份每周配送的有机蔬菜盒,预算 80 美元以内。”

系统将在后台自动跳转至常用生鲜平台,筛选符合条件的商品并完成下单,全程只需用户确认关键节点。整个过程从原本耗时数十分钟,压缩为几次点击。

你始终掌握控制权,可随时中断流程。这类功能标志着浏览器从“被动渲染”向“主动执行”的转变。

地址栏升级:不只是搜索框

Chrome 的地址栏(Omnibox)一直是高效导航的核心入口。现在,它被赋予更强的 AI 能力,逐步演变为一个轻量级任务中心

1. 支持 AI 模式搜索

即将在美国推出的一项功能,允许用户直接从地址栏进入 Google 的 AI Mode(AI 模式)

  • 输入复杂问题,如:“比较 Python 和 JavaScript 在构建实时聊天应用上的优劣”
  • 获取结构化回答,并支持连续追问
  • 结果附带引用链接,便于深入查阅

无需切换页面或打开新标签,即可获得聚合信息。

2. 上下文相关建议

当你正在浏览某个网页时,地址栏会根据当前内容推荐后续问题:

  • 正在查看床垫?提示:“保修政策是什么?”、“用户评价中提到哪些缺点?”
  • 阅读科技新闻?提示:“这项技术的工作原理是什么?”、“有哪些竞品?”

这些提示来自对页面语义的理解,旨在降低信息探索门槛。

📌 当前上下文建议已在美区 English 用户中上线,AI 模式搜索将于本月晚些时候推出,后续逐步扩展至其他语言和地区。

安全机制的 AI 化:防骗、降噪、自动化响应

没有安全性支撑,任何智能化都无意义。Chrome 正利用 AI 提升多项基础保护能力。

🛡️ 更精准识别诈骗网站

Safe Browsing 的“增强保护模式”已集成 Gemini Nano 模型,用于分析可疑页面行为:

  • 识别伪装成技术支持的钓鱼页面(如弹窗声称“你的电脑感染病毒”)
  • 检测虚假抽奖、限时优惠等诱导性欺诈手段

相比规则引擎,AI 能更快适应新型攻击模式。

🔕 减少垃圾通知干扰

许多网站滥用通知权限,导致用户频繁收到广告推送。Chrome 现在通过 AI 判断通知质量:

  • 自动归类低质量请求为“潜在垃圾”
  • 提供一键屏蔽选项

据官方数据,该功能上线后,Android 端每日减少约 30 亿条不必要通知

🔐 权限请求更智能

当网站请求访问摄像头、位置等敏感权限时,Chrome 会结合以下因素动态调整提示方式:

  • 网站信誉与内容质量
  • 用户过往授权习惯

若判断用户大概率拒绝,系统将以非模态方式呈现请求,减少打扰。

🔄 一键修复泄露密码

Chrome 已长期提供密码泄露检测功能。接下来将引入 AI 辅助的“密码代理”机制:

  • 发现某账户密码外泄后,提示一键更改
  • 在支持的网站(如 Coursera、Spotify、Duolingo、H&M)上自动跳转并填写新密码

整个过程无需手动输入旧密码,兼顾安全性与便捷性。

技术背后的关键思路

Chrome 这一轮 AI 化并非简单调用大模型 API,而是围绕几个核心原则展开:

原则实现方式
上下文感知利用标签页、历史、当前页面内容构建用户意图图谱
渐进式自动化从问答起步,逐步过渡到任务代理,用户始终可控
本地优先Gemini Nano 支持设备端运行,敏感操作可在离线完成
隐私保障所有个性化功能均需显式授权,企业版额外提供数据隔离策略

尤其值得注意的是,移动端已支持通过长按电源键唤起 Gemini(Android),意味着 Chrome 的 AI 能力正融入操作系统层级。

使用现状与适用范围

功能平台地区语言
Gemini 浏览助手(桌面)Windows / Mac美国英语
地址栏上下文建议桌面 / 移动美国英语
AI 模式搜索(Omnibox)桌面即将在美国推出英语先行
移动端 Gemini 集成Android / iOS开发中待公布

未来几周内将逐步扩展至更多国家与语言环境。

浏览器正在变成“行动智能体”

Chrome 的这一系列更新,本质上是在重新定义浏览器的角色:

它不再是等待指令的工具,而是开始具备观察、推理、执行能力的协作者。

这种变化体现在三个层面:

  1. 信息层:帮你更快理解复杂内容;
  2. 操作层:替你完成重复性任务;
  3. 安全层:主动拦截风险,简化防御决策。

虽然目前多数功能仍处于早期阶段,尤其是代理式任务尚需验证稳定性与用户信任度,但方向已经明确:未来的浏览器,将是个人数字生活的智能调度中枢

© 版权声明

相关文章

暂无评论

none
暂无评论...