Gemini Android 重大更新:支持 Uber/外卖自动下单,多步骤任务自动化正式落地

早报2小时前发布 小马良
2 0

谷歌周三宣布了对 Android 平台上 Gemini AI 的一系列重要更新。其中最引人注目的,是 Gemini 现在能够自动执行复杂的多步骤任务,例如直接帮你叫一辆 Uber 或订购外卖。这标志着 AI 助手从单纯的“问答工具”向真正的“行动智能体(Action Agent)”迈出了关键一步。

Gemini Android 重大更新:支持 Uber/外卖自动下单,多步骤任务自动化正式落地

核心功能:多步骤任务自动化

此次更新允许用户将待办事项清单直接交给 Gemini 处理。虽然目前仍处于测试阶段,且支持的应用范围有限,但其展现出的潜力巨大。

  • 支持场景:初期主要覆盖 食品配送杂货购买 和 拼车出行 三大类精选应用。
  • 工作原理:用户只需发出自然语言指令(如“帮我叫一辆去机场的 Uber”),Gemini 会自动规划步骤、打开相应应用、填写信息并完成下单。
  • 安全机制
    • 明确授权:未经用户明确命令,自动化绝不会启动。
    • 实时可控:任务执行过程中,用户可实时观察进度,并随时手动停止。
    • 沙箱隔离:所有自动化操作均在手机内的安全虚拟窗口中运行,仅能访问指定的有限应用,无法触碰设备上的其他敏感数据。

注意:该功能目前仅限 美国 和 韩国 地区,且仅支持 Pixel 10/10 Pro 及 三星 Galaxy S26 系列设备上的 Gemini 应用。

Gemini Android 重大更新:支持 Uber/外卖自动下单,多步骤任务自动化正式落地

其他两大亮点更新

除了自动化任务,谷歌还推出了两项实用的功能改进:

1. “圈定即搜” (Circle to Search) 升级

  • 全屏幕识别:此前该功能主要针对单个物体,现在升级为能识别屏幕上的所有物品
  • 应用场景:你可以圈选一套复杂的穿搭,Gemini 会分别识别其中的衣物、鞋子和配饰,并提供相关购买链接或详细信息;或者圈选一组商品,获取整体评价。

2. 电话诈骗检测扩展

  • 全覆盖防御:诈骗检测功能进一步扩展。
    • 短信检测:利用端侧 Gemini 模型,在 美国、加拿大、英国 的 Pixel 10 系列上实时识别诈骗短信。
    • 通话保护:该功能即将登陆 美国 的三星 Galaxy S26 系列,帮助用户拦截欺诈电话。
Gemini Android 重大更新:支持 Uber/外卖自动下单,多步骤任务自动化正式落地

行业背景:手机端 AI 智能体竞赛

谷歌的这一举措顺应了 AI 自动化的大趋势:

  • ChatGPT:已允许用户创建定时任务或基于特定触发条件的智能体,处理各类计算机任务。
  • Anthropic Claude:通过 Cowork 等项目,将 AI 能力延伸至非编码的日常文件与任务管理。
  • OpenClaw:近期走红的开源工具,展示了 AI 管理日常复杂任务的巨大潜力。

相比之下,谷歌的优势在于原生系统集成。Gemini 直接深入 Android 底层,能够更无缝地调用系统级功能和第三方应用,提供更流畅的自动化体验。

硬件与生态策略

此次更新再次凸显了谷歌“软硬结合”的策略:

  • 旗舰独占:新功能优先服务于最新的 Pixel 10 和 Galaxy S26 系列,以此推动高端设备的销售。
  • 定期迭代:通过 Android 系统更新和 Pixel Drop 计划,谷歌正以高频节奏向生态系统推送 AI 新特性。

与此同时,竞争对手苹果在 AI 领域的步伐显得稍显迟缓。其备受期待的 AI 驱动 Siri 更新再次被推迟至今年晚些时候,这为谷歌在 Android 阵营确立 AI 领先地位提供了宝贵的时间窗口。

© 版权声明

相关文章

暂无评论

none
暂无评论...