谷歌今日宣布为其 Gemini API 带来一项关键更新,旨在彻底简化 AI 智能体(Agent)工作流的构建过程。
此次更新的核心在于统一工具支持:开发者现在可以在单次 API 调用中,将谷歌的内置工具(如搜索、代码执行等)与自定义函数(专有业务逻辑)无缝组合。这一改变消除了以往需要手动编排不同工具的繁琐步骤,显著降低了自动化工作流的复杂性和延迟。

核心突破:混合调用,一次搞定
在此之前,开发者若想同时利用谷歌强大的内置能力(如实时搜索、地图数据)和企业内部的私有 API(如查询库存、处理订单),往往需要编写复杂的中间件来协调两者的调用顺序和数据传递。
现在,借助 Gemini 3 模型系列,这一切变得异常简单:
- 混合编排:在同一个请求中定义内置工具和自定义函数,模型会自动判断何时调用哪个工具,无需人工干预流程。
- 无缝集成:公共数据源与专有后端功能在同一上下文中流畅协作,真正实现“内外打通”。
- 即时可用:该功能已全面开放给所有能访问 Gemini 3 模型的开发者。

技术亮点:更聪明、更可控
除了混合调用,此次更新还引入了两项底层技术增强,极大提升了多步骤任务的可靠性:
1. 跨工具上下文循环 (Cross-Tool Context Looping)
- 记忆延续:模型现在能够在多个步骤中保留并利用先前工具调用的输出。
- 场景示例:先调用搜索工具找到某公司财报,再自动将财报数据传入自定义函数进行财务比率分析,最后调用绘图工具生成图表。整个过程无需开发者手动传递中间数据,模型自动完成闭环。
2. 唯一响应 ID (Unique Response IDs)
- 精准追溯:每一次工具调用都会生成一个唯一的 ID。
- 调试利器:在并行执行多个函数或处理复杂长链路任务时,开发者可以通过 ID 精准追踪每一步的执行状态和结果,快速定位错误源头,大幅提升调试效率。
为什么这很重要?
对于构建企业级 AI 应用的团队而言,这次更新解决了两个长期痛点:
- 降低门槛:不再需要资深工程师专门负责“胶水代码”的编写,初级开发者也能构建复杂的多工具智能体。
- 提升稳定性:减少了人为编排带来的逻辑漏洞和延迟,让 AI 工作流在生产环境中更加稳健可靠。
谷歌表示,这些改进是基于开发者社区的广泛反馈做出的。随着 AI 应用从“简单问答”向“复杂执行”演进,提供强大且易用的工具编排能力已成为平台竞争的关键。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















