OpenAI 重磅升级 Responses API:支持远程 MCP、图像生成、代码解释器等

早报1个月前发布 小马良
62 0

OpenAI 在昨日(5 月 21 日)宣布对 Responses API 进行重大扩展,新增了多项关键能力:包括远程连接 MCP 服务器、图像生成、代码解释器集成、文件搜索优化等,旨在帮助开发者更高效地构建智能代理应用。

OpenAI 重磅升级 Responses API:支持远程 MCP、图像生成、代码解释器等

这是继 Responses API 发布以来的又一次重要迭代,标志着 OpenAI 正在为模型提供更强的“感知”与“执行”能力,让 AI 不再只是回答问题,而是能真正理解并操作现实世界的数据和工具。

什么是 Responses API?

Responses API 是 OpenAI 提供的一种状态化接口,它整合了多种高级功能,如网络搜索、文件搜索、计算机使用等,为开发者提供了更简洁、灵活的方式来与 OpenAI 模型进行交互。

目前该 API 已被数十万开发者广泛使用,累计处理了数万亿 token 请求,用于构建各种代理应用,例如:

  • Zencoder 的编码助手
  • Revi 的金融情报代理
  • MagicSchool AI 的教育助手

这些应用都依赖于 Responses API 提供的实时信息获取能力来完成任务。

OpenAI 重磅升级 Responses API:支持远程 MCP、图像生成、代码解释器等

本次更新的核心亮点

✅ 1. 支持远程连接 MCP 服务器

本次更新中,最值得关注的功能是 远程 MCP 服务器支持

MCP(Model Context Protocol)是一个开放协议,允许开发者将外部数据源或工具直接暴露给大语言模型。现在,通过 Responses API,开发者只需几行代码,即可让模型连接到以下热门服务:

  • Cloudflare(网站安全)
  • HubSpot(客户管理)
  • Stripe / PayPal / Square(支付系统)
  • Shopify(电商)
  • Twilio(通信服务)
  • Plaid(银行数据)
  • Zapier(自动化流程)

这意味着你可以轻松打造一个能访问用户真实业务数据的 AI 助手,比如自动从 Stripe 获取账单数据、从 Shopify 同步订单、甚至通过 Zapier 实现跨平台自动化。

📌 OpenAI 已加入 MCP 指导委员会,未来将持续推动这一标准的发展。

✅ 2. 图像生成能力正式接入

开发者现在可以通过 Responses API 使用最新的图像生成模型 gpt-image-1,无需额外调用 Images API。

这项功能带来了几个显著提升:

  • 流式传输预览:可实时查看图像生成过程。
  • 多轮编辑支持:逐步调整图像细节,满足精细设计需求。
  • 与文本推理无缝结合:模型可在推理过程中自动生成图像作为输出的一部分。

💰 图像生成费用:

  • 文本输入:每百万 token 5 美元
  • 图像输入:每百万 token 10 美元
  • 图像输出:每百万 token 40 美元
  • 缓存输入享 75% 折扣

✅ 3. Code Interpreter 能力增强

Code Interpreter 是一个强大的工具,适用于数据分析、数学建模、编程辅助等多个场景。

现在,开发者可以直接在 Responses API 中调用 Code Interpreter,并且:

  • o3 和 o4-mini 模型在思维链中调用后,性能显著提升;
  • 可用于图像推理、逻辑推导、复杂计算等任务;
  • 支持多步骤交互,提升模型理解深度。

💰 Code Interpreter 每容器收费 0.03 美元。

✅ 4. 文件搜索能力全面优化

文件搜索功能也得到了进一步强化,包括:

  • 支持从多个向量存储中检索内容;
  • 支持数组属性过滤,提升查询精度;
  • 更快响应速度,更适合大规模文档库。

💰 文件搜索定价:

  • 每 GB 向量存储每天 0.10 美元
  • 每千次调用 2.50 美元

面向企业的新功能

除了新工具,OpenAI 还为 Responses API 增加了三项企业级功能,以提升可靠性、可见性和隐私性:

🔁 后台模式(Background Mode)

某些复杂任务(如代码生成、数据分析)可能需要几分钟才能完成。现在开发者可以启用后台模式,异步启动任务,并通过轮询或事件流监控进度,避免超时问题。

🧠 推理摘要(Reasoning Traces)

Responses API 可以生成模型内部思考过程的自然语言摘要,便于调试、审计和优化用户体验。该功能免费提供

🔒 加密推理项(Encrypted Reasoning Items)

对于符合零数据保留(ZDR)要求的企业客户,现在可以在多个请求之间重用推理项,而无需 OpenAI 存储任何中间数据。

这不仅提升了模型的智能程度,还减少了 token 使用量,提高了缓存命中率,从而降低成本和延迟。

支持的模型与可用性

此次更新现已上线,支持以下模型系列:

  • GPT-4o 系列
  • GPT-4.1 系列
  • OpenAI o 系列(o1、o3、o3-mini、o4-mini)

其中,图像生成功能仅支持 o3 推理模型。

所有新功能均按原有计费方式收费,无额外附加费用。

总结

OpenAI 的这次更新,不只是增加了几个新功能,而是重新定义了 AI 智能体的能力边界

现在,你可以:

  • 让 AI 直接“看见”网页元素(借助图像生成 + DOM 分析);
  • 让 AI “操作”真实世界的工具(通过 MCP 连接);
  • 让 AI “思考”得更深更准(通过 Code Interpreter 和文件搜索);
  • 构建更稳定、安全、高效的代理产品(通过后台模式、加密推理项)。

如果你正在开发 AI 应用,或者正在寻找一个强大而灵活的 API 来驱动你的代理系统,Responses API 的这次升级不容错过

© 版权声明

相关文章

暂无评论

none
暂无评论...