OpenAI 在昨日(5 月 21 日)宣布对 Responses API 进行重大扩展,新增了多项关键能力:包括远程连接 MCP 服务器、图像生成、代码解释器集成、文件搜索优化等,旨在帮助开发者更高效地构建智能代理应用。

这是继 Responses API 发布以来的又一次重要迭代,标志着 OpenAI 正在为模型提供更强的“感知”与“执行”能力,让 AI 不再只是回答问题,而是能真正理解并操作现实世界的数据和工具。
什么是 Responses API?
Responses API 是 OpenAI 提供的一种状态化接口,它整合了多种高级功能,如网络搜索、文件搜索、计算机使用等,为开发者提供了更简洁、灵活的方式来与 OpenAI 模型进行交互。
目前该 API 已被数十万开发者广泛使用,累计处理了数万亿 token 请求,用于构建各种代理应用,例如:
- Zencoder 的编码助手
- Revi 的金融情报代理
- MagicSchool AI 的教育助手
这些应用都依赖于 Responses API 提供的实时信息获取能力来完成任务。

本次更新的核心亮点
✅ 1. 支持远程连接 MCP 服务器
本次更新中,最值得关注的功能是 远程 MCP 服务器支持。
MCP(Model Context Protocol)是一个开放协议,允许开发者将外部数据源或工具直接暴露给大语言模型。现在,通过 Responses API,开发者只需几行代码,即可让模型连接到以下热门服务:
- Cloudflare(网站安全)
- HubSpot(客户管理)
- Stripe / PayPal / Square(支付系统)
- Shopify(电商)
- Twilio(通信服务)
- Plaid(银行数据)
- Zapier(自动化流程)
这意味着你可以轻松打造一个能访问用户真实业务数据的 AI 助手,比如自动从 Stripe 获取账单数据、从 Shopify 同步订单、甚至通过 Zapier 实现跨平台自动化。
📌 OpenAI 已加入 MCP 指导委员会,未来将持续推动这一标准的发展。
✅ 2. 图像生成能力正式接入
开发者现在可以通过 Responses API 使用最新的图像生成模型 gpt-image-1,无需额外调用 Images API。
这项功能带来了几个显著提升:
- 流式传输预览:可实时查看图像生成过程。
- 多轮编辑支持:逐步调整图像细节,满足精细设计需求。
- 与文本推理无缝结合:模型可在推理过程中自动生成图像作为输出的一部分。
💰 图像生成费用:
- 文本输入:每百万 token 5 美元
- 图像输入:每百万 token 10 美元
- 图像输出:每百万 token 40 美元
- 缓存输入享 75% 折扣
✅ 3. Code Interpreter 能力增强
Code Interpreter 是一个强大的工具,适用于数据分析、数学建模、编程辅助等多个场景。
现在,开发者可以直接在 Responses API 中调用 Code Interpreter,并且:
- o3 和 o4-mini 模型在思维链中调用后,性能显著提升;
- 可用于图像推理、逻辑推导、复杂计算等任务;
- 支持多步骤交互,提升模型理解深度。
💰 Code Interpreter 每容器收费 0.03 美元。
✅ 4. 文件搜索能力全面优化
文件搜索功能也得到了进一步强化,包括:
- 支持从多个向量存储中检索内容;
- 支持数组属性过滤,提升查询精度;
- 更快响应速度,更适合大规模文档库。
💰 文件搜索定价:
- 每 GB 向量存储每天 0.10 美元
- 每千次调用 2.50 美元
面向企业的新功能
除了新工具,OpenAI 还为 Responses API 增加了三项企业级功能,以提升可靠性、可见性和隐私性:
🔁 后台模式(Background Mode)
某些复杂任务(如代码生成、数据分析)可能需要几分钟才能完成。现在开发者可以启用后台模式,异步启动任务,并通过轮询或事件流监控进度,避免超时问题。
🧠 推理摘要(Reasoning Traces)
Responses API 可以生成模型内部思考过程的自然语言摘要,便于调试、审计和优化用户体验。该功能免费提供。
🔒 加密推理项(Encrypted Reasoning Items)
对于符合零数据保留(ZDR)要求的企业客户,现在可以在多个请求之间重用推理项,而无需 OpenAI 存储任何中间数据。
这不仅提升了模型的智能程度,还减少了 token 使用量,提高了缓存命中率,从而降低成本和延迟。
支持的模型与可用性
此次更新现已上线,支持以下模型系列:
- GPT-4o 系列
- GPT-4.1 系列
- OpenAI o 系列(o1、o3、o3-mini、o4-mini)
其中,图像生成功能仅支持 o3 推理模型。
所有新功能均按原有计费方式收费,无额外附加费用。
总结
OpenAI 的这次更新,不只是增加了几个新功能,而是重新定义了 AI 智能体的能力边界。
现在,你可以:
- 让 AI 直接“看见”网页元素(借助图像生成 + DOM 分析);
- 让 AI “操作”真实世界的工具(通过 MCP 连接);
- 让 AI “思考”得更深更准(通过 Code Interpreter 和文件搜索);
- 构建更稳定、安全、高效的代理产品(通过后台模式、加密推理项)。
如果你正在开发 AI 应用,或者正在寻找一个强大而灵活的 API 来驱动你的代理系统,Responses API 的这次升级不容错过。