OpenAI 重磅升级 Responses API：支持远程 MCP、图像生成、代码解释器等

早报10个月前发布小马良

210 0

OpenAI 在昨日（5 月 21 日）宣布对 Responses API 进行重大扩展，新增了多项关键能力：包括远程连接 MCP 服务器、图像生成、代码解释器集成、文件搜索优化等，旨在帮助开发者更高效地构建智能代理应用。

这是继 Responses API 发布以来的又一次重要迭代，标志着 OpenAI 正在为模型提供更强的“感知”与“执行”能力，让 AI 不再只是回答问题，而是能真正理解并操作现实世界的数据和工具。

什么是 Responses API？

Responses API 是 OpenAI 提供的一种状态化接口，它整合了多种高级功能，如网络搜索、文件搜索、计算机使用等，为开发者提供了更简洁、灵活的方式来与 OpenAI 模型进行交互。

目前该 API 已被数十万开发者广泛使用，累计处理了数万亿 token 请求，用于构建各种代理应用，例如：

Zencoder 的编码助手
Revi 的金融情报代理
MagicSchool AI 的教育助手

这些应用都依赖于 Responses API 提供的实时信息获取能力来完成任务。

本次更新的核心亮点

✅ 1. 支持远程连接 MCP 服务器

本次更新中，最值得关注的功能是 远程 MCP 服务器支持。

MCP（Model Context Protocol）是一个开放协议，允许开发者将外部数据源或工具直接暴露给大语言模型。现在，通过 Responses API，开发者只需几行代码，即可让模型连接到以下热门服务：

Cloudflare（网站安全）
HubSpot（客户管理）
Stripe / PayPal / Square（支付系统）
Shopify（电商）
Twilio（通信服务）
Plaid（银行数据）
Zapier（自动化流程）

这意味着你可以轻松打造一个能访问用户真实业务数据的 AI 助手，比如自动从 Stripe 获取账单数据、从 Shopify 同步订单、甚至通过 Zapier 实现跨平台自动化。

📌 OpenAI 已加入 MCP 指导委员会，未来将持续推动这一标准的发展。

✅ 2. 图像生成能力正式接入

开发者现在可以通过 Responses API 使用最新的图像生成模型 gpt-image-1，无需额外调用 Images API。

这项功能带来了几个显著提升：

流式传输预览：可实时查看图像生成过程。
多轮编辑支持：逐步调整图像细节，满足精细设计需求。
与文本推理无缝结合：模型可在推理过程中自动生成图像作为输出的一部分。

💰 图像生成费用：
文本输入：每百万 token 5 美元
图像输入：每百万 token 10 美元
图像输出：每百万 token 40 美元
缓存输入享 75% 折扣

✅ 3. Code Interpreter 能力增强

Code Interpreter 是一个强大的工具，适用于数据分析、数学建模、编程辅助等多个场景。

现在，开发者可以直接在 Responses API 中调用 Code Interpreter，并且：

o3 和 o4-mini 模型在思维链中调用后，性能显著提升；
可用于图像推理、逻辑推导、复杂计算等任务；
支持多步骤交互，提升模型理解深度。

💰 Code Interpreter 每容器收费 0.03 美元。

✅ 4. 文件搜索能力全面优化

文件搜索功能也得到了进一步强化，包括：

支持从多个向量存储中检索内容；
支持数组属性过滤，提升查询精度；
更快响应速度，更适合大规模文档库。

💰 文件搜索定价：
每 GB 向量存储每天 0.10 美元
每千次调用 2.50 美元

面向企业的新功能

除了新工具，OpenAI 还为 Responses API 增加了三项企业级功能，以提升可靠性、可见性和隐私性：

🔁 后台模式（Background Mode）

某些复杂任务（如代码生成、数据分析）可能需要几分钟才能完成。现在开发者可以启用后台模式，异步启动任务，并通过轮询或事件流监控进度，避免超时问题。

🧠 推理摘要（Reasoning Traces）

Responses API 可以生成模型内部思考过程的自然语言摘要，便于调试、审计和优化用户体验。该功能免费提供。

🔒 加密推理项（Encrypted Reasoning Items）

对于符合零数据保留（ZDR）要求的企业客户，现在可以在多个请求之间重用推理项，而无需 OpenAI 存储任何中间数据。

这不仅提升了模型的智能程度，还减少了 token 使用量，提高了缓存命中率，从而降低成本和延迟。

支持的模型与可用性

此次更新现已上线，支持以下模型系列：

GPT-4o 系列
GPT-4.1 系列
OpenAI o 系列（o1、o3、o3-mini、o4-mini）

其中，图像生成功能仅支持 o3 推理模型。

所有新功能均按原有计费方式收费，无额外附加费用。

总结

OpenAI 的这次更新，不只是增加了几个新功能，而是重新定义了 AI 智能体的能力边界。

现在，你可以：

让 AI 直接“看见”网页元素（借助图像生成 + DOM 分析）；
让 AI “操作”真实世界的工具（通过 MCP 连接）；
让 AI “思考”得更深更准（通过 Code Interpreter 和文件搜索）；
构建更稳定、安全、高效的代理产品（通过后台模式、加密推理项）。

如果你正在开发 AI 应用，或者正在寻找一个强大而灵活的 API 来驱动你的代理系统，Responses API 的这次升级不容错过。

早报 # OpenAI # Responses API

文章版权归作者所有，未经允许请勿转载。

OpenAI 收购金融科技应用 Roi，加码个性化消费级 AI

早报 # OpenAI # Roi

5个月前

0870

谷歌推出 Gemini 实时 AI 视频功能，让智能助手的交互体验更加直观和便捷

早报 # Gemini # 谷歌

12个月前

02730

亚马逊推出 Kindle Translate：为独立作者提供免费 AI 翻译工具

早报 # Kindle Translate # 亚马逊

4个月前

0400

ChatGPT 即将支持第三方集成，OpenAI 正在测试“自定义连接”功能

早报 # ChatGPT # MCP

10个月前

03890

暂无评论

暂无评论...

OpenAI 重磅升级 Responses API：支持远程 MCP、图像生成、代码解释器等

什么是 Responses API？

本次更新的核心亮点

✅ 1. 支持远程连接 MCP 服务器

✅ 2. 图像生成能力正式接入

✅ 3. Code Interpreter 能力增强

✅ 4. 文件搜索能力全面优化

面向企业的新功能

🔁 后台模式（Background Mode）

🧠 推理摘要（Reasoning Traces）

🔒 加密推理项（Encrypted Reasoning Items）

支持的模型与可用性

总结

萨姆·奥尔特曼与乔纳森·艾维联手打造设计公司 io被OpenAI收购了

英伟达与微软携手，加速 RTX AI PC 的发展

相关文章

OpenAI 收购金融科技应用 Roi，加码个性化消费级 AI

谷歌推出 Gemini 实时 AI 视频功能，让智能助手的交互体验更加直观和便捷

亚马逊推出 Kindle Translate：为独立作者提供免费 AI 翻译工具

ChatGPT 即将支持第三方集成，OpenAI 正在测试“自定义连接”功能

暂无评论

文章

新Chrome 146 原生支持 WebMCP：Agent 操作网页的“去后端化”革命，却陷“鸡生蛋”困局

新AMD 官方完整教程：Windows 本地部署 OpenClaw AI 智能体（双硬件方案）

Claude Code 新增 /loop：用自然语言定义“定时任务”，打造你的私人自动化代理

Ollama 0.9版本推出“思考功能”控制选项：启用或禁用模型推理过程

LTX-2.3 提示词终极指南：从“抽卡”到“导演”，解锁原生视频生成的掌控力

黑森林实验室发布 FLUX.2 [klein] 9B-KV：多参考图像编辑速度飙升 2.5 倍

S.H.I.T

ITELLOU

Joker of Academics（小丑学术期刊）

ArkClaw

新360 安全龙虾

waoo

OpenAI 重磅升级 Responses API：支持远程 MCP、图像生成、代码解释器等

什么是 Responses API？

本次更新的核心亮点

✅ 1. 支持远程连接 MCP 服务器

✅ 2. 图像生成能力正式接入

✅ 3. Code Interpreter 能力增强

✅ 4. 文件搜索能力全面优化

面向企业的新功能

🔁 后台模式（Background Mode）

🧠 推理摘要（Reasoning Traces）

🔒 加密推理项（Encrypted Reasoning Items）

支持的模型与可用性

总结

萨姆·奥尔特曼与乔纳森·艾维联手打造设计公司 io被OpenAI收购了

英伟达与微软携手，加速 RTX AI PC 的发展

相关文章

文章

标签云

网址

S.H.I.T

ITELLOU

Joker of Academics（小丑学术期刊 ）

ArkClaw

新360 安全龙虾

waoo

Joker of Academics（小丑学术期刊）