OpenAI重磅升级ChatGPT：推出新一代通用AI智能体ChatGPT Agent，能执行任务、写代码、做报告

早报9个月前发布小马良

208 0

OpenAI 正式在 ChatGPT 中推出其迄今为止最强大的通用AI智能体（ChatGPT Agent），标志着 ChatGPT 从“回答问题”迈向“执行任务”的重大跨越。

这款新工具可以代表用户完成多种基于计算机的任务，例如：

🗓️ 自动管理日历安排
📊 生成可编辑的演示文稿与幻灯片
💻 自动运行代码并返回结果
🛒 根据提示规划并购买食材
🔍 从多个网站提取信息并生成简洁报告

这不仅是 ChatGPT 的一次重大升级，也是 AI 智能体技术在通用任务处理领域迈出的重要一步。

功能亮点：从“思考”到“行动”

ChatGPT智能体整合了OpenAI此前多个实验性智能体工具的能力，包括：

Operator：具备在网页上点击、导航的能力
Deep Research：能从数十个网站中提取信息并生成总结报告

用户只需通过自然语言指令与 ChatGPT 交互，即可触发智能体执行复杂任务。例如：

“帮我为四人计划并购买制作日式早餐所需的食材。”
“分析三家竞争对手，创建一份PPT报告。”

这些任务要求AI智能体具备解析网页、制定计划、调用工具等能力，远超以往的问答式AI。

使用方式：订阅用户即可体验

从本周四开始，ChatGPT Pro、Plus 和 Team 订阅用户可以在 ChatGPT 的工具下拉菜单中选择 “智能体模式（Agent Mode）” 来启用该功能。

智能体模式下，ChatGPT 可访问多种外部工具和API，包括：

Gmail、GitHub 等应用连接器
终端命令行（用于运行代码）
网络搜索与数据抓取能力

这使得 ChatGPT 不再只是“助手”，而更像是一个能够自主完成任务的“数字员工”。

性能提升：超越现有模型，表现亮眼

OpenAI 表示，ChatGPT智能体的底层模型在多项基准测试中表现出色：

测试项目	ChatGPT智能体	之前模型（o3/o4-mini）
Humanity’s Last Exam (pass@1)	41.6%	~20%
FrontierMath（使用工具）	27.4%	6.3%

特别是在涉及复杂推理和工具调用的场景中，新模型展现出显著优势。

安全优先：OpenAI的“风险控制”策略

由于 AI 智能体具备执行任务的能力，其潜在滥用风险也更高。为此，OpenAI 在 ChatGPT 智能体的设计中将安全性置于首位。

在安全报告中，OpenAI 指出该智能体在生物、化学等敏感领域具备“高能力”，这意味着它有可能被用于“放大现有严重危害途径”。虽然目前并无直接证据表明该模型被恶意利用，但出于谨慎考虑，OpenAI 引入了多项新安全机制：

🛡️ 实时监控系统：对每个输入进行分类判断
🧬 生物安全过滤器：若提示内容涉及生物学，系统将进行二次审查
⚠️ 限制高风险操作：防止智能体生成可能引发安全问题的内容

未来展望：AI智能体能否真正“落地”？

尽管 ChatGPT 智能体在技术层面取得了显著突破，但其在现实世界中的表现仍需时间检验。过去几年，包括谷歌、Perplexity 在内的多家公司都曾推出 AI 智能体产品，但在处理复杂任务时仍显脆弱。

OpenAI 表示，ChatGPT 智能体是其迈向“真正智能智能体”的重要一步，未来将继续优化其执行能力和安全性，使其在更多实际场景中发挥作用。

文章版权归作者所有，未经允许请勿转载。

Moltbook 数据库大规模泄露：2 万+ 邮箱、150 万 API 密钥、475 万条记录全裸奔

早报 # Moltbook # 数据库

2个月前

0470

日本乐天“自研”大模型翻车：Rakuten AI 3.0 被实锤为 DeepSeek V3“换皮”

早报 # Deepseek V3 # Rakuten AI 3.0 # 日本乐天

2周前

0790

谷歌 Gemini在行业基准测试中赶超 ChatGPT，OpenAI 宣布进入“红色警戒”状态

早报 # Gemini # OpenAI

4个月前

0330

迪士尼与NBC环球起诉AI图像生成平台Midjourney严重侵犯版权

早报 # AI图像生成平台 # Midjourney # NBC环球

10个月前

01880

暂无评论

暂无评论...

OpenAI重磅升级ChatGPT：推出新一代通用AI智能体ChatGPT Agent，能执行任务、写代码、做报告

功能亮点：从“思考”到“行动”

使用方式：订阅用户即可体验

性能提升：超越现有模型，表现亮眼

安全优先：OpenAI的“风险控制”策略

未来展望：AI智能体能否真正“落地”？

谷歌Discover页面上线AI新闻摘要功能，出版商担忧流量进一步流失

Mistral升级Le Chat：推出“深度研究”模式，全面提升生产力

相关文章

Moltbook 数据库大规模泄露：2 万+ 邮箱、150 万 API 密钥、475 万条记录全裸奔

日本乐天“自研”大模型翻车：Rakuten AI 3.0 被实锤为 DeepSeek V3“换皮”

谷歌 Gemini在行业基准测试中赶超 ChatGPT，OpenAI 宣布进入“红色警戒”状态

迪士尼与NBC环球起诉AI图像生成平台Midjourney严重侵犯版权

暂无评论

文章

ComfyUI-NAG 插件正式上线：为扩散模型带来高效负向引导能力

如何在谷歌Veo 3中实现图生视频（I2V）的角色一致性？实用技巧分享

Google Veo 3 指南：如何用高级提示打造电影级 AI 视频

谷歌 Veo 3 再次爆火：四类高扩展性提示词，直出广告级短片

限时免费体验一周！小米凌晨官宣三款大模型：MiMo-V2 系列正式亮相，1M 上下文比肩 Opus 4.6

小米 Xiaomi miclaw 封测扩容：新增小米 15/Ultra/MIX Flip2 等机型，国内首个手机端“龙虾”Agent 来了

S.H.I.T

ITELLOU

waoo

抓虾吧

Meshy

朱雀大模型检测

OpenAI重磅升级ChatGPT：推出新一代通用AI智能体ChatGPT Agent，能执行任务、写代码、做报告

功能亮点：从“思考”到“行动”

使用方式：订阅用户即可体验

性能提升：超越现有模型，表现亮眼

安全优先：OpenAI的“风险控制”策略

未来展望：AI智能体能否真正“落地”？

谷歌Discover页面上线AI新闻摘要功能，出版商担忧流量进一步流失

Mistral升级Le Chat：推出“深度研究”模式，全面提升生产力

相关文章

文章

标签云

网址

S.H.I.T

ITELLOU

waoo

抓虾吧

Meshy

朱雀大模型检测