OpenAI 正式在 ChatGPT 中推出其迄今为止最强大的通用AI智能体(ChatGPT Agent),标志着 ChatGPT 从“回答问题”迈向“执行任务”的重大跨越。
这款新工具可以代表用户完成多种基于计算机的任务,例如:
- 🗓️ 自动管理日历安排
- 📊 生成可编辑的演示文稿与幻灯片
- 💻 自动运行代码并返回结果
- 🛒 根据提示规划并购买食材
- 🔍 从多个网站提取信息并生成简洁报告
这不仅是 ChatGPT 的一次重大升级,也是 AI 智能体技术在通用任务处理领域迈出的重要一步。
功能亮点:从“思考”到“行动”
ChatGPT智能体整合了OpenAI此前多个实验性智能体工具的能力,包括:
- Operator:具备在网页上点击、导航的能力
- Deep Research:能从数十个网站中提取信息并生成总结报告
用户只需通过自然语言指令与 ChatGPT 交互,即可触发智能体执行复杂任务。例如:
“帮我为四人计划并购买制作日式早餐所需的食材。”
“分析三家竞争对手,创建一份PPT报告。”
这些任务要求AI智能体具备解析网页、制定计划、调用工具等能力,远超以往的问答式AI。
使用方式:订阅用户即可体验
从本周四开始,ChatGPT Pro、Plus 和 Team 订阅用户可以在 ChatGPT 的工具下拉菜单中选择 “智能体模式(Agent Mode)” 来启用该功能。
智能体模式下,ChatGPT 可访问多种外部工具和API,包括:
- Gmail、GitHub 等应用连接器
- 终端命令行(用于运行代码)
- 网络搜索与数据抓取能力
这使得 ChatGPT 不再只是“助手”,而更像是一个能够自主完成任务的“数字员工”。
性能提升:超越现有模型,表现亮眼
OpenAI 表示,ChatGPT智能体的底层模型在多项基准测试中表现出色:
| 测试项目 | ChatGPT智能体 | 之前模型(o3/o4-mini) |
|---|---|---|
| Humanity’s Last Exam (pass@1) | 41.6% | ~20% |
| FrontierMath(使用工具) | 27.4% | 6.3% |
特别是在涉及复杂推理和工具调用的场景中,新模型展现出显著优势。
安全优先:OpenAI的“风险控制”策略
由于 AI 智能体具备执行任务的能力,其潜在滥用风险也更高。为此,OpenAI 在 ChatGPT 智能体的设计中将安全性置于首位。
在安全报告中,OpenAI 指出该智能体在生物、化学等敏感领域具备“高能力”,这意味着它有可能被用于“放大现有严重危害途径”。虽然目前并无直接证据表明该模型被恶意利用,但出于谨慎考虑,OpenAI 引入了多项新安全机制:
- 🛡️ 实时监控系统:对每个输入进行分类判断
- 🧬 生物安全过滤器:若提示内容涉及生物学,系统将进行二次审查
- ⚠️ 限制高风险操作:防止智能体生成可能引发安全问题的内容
未来展望:AI智能体能否真正“落地”?
尽管 ChatGPT 智能体在技术层面取得了显著突破,但其在现实世界中的表现仍需时间检验。过去几年,包括谷歌、Perplexity 在内的多家公司都曾推出 AI 智能体产品,但在处理复杂任务时仍显脆弱。
OpenAI 表示,ChatGPT 智能体是其迈向“真正智能智能体”的重要一步,未来将继续优化其执行能力和安全性,使其在更多实际场景中发挥作用。















