OpenAI重磅升级ChatGPT:推出新一代通用AI智能体ChatGPT Agent,能执行任务、写代码、做报告

早报5个月前发布 小马良
163 0

OpenAI 正式在 ChatGPT 中推出其迄今为止最强大的通用AI智能体ChatGPT Agent,标志着 ChatGPT 从“回答问题”迈向“执行任务”的重大跨越。

这款新工具可以代表用户完成多种基于计算机的任务,例如:

  • 🗓️ 自动管理日历安排
  • 📊 生成可编辑的演示文稿与幻灯片
  • 💻 自动运行代码并返回结果
  • 🛒 根据提示规划并购买食材
  • 🔍 从多个网站提取信息并生成简洁报告

这不仅是 ChatGPT 的一次重大升级,也是 AI 智能体技术在通用任务处理领域迈出的重要一步。

功能亮点:从“思考”到“行动”

ChatGPT智能体整合了OpenAI此前多个实验性智能体工具的能力,包括:

  • Operator:具备在网页上点击、导航的能力
  • Deep Research:能从数十个网站中提取信息并生成总结报告

用户只需通过自然语言指令与 ChatGPT 交互,即可触发智能体执行复杂任务。例如:

“帮我为四人计划并购买制作日式早餐所需的食材。”
“分析三家竞争对手,创建一份PPT报告。”

这些任务要求AI智能体具备解析网页、制定计划、调用工具等能力,远超以往的问答式AI。

使用方式:订阅用户即可体验

从本周四开始,ChatGPT Pro、Plus 和 Team 订阅用户可以在 ChatGPT 的工具下拉菜单中选择 “智能体模式(Agent Mode)” 来启用该功能。

智能体模式下,ChatGPT 可访问多种外部工具和API,包括:

  • Gmail、GitHub 等应用连接器
  • 终端命令行(用于运行代码)
  • 网络搜索与数据抓取能力

这使得 ChatGPT 不再只是“助手”,而更像是一个能够自主完成任务的“数字员工”。

性能提升:超越现有模型,表现亮眼

OpenAI 表示,ChatGPT智能体的底层模型在多项基准测试中表现出色:

测试项目ChatGPT智能体之前模型(o3/o4-mini)
Humanity’s Last Exam (pass@1)41.6%~20%
FrontierMath(使用工具)27.4%6.3%

特别是在涉及复杂推理和工具调用的场景中,新模型展现出显著优势。

安全优先:OpenAI的“风险控制”策略

由于 AI 智能体具备执行任务的能力,其潜在滥用风险也更高。为此,OpenAI 在 ChatGPT 智能体的设计中将安全性置于首位

在安全报告中,OpenAI 指出该智能体在生物、化学等敏感领域具备“高能力”,这意味着它有可能被用于“放大现有严重危害途径”。虽然目前并无直接证据表明该模型被恶意利用,但出于谨慎考虑,OpenAI 引入了多项新安全机制:

  • 🛡️ 实时监控系统:对每个输入进行分类判断
  • 🧬 生物安全过滤器:若提示内容涉及生物学,系统将进行二次审查
  • ⚠️ 限制高风险操作:防止智能体生成可能引发安全问题的内容

未来展望:AI智能体能否真正“落地”

尽管 ChatGPT 智能体在技术层面取得了显著突破,但其在现实世界中的表现仍需时间检验。过去几年,包括谷歌、Perplexity 在内的多家公司都曾推出 AI 智能体产品,但在处理复杂任务时仍显脆弱。

OpenAI 表示,ChatGPT 智能体是其迈向“真正智能智能体”的重要一步,未来将继续优化其执行能力和安全性,使其在更多实际场景中发挥作用。

© 版权声明

相关文章

暂无评论

none
暂无评论...