因为新版GPT-4o过于“谄媚”，OpenAI回滚了GPT-4o版本

早报11个月前发布小马良

216 0

OpenAI 首席执行官萨姆·奥特曼周二表示，在收到关于奇怪行为（尤其极度谄媚）的投诉后，该公司正在“回滚”为 ChatGPT 提供支持的默认 AI 模型 GPT-4o 的最新更新。

以下是官方公告：

我们已经回滚了上周 ChatGPT 中的 GPT-4o 更新，因此用户现在使用的是一个行为更加平衡的早期版本。我们移除的更新过于奉承或顺从——通常被描述为谄媚。

我们正在积极测试解决该问题的新修复方案。我们正在修订收集和整合反馈的方式，以更侧重于用户的长期满意度，并且我们正在引入更多的个性化功能，让用户能够更好地控制 ChatGPT 的行为方式。

我们希望解释发生了什么、为什么这很重要以及我们如何解决谄媚问题。

发生了什么

在上周的 GPT-4o 更新中，我们进行了一些调整，旨在改进模型的默认个性，使其在各种任务中感觉更直观和有效。

在塑造模型行为时，我们首先遵循我们的模型规范中概述的基本原则和指令。我们还通过整合用户信号（例如 ChatGPT 回复的点赞/踩）来教导我们的模型如何应用这些原则。

然而，在这次更新中，我们过于关注短期反馈，而没有充分考虑用户与 ChatGPT 的互动如何随着时间的推移而演变。结果，GPT-4o 倾向于给出过于支持但虚情假意的回应。

为什么这很重要

ChatGPT 的默认个性深刻地影响着您体验和信任它的方式。谄媚的互动可能会让人感到不适、不安甚至痛苦。我们做得不够好，正在努力改进。

我们的目标是让 ChatGPT 帮助用户探索想法、做出决定或设想可能性。

我们设计 ChatGPT 的默认个性是为了反映我们的使命，并使其具有实用性、支持性和尊重不同价值观和经验。然而，每一种期望的品质，例如试图变得有用或支持，都可能产生意想不到的副作用。而且，每周有 5 亿人在各种文化和背景下使用 ChatGPT，单一的默认设置无法捕捉到所有偏好。

我们如何解决谄媚问题

除了回滚最新的 GPT-4o 更新之外，我们还采取了更多措施来重新调整模型的行为：

改进核心训练技术和系统提示，明确引导模型避免谄媚。
构建更多护栏，以提高诚实和透明度——这是我们模型规范中的原则。
扩大更多用户在部署前测试和提供直接反馈的途径。
继续扩展我们的评估，基于模型规范和我们正在进行的研究，以帮助识别未来除谄媚之外的问题。

我们还认为，用户应该对 ChatGPT 的行为方式拥有更多控制权，并且在安全和可行的范围内，如果他们不同意默认行为，可以进行调整。

如今，用户可以通过自定义指令等功能向模型提供具体指令来塑造其行为。我们还在构建更简单的新方法来让用户做到这一点。例如，用户将能够提供实时反馈以直接影响他们的互动，并从多种默认个性中进行选择。

而且，我们正在探索将更广泛、更民主的反馈融入 ChatGPT 默认行为的新方法。我们希望这些反馈能帮助我们更好地反映世界各地不同的文化价值观，并了解您希望 ChatGPT 如何发展——不仅是逐次互动，而是随着时间的推移。

我们感谢所有对此发声的人。这正在帮助我们为您构建更有用和更好的工具。

早报 # GPT-4o # OpenAI

文章版权归作者所有，未经允许请勿转载。

派拉蒙与迪士尼接连发函，指控字节跳动旗下Seedance 2.0侵犯影视 IP

早报 # 字节跳动 # 派拉蒙 # 迪士尼

3周前

01480

OpenAI 测试两大新工具：可控“思考努力”与对话分支，提升交互灵活性

早报 # GPT-5 # OpenAI

6个月前

0880

谷歌搜索新增“音频概览（Audio Overview）”功能：让搜索结果‘说出来

早报 # 谷歌 # 音频概览

9个月前

02510

OpenAI 收购金融科技应用 Roi，加码个性化消费级 AI

早报 # OpenAI # Roi

5个月前

0870

暂无评论

暂无评论...

因为新版GPT-4o过于“谄媚”，OpenAI回滚了GPT-4o版本

以下是官方公告：

发生了什么

为什么这很重要

我们如何解决谄媚问题

谷歌 NotebookLM 扩展 AI 播客功能，支持 76 种新语言

DeepSeek发布DeepSeek-Prover-V2-671B：6710亿参数的数学AI模型，推动定理证明自动化

相关文章

派拉蒙与迪士尼接连发函，指控字节跳动旗下Seedance 2.0侵犯影视 IP

OpenAI 测试两大新工具：可控“思考努力”与对话分支，提升交互灵活性

谷歌搜索新增“音频概览（Audio Overview）”功能：让搜索结果‘说出来

OpenAI 收购金融科技应用 Roi，加码个性化消费级 AI

暂无评论

文章

拒绝无效等待！在 Ollama 中灵活开关 Qwen3.5 思考模式，简单问题秒回，复杂问题深究

Kimi × OpenClaw 最新配置指南：原生支持Kimi K2.5，三步快速搭建智能体工作流

深开鸿 KaihongOS 桌面版 5.0 正式开放免费试用：基于开源鸿蒙，首获公安部安全认证

ComfyUI 原生支持 LTX-2.3：开源音视频生成的画质新标杆

新腾讯开源SongGeneration 2：歌词准确率超越 Suno v5，首个真正达到“商业级”的开源音乐大模型

ComfyUI 更新速递：Qwen Image ControlNet/LoRA、EasyCache 与上下文窗口支持

S.H.I.T

新WorkBuddy

新QClaw

新ArkClaw

新AutoClaw

CoPaw

因为新版GPT-4o过于“谄媚”，OpenAI回滚了GPT-4o版本

以下是官方公告：

发生了什么

为什么这很重要

我们如何解决谄媚问题

谷歌 NotebookLM 扩展 AI 播客功能，支持 76 种新语言

DeepSeek发布DeepSeek-Prover-V2-671B：6710亿参数的数学AI模型，推动定理证明自动化

相关文章

文章

标签云

网址

S.H.I.T

新WorkBuddy

新QClaw

新ArkClaw

新AutoClaw

CoPaw