GitHub Copilot 引入“二号大脑”：实验性橡皮鸭模式让 Claude 性能狂飙 75%

早报3小时前发布小马良

4 0

在 AI 编程领域，单模型的“自我反思”正面临瓶颈。GitHub 近期在 Copilot CLI 中上线了一项代号为“橡皮鸭（Rubber Ducking）”的实验性功能。通过引入第二个异构 LLM 进行实时审计，该功能成功让 Claude Sonnet 在复杂任务中的表现逼近了更高阶的 Claude Opus，性能差距缩窄达 74.7%。

官方介绍：https://github.blog/ai-and-ml/github-copilot/github-copilot-cli-combines-model-families-for-a-second-opinion

GitHub Copilot 引入“二号大脑”：实验性橡皮鸭模式让 Claude 性能狂飙 75%

核心机制：跨家族的“逻辑对冲”

传统的 AI 智能体通常遵循“评估-计划-实施-测试”的循环，但其致命伤在于自证陷阱：模型往往无法识别由自身训练偏见导致的初始计划错误。

GitHub 的“橡皮鸭”方案通过引入不同家族的第二模型打破了这一僵局：

执行者： 用户选择的 Claude 系列模型（如 Sonnet）。
审查者（橡皮鸭）： 默认调用 GPT-5.4（实验模式专属）。

这种组合利用了不同模型背后的训练数据差异。当执行者陷入逻辑盲点时，拥有不同“世界观”的审查者会及时介入，纠正规划阶段的低效假设。

性能飞跃：专为难题而生

根据 GitHub 的研究数据，“橡皮鸭”模式并非在所有场景下都表现突出，但在以下重度开发场景中具有压倒性优势：

跨文件操作： 涉及 3 个或更多文件的关联逻辑修改。
长链路任务： 步骤超过 70 步的复杂重构或新功能开发。
逻辑僵局： 当 AI 智能体在同一错误中反复迭代（陷入死循环）时，“橡皮鸭”会被主动唤醒以打破逻辑环路。

自动化介入：在关键节点“踩刹车”

为了平衡性能与资源消耗，系统被设定在四个黄金节点自动调用“橡皮鸭”：

计划起草后（收益最高）： 在编码开始前，审查底层架构是否合理。
复杂实现后： 对大规模代码块进行逻辑复核。
测试编写后： 在执行测试脚本前，验证测试用例的覆盖完整性。
循环触发： 智能体自我修复失败时。

如何率先体验？

想要解锁这项 2026 年最强的编程黑科技，你需要完成以下配置：

环境要求： 安装最新版 GitHub Copilot CLI。
命令激活： 使用 /experimental 斜杠命令进入实验模式。
模型配置： 在模型选择器中指定 Claude 作为主模型。系统将自动调用 GPT-5.4 作为背景审查者。

早报 # GitHub Copilot

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

OpenAI Codex 推出多方案生成功能：开发者可一键获取多种编程解法

OpenAI Codex 推出多方案生成功能：开发者可一键获取多种编程解法

早报 # Codex # OpenAI

10个月前

01600

超过美英欧总和！中国在AI研究论文数量上全球第一

超过美英欧总和！中国在AI研究论文数量上全球第一

早报 # AI # 中国

9个月前

02070

Kimi 会员计费大升级：告别“按次计数”，迎来“统一额度”时代

Kimi 会员计费大升级：告别“按次计数”，迎来“统一额度”时代

1周前

03730

谷歌NotebookLM移动端来了！边走边问，AI帮你搞定所有看不懂的信息

谷歌NotebookLM移动端来了！边走边问，AI帮你搞定所有看不懂的信息

11个月前

01970

暂无评论

none

暂无评论...