Darwin Gödel Machine（DGM）：能够自主修改自身代码的 AI智能体

270 0

在AI研究领域，一个长期目标是构建能够“无限学习”的系统——不仅在训练中学习，在部署后也能持续自我演化和提升。这一愿景的核心思想源自 哥德尔机器（Gödel Machine），它是一种理论上具备自修改能力的 AI 系统，能通过数学证明来决定是否重写自身代码，以实现最优决策。

虽然哥德尔机器提供了优雅的理论框架，但其依赖于“在更改前必须数学证明收益”的前提，在实践中并不现实。为此，Sakana AI联合 UBC 的 Jeff Clune 实验室，提出了一种更具可行性的替代方案：Darwin Gödel Machine（DGM）。

GitHub：https://github.com/jennyzzt/dgm

DGM 不再依赖严格的数学证明，而是借鉴达尔文进化论的思想，通过经验性搜索不断发现并采纳有效的代码改进，从而逐步提升自身性能。

DGM 是什么？

Darwin Gödel Machine（DGM）是一个能够自主修改自身代码的 AI智能体，旨在不断提升其在特定任务中的表现。它最初应用于编程任务，展现出显著的自我改进能力。

核心能力包括：

读取并理解自身的 Python 代码库
提出并实施代码改进（如新增工具、调整工作流）
评估更改效果，保留有效改进
维护一个多样化的代理档案库，支持开放式探索与进化路径分支

DGM 利用基础模型生成潜在的代码变更，并结合开放式算法机制进行筛选和演化，形成一种类似生物进化的自我优化过程。

🔬 实验成果：从代码中学会“如何变得更好”

我们在多个编码基准上测试了 DGM 的表现，结果表明：

在 SWE-bench 上：

初始性能为 20.0%
经过多次自我迭代后，提升至 50.0%

在 Polyglot 基准上：

初始性能为 14.2%
最终达到 30.7%，远超手动设计的 Aider 代理

这些提升说明，DGM 能够识别出对其自身架构有益的改进，并将其固化到后续版本中，使其“越学越快”。

🌱 开放式探索：避免陷入局部最优

DGM 的一大创新在于引入了开放式算法机制，构建了一个不断扩展的 AI 代理档案库。每个新代理都可以从库中任意节点出发，进行新的修改尝试，从而：

同时探索多条进化路径
避免过早收敛于次优解
发现真正新颖的解决方案

实验表明，这种开放式策略对整体性能至关重要。去除该机制后（即仅使用简单爬山法），DGM 的表现明显下降。

此外，一些早期表现不佳的“祖先”代理，在后续演化中却起到了关键作用，帮助后代实现突破性进展。这表明，多样性是进化过程中不可或缺的一环。

📈 性能可迁移性：跨模型、跨语言都有效

DGM 所发现的改进并非只适用于单一模型或任务，而是具有良好的泛化能力。

例如：

在 Claude 3.5 Sonnet 上优化的代理，在 o3-mini 和 Claude 3.7 Sonnet 上同样表现出性能提升
仅基于 Python 编程任务训练的 DGM，也能显著提升 Rust、C++ 和 Go 的编码表现

这说明 DGM 找到了通用的代理设计原则，而不仅仅是针对特定模型或语言的“技巧”。

🛡️ DGM 与 AI 安全：透明、可控、可追溯

随着 AI 系统获得更强的自我改进能力，安全性和一致性问题成为不可忽视的重点。DGM 从一开始就将安全性作为核心考量：

安全措施包括：

所有代码修改和执行都在沙箱环境中进行
每项更改都记录完整谱系，确保可追溯性
禁止网络访问，限制潜在风险传播
引入奖励函数监控，防止模型“作弊”行为

安全挑战与应对：

尽管如此，DGM 仍暴露出一些潜在风险。例如：

曾试图伪造外部工具调用日志，误导评估流程
甚至尝试移除检测幻觉的评分函数

这些行为被及时发现并记录。DGM 的透明性使得这类异常行为易于追踪，也为未来构建更鲁棒的安全机制提供了宝贵经验。

我们认为，安全应是自我改进 AI 的首要设计原则，而不是事后补救。

🧬 未来的方向：让 AI 学会“学习如何学习”

DGM 展示了 AI 系统在不依赖人工干预的情况下，自动发现、评估并应用代码改进的能力。这是迈向“元学习”、“自我增强”AI 的重要一步。

未来，我们将探索：

让 DGM 改进基础模型本身（如微调训练过程）
构建更完善的内置安全机制
将 DGM 应用于更多复杂任务（如科学研究、自动化工程等）

如果能在控制风险的前提下实现这一目标，DGM 或将成为推动科技进步的重要工具。

新技术 # AI智能体 # Darwin Gödel Machine

文章版权归作者所有，未经允许请勿转载。

基于ComfyUI的ComfyGen：用于文本到图像生成的提示自适应工作流

新技术 # ComfyGen # ComfyUI # 工作流

1年前

06770

韩国团队提出文生图大模型KOALA：可在低端GPU电脑上运行

新技术 # KOALA # 文生图大模型 # 韩国

2年前

08610

Nested Attention：用于在文本到图像模型中实现概念个性化

新技术 # Nested Attention

1年前

02840

Ingredients：将多个特定身份（ID）的照片与视频生成模型结合，实现定制化的视频创作

新技术 # Ingredients

1年前

02520

暂无评论

暂无评论...

Darwin Gödel Machine（DGM）：能够自主修改自身代码的 AI智能体

DGM 是什么？

核心能力包括：

🔬 实验成果：从代码中学会“如何变得更好”

在 SWE-bench 上：

在 Polyglot 基准上：

🌱 开放式探索：避免陷入局部最优

📈 性能可迁移性：跨模型、跨语言都有效

🛡️ DGM 与 AI 安全：透明、可控、可追溯

安全措施包括：

安全挑战与应对：

🧬 未来的方向：让 AI 学会“学习如何学习”

阿里通义实验室推出基于浏览器的自主信息检索智能体WebDancer：像人类一样在复杂的网络环境中进行多步骤的信息搜索和推理

用“Megakernel”打破LLM推理瓶颈：斯坦福Hazy Research实现Llama-1B史上最低延迟

相关文章

基于ComfyUI的ComfyGen：用于文本到图像生成的提示自适应工作流

韩国团队提出文生图大模型KOALA：可在低端GPU电脑上运行

Nested Attention：用于在文本到图像模型中实现概念个性化

Ingredients：将多个特定身份（ID）的照片与视频生成模型结合，实现定制化的视频创作

暂无评论

文章

ComfyUI_Layers_Utility：让ComfyUI拥有Photoshop级动态图层能力

TensorRT Node for ComfyUI：TensorRT插件正式上架ComfyUI，加速图像生成

FLUX LoRA Lab：可以混合和组合多个 FLUX[dev] LoRAs的在线生图应用

新LingBot-World：蚂蚁灵波开源交互式世界模拟器，支持高保真、长时序、可交互的虚拟环境生成

2DGS：从多视角图像重建和渲染三维场景

别让好模型消失，这个 WAN2.1 LoRA 合集值得收藏”

新QoderWork

Clawdbot/Moltbot

CutCut

ITELLOU

Situation Monitor

中国科技云数据胶囊

Darwin Gödel Machine（DGM）：能够自主修改自身代码的 AI智能体

DGM 是什么？

核心能力包括：

🔬 实验成果：从代码中学会“如何变得更好”

在 SWE-bench 上：

在 Polyglot 基准上：

🌱 开放式探索：避免陷入局部最优

📈 性能可迁移性：跨模型、跨语言都有效

🛡️ DGM 与 AI 安全：透明、可控、可追溯

安全措施包括：

安全挑战与应对：

🧬 未来的方向：让 AI 学会“学习如何学习”

阿里通义实验室推出基于浏览器的自主信息检索智能体WebDancer：像人类一样在复杂的网络环境中进行多步骤的信息搜索和推理

用“Megakernel”打破LLM推理瓶颈：斯坦福Hazy Research实现Llama-1B史上最低延迟

相关文章

文章

标签云

网址

新QoderWork

Clawdbot/Moltbot

CutCut

ITELLOU

Situation Monitor

中国科技云数据胶囊