AI编码工具真的提升效率？新研究泼了一盆冷水

早报8个月前发布小马良

149 0

近年来，随着 Cursor、GitHub Copilot 等人工智能编码工具的兴起，软件开发者的日常工作方式正在发生深刻变化。这些工具由 OpenAI、谷歌 DeepMind、Anthropic 和 xAI 等公司的人工智能模型驱动，承诺通过自动编写代码、修复错误和测试变更来提升开发者效率。

然而，一项最新研究表明，至少对部分资深开发者而言，人工智能编码工具未必能带来预期中的效率提升。

这项研究由非营利人工智能研究组织 METR 发布。他们采用随机对照试验的方式，招募了16名经验丰富的开源开发者，在真实的大型代码库中完成246个实际任务。研究人员将其中约一半任务设定为“允许使用AI”，即开发者可以使用如 Cursor Pro 等先进的人工智能编码工具；另一半任务则禁止使用 AI 工具。

在开始前，开发者们普遍乐观，认为使用 AI 编码工具可以让任务完成时间缩短 24%。但最终结果却出人意料：

允许使用 AI 的任务平均耗时反而增加了 19%。

为何AI让开发者变慢？

尽管 AI 编码工具在多个基准测试中表现出色，但在本次真实场景下的测试中，它们并未展现出明显的效率优势。研究人员分析了可能的原因：

提示与等待耗时增加：开发者需要花更多时间撰写提示语，并等待 AI 响应，而不是直接动手编码。
复杂代码库适应性不足：AI 在处理大型、复杂的代码库时表现不佳，容易生成不准确或难以集成的代码片段。
学习成本较高：参与实验的开发者中，只有 56% 曾使用过 Cursor（本研究的主要 AI 工具），尽管大多数人在日常工作中会用到基于大模型的工具，但首次使用 Cursor 还是带来了额外的学习负担。

虽然所有参与者都接受了使用 Cursor 的培训，但熟练度仍存在差异。

不是否定，而是提醒

METR 的研究人员强调，他们并不认为当前的 AI 编码工具无法帮助开发者提升效率。事实上，其他大规模研究表明，AI 工具在某些场景下确实显著提升了软件工程师的工作效率。

此外，研究团队也指出，AI 模型的发展速度极快，即使仅过去三个月，模型能力也可能已大幅提升。他们在报告中明确表示，未来的研究可能会得出不同的结论。

不过，这项研究确实为我们敲响了一个警钟：

不要盲目相信 AI 编码工具能立即提升每个人的开发效率。

特别是对于那些面对大型、复杂项目的开发者来说，目前的 AI 工具可能还无法完全胜任。

风险与挑战并存

除了效率问题，AI 编码工具还存在其他潜在风险。例如：

可能引入隐藏的代码错误；
生成的内容可能存在安全漏洞；
开发者过度依赖 AI，可能削弱自身判断力。

这些问题表明，尽管 AI 正在快速改变软件工程领域，但我们仍需对其效果保持理性评估。

早报 # AI编程

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

上线一年半，个性化AI伴侣应用 Dot宣布关停，用户可导出数据至10月5日

上线一年半，个性化AI伴侣应用 Dot宣布关停，用户可导出数据至10月5日

早报 # AI伴侣 # Dot

6个月前

03840

Anthropic 推出 Claude 教育版，进军高等教育领域

Anthropic 推出 Claude 教育版，进军高等教育领域

早报 # Anthropic # Claude 教育版

11个月前

02170

DeepSeek 宣布将于下周开源五个经过实战检验的代码库

DeepSeek 宣布将于下周开源五个经过实战检验的代码库

早报 # DeepSeek

1年前

02530

谷歌发布通用商务协议（UCP）：让 AI 智能体真正“促成交易”

谷歌发布通用商务协议（UCP）：让 AI 智能体真正“促成交易”

早报 # UCP # 谷歌 # 通用商务协议

2个月前

0760

暂无评论

none

暂无评论...