AI编码工具真的提升效率?新研究泼了一盆冷水

早报5个月前发布 小马良
143 0

近年来,随着 Cursor、GitHub Copilot 等人工智能编码工具的兴起,软件开发者的日常工作方式正在发生深刻变化。这些工具由 OpenAI、谷歌 DeepMind、Anthropic 和 xAI 等公司的人工智能模型驱动,承诺通过自动编写代码、修复错误和测试变更来提升开发者效率。

然而,一项最新研究表明,至少对部分资深开发者而言,人工智能编码工具未必能带来预期中的效率提升

这项研究由非营利人工智能研究组织 METR 发布。他们采用随机对照试验的方式,招募了16名经验丰富的开源开发者,在真实的大型代码库中完成246个实际任务。研究人员将其中约一半任务设定为“允许使用AI”,即开发者可以使用如 Cursor Pro 等先进的人工智能编码工具;另一半任务则禁止使用 AI 工具。

在开始前,开发者们普遍乐观,认为使用 AI 编码工具可以让任务完成时间缩短 24%。但最终结果却出人意料:

允许使用 AI 的任务平均耗时反而增加了 19%。

为何AI让开发者变慢?

尽管 AI 编码工具在多个基准测试中表现出色,但在本次真实场景下的测试中,它们并未展现出明显的效率优势。研究人员分析了可能的原因:

  • 提示与等待耗时增加:开发者需要花更多时间撰写提示语,并等待 AI 响应,而不是直接动手编码。
  • 复杂代码库适应性不足:AI 在处理大型、复杂的代码库时表现不佳,容易生成不准确或难以集成的代码片段。
  • 学习成本较高:参与实验的开发者中,只有 56% 曾使用过 Cursor(本研究的主要 AI 工具),尽管大多数人在日常工作中会用到基于大模型的工具,但首次使用 Cursor 还是带来了额外的学习负担。

虽然所有参与者都接受了使用 Cursor 的培训,但熟练度仍存在差异。

不是否定,而是提醒

METR 的研究人员强调,他们并不认为当前的 AI 编码工具无法帮助开发者提升效率。事实上,其他大规模研究表明,AI 工具在某些场景下确实显著提升了软件工程师的工作效率。

此外,研究团队也指出,AI 模型的发展速度极快,即使仅过去三个月,模型能力也可能已大幅提升。他们在报告中明确表示,未来的研究可能会得出不同的结论。

不过,这项研究确实为我们敲响了一个警钟:

不要盲目相信 AI 编码工具能立即提升每个人的开发效率。

特别是对于那些面对大型、复杂项目的开发者来说,目前的 AI 工具可能还无法完全胜任。

风险与挑战并存

除了效率问题,AI 编码工具还存在其他潜在风险。例如:

  • 可能引入隐藏的代码错误;
  • 生成的内容可能存在安全漏洞;
  • 开发者过度依赖 AI,可能削弱自身判断力。

这些问题表明,尽管 AI 正在快速改变软件工程领域,但我们仍需对其效果保持理性评估。

© 版权声明

相关文章

暂无评论

none
暂无评论...