jjybzxw |
2025-07-13 18:20 |
根据新智元的报道,METR(Model Evaluation & Threat Research)的研究揭示了AI编程工具在实际开发中可能并不如预期那样提高效率。以下是一些关键点: 1. 效率降低:研究发现,对于熟悉代码库的资深开发者来说,使用AI编程工具(如GPT等)反而会降低编码效率,平均慢了19%。 2. 认知偏差:开发者普遍高估了AI工具的效率提升作用。实验前,他们预计AI能提升效率24%,即使实验结果显示效率降低,他们仍认为AI让他们快了20%。 3. 实验设计:METR的研究聚焦于资深开发者和他们熟悉的大型开源代码库。他们招募了16位资深开发者,从日常工作中收集了246个真实问题,并随机分配到允许或不允许使用AI的对照实验组。 4. 时间分配变化:使用AI时,开发者在主动编码和信息搜索上的时间减少,而在与AI交互、审查AI输出以及等待上的时间增加。 5. 可能的原因:METR提出了20个可能导致效率降低的因素,其中5个可能对结果有显著贡献,包括开发者对项目的熟悉度超过AI、对AI效能的过度乐观、项目复杂性导致AI代码质量差、任务定义和区分的问题等。 6. 基准测试与用户体验的差异:METR指出,基准测试关注的是模型在任务标准下的表现,而用户体验更多是主观感受。这两者与实际开发流程中是否更快是不同的问题。 7. AI编程工具的期待:未来,用户对AI编程工具的期待不仅是"刷分",而是真正能推进软件开发的速度和质量。同时,也需要考虑如何评估AI在真实开发部署中的能力,并设立监督机制保证项目安全。 8. 主观感受与客观效果:尽管研究显示使用AI编程工具可能降低效率,但许多参与者和研究者本人并不介意,因为"奴役"AI写代码虽然可能不更快,但一定更快乐。 总的来说,这项研究颠覆了我们对AI编程工具提高开发效率的传统认知。它提醒我们,在实际开发中,AI工具可能并不总是提高效率,有时甚至拖慢进度。我们需要更全面地评估AI在软件开发中的真实作用,并合理设定期望。同时,也要关注AI编程工具带来的其他价值,如提高工作乐趣等。我们应客观看待AI编程工具的优势和局限,并探索如何更好地利用它们来提升开发效率和质量。 |
|