AI技術(cursor pro, claude3.5/3.7)によってコーディング開発が19%遅くなっている?!
BRANK

2025/7/10に公開されたMETR論文:Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity の詳説記事です。執筆にはLLMの助けも借りていますが、著者はちゃんと論文を読んだ上で適宜修正して投稿しています。0. TL;DR熟練 OSS 開発者 16 名 × 246 件のリアル Issue を対象に RCT を実施。注:RCT(Randomized Controlled Trial): 介入(AI 使用可)と対照(AI 不可)を無作為に割り当て、因果効果を推定する実験手法。AI (Cursor Pro + Claude 3.5/3.7)の使用を許可すると平均 19 % 遅延。開発者自身は 24 % の時短を予測していたため、認知と現実が真逆だった。開発が遅くなっているのは外れ値ではなく分布全域で一貫。「大規模コード・暗黙知不足・生成品質の低さ」など 5 要因を有力視。1. 研究の目的と背景コーディング系ベンチマークは「自己完結タスク」「自動採点」のため 実務適合性を犠牲 にしている可能性がある。現場では「AI で速くなる」という 体感的・逸話的な報告 が多数。これらがどの程度信頼できるかを検証するのが本研究の目的。2. 実験デザイン項目詳細対象開発者⭐22 k 以上/100 万行超の OSS に複数年コミ…

zenn.dev
Related Topics: AI