依存ライブラリのLLMコード排除に100時間——git-annex作者が記録した1489行のコミットと著作権リスクの現実
DRANK

7月2日、joey hessが「no LLM code in dependencies」と題した記事を公開した。分散ファイル管理ツールgit-annex(Gitリポジトリ外の大容量ファイルをバージョン管理するHaskell製ツール)の作者として知られるhessが、依存ライブラリからLLM生成コードを排除するために約100時間を費やした経緯と、その過程で露わになった品質問題を詳しく記録している。「依存ツリー全体を継続的にレビューする必要がある——というのが今のプログラミングの現実らしい」。hessはそう皮肉を込めて書く。OSSのメンテナにとって、LLM生成コードの混入は単なる品質の問題にとどまらず、ライセンスリスクや信頼性の崩壊につながりうる新たな脅威だ。実際に見つかった問題の深刻さhessが精査した記録はプロジェクトのWikiページにまとめられている。そこで見つかった具体的な問題は以下の通りだ。

by @tf_official
Related Topics: AI Code Generator AI Security