「コードを読むだけ」のAIレビューを超えて——Greptileが実行層を組み込んだ「TREX」の設計思想
DRANK

6月17日、AIコードレビューサービスを提供するGreptileが「Building TREX: Code Execution and Artifact Generation for AI Code Review」と題した記事を公開した。コードレビューのパイプラインに実行層を組み込んだシステム「TREX」の設計と実装について、その背景にある問題意識から具体的なアーキテクチャの判断まで詳しく解説されている。GitHubのPRに対してAIがコメントを付けるツールは、ここ数年で急速に普及した。CodeRabbitやGitHub Copilotをはじめ、多くのサービスがLLMを使ってdiffを読み、潜在的な問題を指摘する。Greptile自身もその一つだ。しかしこうしたツールには共通の限界がある——コードを「読む」だけで、「動かす」ことはしない。特定の状態遷移を経て初めて発現するロジックエラー、ページロード後にだけ起きるUI崩れ、実際のリクエストがないと再現しない競合状態——こうした問題はdiffをどれだけ丁寧に読んでも見逃す。TREX(Test, Run, Executeの略)は、その限界へ...

by @tf_official
Related Topics: AI Code Generator AI GitHub