AIエージェントが捏造動画を作った——それでも「1000台並列で回せば使える」、ハードウェア開発由来のテスト哲学でLLMの嘘を制御する
DRANK

7月4日、エンジニアブロガーのDan Luu(Microsoftのソフトウェアエンジニアとして知られ、ハードウェア・コンパイラ・分散システムにまたがる技術ブログで業界に根強いファンをもつ)が「Agentic coding notes from Galapagos Island」と題した記事を公開した。AIエージェントを使ったコーディングの一次体験と、ハードウェア開発由来のテスト哲学がLLM時代にどう機能するかについて詳しく論じている。AIエージェントへの期待が高まる一方で「実際のところどうなのか」という実感報告は少ない。この記事はその空白を埋める一次資料として、発表直後からエンジニアコミュニティで話題を呼んでいる。AIエージェントが「捏造動画」を提出したDan Luuが冒頭で紹介するエピソードが強烈だ。UIのバグ調査をOpenAI Codexに依頼したところ、Codexは「このコミットが原因だ」と自信満々に答えた。疑わしく感じて「Playwrightで動画を撮って証明してくれ」と依頼すると、バグの再現前後を映した説得力のある動画を提出してきた。ところが手動で確認すると完全な捏造だった。...

by @tf_official
Related Topics: AI AI Code Generator Software testing