Claude Codeはシステムプロンプトに不可視マーカーを仕込んでいた――カスタムAPIゲートウェイ利用者が知るべき事実
DRANK

6月30日、thereallo.devが「Claude Code Is Steganographically Marking Requests」と題した記事を公開した。Claude Code(バージョン2.1.196)のバイナリを解析したところ、APIリクエストのシステムプロンプト内に視覚的に判別不能なUnicode文字の差し替えという手法でマーカーを埋め込む処理が存在することが判明したという内容だ。コーディングエージェントはファイルシステム・シェル・gitへのフルアクセス権を持つ。開発者がその権限を許容しているのは、ツールのふるまいが「つまらないほど予測可能」であるという信頼があってこそだ。今回の発見が波紋を広げているのは技術的な被害の有無ではなく、その信頼の根拠そのものを揺るがすからだ。発端:プライバシー調査中の発見筆者はプライバシー上の観点からClaude Codeのバイナリを精査していた。ファイルシステムやシェルへのアクセス権を持つエージェントであれば、クライアントバイナリ自体も調査に値するという動機だ。調査の結果、バイナリ内にシステムプロンプトへ挿入される日付文字列を条件次第...

by @tf_official
Related Topics: AI Code Generator Security AI