Claude Codeがシステムプロンプトに「見えないUnicode文字」でユーザー環境を分類している可能性——バイナリ解析で浮上した実装の不透明さ
DRANK

7月1日、thereallo.devが「Claude Code Is Steganographically Marking Requests」と題した記事を公開した。著者・組織名は明示されていないが、プライバシー調査を目的としたバイナリ解析を行う独立系リサーチャーによるものとみられる。記事では、Claude Codeがシステムプロンプト内に視覚的に判別困難なUnicode文字を埋め込み、ユーザー環境の情報をステガノグラフィ的に分類している可能性が、コードレベルの根拠とともに詳述されている。なお、本記事執筆時点でAnthropicによる公式見解や反応は確認されておらず、以下の内容はあくまで個人研究者によるリバースエンジニアリングの結果に基づくものである点を念頭に置いていただきたい。

by @tf_official
Related Topics: AI Security AI Code Generator