6月27日、Eric Hal Schwartzが「Anthropic says Alibaba may have copied Claude just by asking questions」と題した記事を公開した。AnthropicがAlibabaのQwen AIラボに関連するグループによる大規模な「モデル蒸留」疑惑をめぐり、米国議会に書簡を送った件について詳しく紹介されている。なお、本記事で紹介する数字・事実関係はいずれもAnthropicによる議会書簡に基づく一方的な主張であり、Alibaba側の公式反論や独立した第三者検証はまだ行われていない点に留意されたい。
2880万件超のやり取りで「質問だけでAIを模倣」した疑い
Anthropicの主張によると、Alibabaおよびそのグループとされる組織が使用したのは約2万5000件の不正アカウントであり、それらを通じて2880万件超のやり取りをClaudeと行ったとされる。目的は、Claudeのソフトウェアエンジニアリング機能やエージェント型推論機能に関する詳細な情報を抽出することだとAnthropicは主張している。
ここで問題になる手法がモデル蒸留(model distillation)だ。これは大きなモデルの出力を「教師データ」として別のモデルを学習させる技術で、AI業界では小型・高速モデルの開発などで広く活用されている(Google Cloud: モデル蒸留の解説)。通常は自社モデルに対して自社内で行うものだが、Anthropicが主張するのは、競合他社が自社モデルを無断で"教師"として利用したというケースだ。
元記事はこの構図を書籍に例えて説明している。
「本を一度も読まずに著者に100万の質問をぶつければ、本の内容をほぼ把握できるかもしれない」
コードや学習データに一切アクセスせずとも、大量の質問と回答を積み重ねるだけでモデルの挙動を再現できる——これがAnthropicの懸念の核心である。
LLMの構造的な脆弱性
大規模言語モデル(LLM)は「質問に答えること」を前提として設計されている。つまり、ユーザーとのあらゆるやり取りが、モデルの内部動作についての情報を多少なりとも外部に漏らす構造になっている。
通常のスケールであれば問題にならない。しかし数千万件規模になれば、それは逆エンジニアリングに相当しうる、というのが今回の訴えの論理だ。現状、Anthropicが主張する「大量質問による模倣」を技術的に完全に防ぐ手段は明確ではなく、AI開発者全体にとって共通のリスクとなりうる。
Anthropicは利用規約において、自動化ツールによる大規模なデータ収集や、他のモデル学習を目的とした出力の利用を明示的に禁止している。今回の主張は、こうした規約違反の疑いとして議会に問題提起されたものだ。
Anthropicにとっても「前例がある話」
今回の主張はAlibabaが初めてではない。Anthropicは今年すでにDeepSeek、Moonshot AI、MiniMaxに対しても同様の不正蒸留疑惑を申し立てている。OpenAIも自社モデルが同様の被害を受けた可能性を表明しており、DeepSeekの急成長をめぐっては米国内でも広く議論された(OpenAIによるDeepSeek疑惑の報道:BBC)。
また、皮肉な構図も指摘されている。膨大な公開データや著作物を学習に用いてきたAI企業が、今度は自社モデルを「保護すべき知的財産」として主張する側に回っているという点だ。この矛盾はAnthropic固有の問題ではなく、業界全体が抱える構造的な問いでもある。
業界構造への影響
Anthropicは米国議会に対し、この問題への早期対応を求めている。その根拠はシンプルだ。
- フロンティアモデルの開発には数十億ドル規模の投資が必要
- それが質問の積み重ねで模倣されるなら、開発インセンティブが崩れる
- 「独自研究の成果」と「既存モデルの模倣」を外部から判別することが困難になる
この点について補足すると、モデル蒸留による模倣品は、元モデルの学習コストを大幅に回避できるため、研究開発への先行投資に対する経済的正当性を根本から問い直すことになる。現行の著作権法やトレードシークレット法がLLMの出力に対してどこまで適用できるかは法的に未整備な領域であり、Anthropicが議会に立法的な対応を求めている背景にはこうした法的空白がある。(※編集部の考察)
Alibaba側は現時点で公式コメントを出しておらず、Anthropicの主張に対する独立した検証も行われていない。訴えの真偽がどうあれ、「次のAI競争は最強モデルを作ることではなく、自社モデルへの質問から守ることになるかもしれない」という問いを業界に投げかけた点で、この一件の意味は大きい。
詳細はAnthropic says Alibaba may have copied Claude just by asking questionsを参照していただきたい。