7月2日、PYMNTSが「Courts Split on Whether AI Training Is Fair Use」と題した記事を公開した。AI学習データのフェアユース(公正利用)を巡る米国の司法・規制当局の判断が分裂している現状について詳しく紹介されている。
連邦判事の判断が2日間でまったく逆転
法廷での判断の割れ方が鮮明だ。サンフランシスコを拠点とする連邦地裁のウィリアム・アルサップ判事は、Concord Music Group v. Anthropic 関連審理においてAI学習を「典型的な変容的利用(quintessentially transformative)」と認定し、著作権法は「著作者を競合から守るものではない」と述べた。
ところがその2日後(6月27日)、同じサンフランシスコ連邦地裁のヴィンス・チャブリア判事は Kadrey v. Meta Platforms において、まったく逆の結論を示した。「AI学習の広範な実施は、人間の創作活動を支える経済的インセンティブを損なう恐れがある」として、フェアユース適用に否定的な見解を示した。
同じ地域・同じレベルの裁判所が2日間で正反対の判断を下す——これがAI著作権問題の法的不安定さを端的に示している。Anthropic、Google、Stability AIが関与するケースがさらに2026年中に審理予定だ。
規制の方向性も「入力」vs「出力」で割れている
司法の分裂は規制の方向性にもそのまま反映されている。
入力規制派の代表はカリフォルニア州とEUだ。カリフォルニア州の「Training Data Transparency Act」は2025年1月1日に施行済みで、AI開発者に対しデータソース、収集期間、著作権物・個人情報の有無を開示することを義務付けている。EUも「AIアクト」のもとで類似の開示テンプレートを公表しており、データソース、モダリティ、処理手法の明示を求めている。
出力規制派に最も近い立場を取るのはコロラド州だ。同州は2026年5月にAIアクトを改正し、規制の焦点を技術そのものではなく「AIが現実世界にもたらす結果」に移した。AIが重大な意思決定に実質的な影響を与え、それが不利な結果につながった場合、企業は当該消費者に通知しなければならない。法律事務所Mintzの分析によれば、「入力ではなく、結果のガバナンス」がこの法律の根本的なテーマだという。
GoogleはフェアユースとOpt-outを支持
この議論に対してGoogleは明確な立場を示した。Kent Walker(グローバル担当社長)が6月25日に発表した21ページのAIガバナンス文書の中で、公開ウェブデータへの学習は「変容的かつ非表現的な利用——美術館を歩きながら作品からインスピレーションを得る美術学生のようなもの——であり、フェアユースとして保護されるべきだ」と主張した。
著作権懸念については、「特定の画像やテキストが既存の作品を実際にコピーしているかどうか」に焦点を当てるべきであり、生成手段は問わないとしている。
コンテンツの学習利用を拒否したい出版社向けには、robots.txtのような機械可読なOpt-outの仕組みが適切な手段だとし、非公開コンテンツには有償契約で対応するよう提案している。
「Opt-outモデル」への反発
Googleが推奨するOpt-outアプローチには出版業界が強く反発している。Digital Content NextはCommon Crawl Foundation(AIモデルの学習に広く使われる大規模ウェブクロールデータを提供する非営利組織)に対し使用停止要求(cease-and-desist)を送付した。その中で「著作権法はOpt-outの制度ではない」と明示的に主張しており、Googleの立場を正面から否定している。
ペンシルベニア州立大学ディキンソン法科大学院のダリル・リム教授は、出力ベースの規制だけでは捉えきれない構造的問題を指摘する。
「フロンティアモデルの学習には、著作権物を含む可能性のある膨大なデータリポジトリを取り込む必要がある。フロンティアモデルを学習できる企業はごく一握りで、それらの企業がコンピュート、データ、クラウドインフラ、流通チャネルを同時に支配している」
この市場集中という構造的問題は、出力規制だけでは対処できないとリム教授は述べている。
開発者への実務的含意
OpenAIとAnthropicはカリフォルニア州の開示法に基づく初期申告の中で、学習データに著作権物が含まれている可能性を認めたが、詳細の開示は限定的にとどまった。大規模データスクレイピングを巡る法的問題が未解決のまま残っていることが、その背景にある。
AIシステムを開発・運用するエンジニアにとって、この状況はいくつかの具体的なリスク管理上の論点を突きつけている。
- Training Data Transparency Act(カリフォルニア州)への対応:同法はすでに施行済みであり、カリフォルニア州のユーザーを対象とするAIサービスを提供している場合、学習データのソース・収集期間・著作権物の有無について開示義務が生じる可能性がある。自社モデルが対象に該当するかどうか、法務部門と連携して確認しておくことが望ましい。
robots.txtおよびOpt-out対応の記録保全:Googleが推奨するOpt-outモデルの妥当性は司法の場でも争われている。クロール時点でのrobots.txtの内容や、Opt-out要求への対応履歴を記録・保管しておくことが、訴訟リスクへの備えとして有効になりうる。- 学習データの来歴(データプロベナンス)管理:Kadrey v. Meta のような訴訟では、学習データに著作権物が含まれていたかどうかが争点になっている。データセットの出所・ライセンス条件・スクレイピング元を文書化しておくことが、今後の法的防御において重要性を増す。
- コロラド州AIアクト改正への注意:出力規制の強化は、モデルそのものではなく推論時の意思決定フローや通知設計にも影響を及ぼしうる。ハイリスクな意思決定(融資・採用・医療など)に関与するシステムを運用している場合は、通知要件の充足状況を確認しておく必要がある。
司法判断が確定するまでの間、学習データの法的クリアランスとデータプロベナンスの文書化が、最低限のリスクヘッジとして機能する。
詳細はCourts Split on Whether AI Training Is Fair Useを参照していただきたい。