1月16日、Ars Technicaが「Wikipedia will share content with AI firms in new licensing deals」と題した記事を公開した。この記事では、ウィキメディア財団が大手AI企業各社と締結した、Wikipediaコンテンツの利用に関する新たなライセンス契約について詳しく紹介されている。
以下に、その内容を紹介する。
ウィキメディア財団は1月15日(現地時間)、Microsoft、Meta、Amazon、Perplexity、およびMistral AIの5社とライセンス契約を締結したことを発表した。この提携により、Microsoft CopilotやChatGPTなどのAIアシスタントを支える大規模言語モデル(LLM)のトレーニングにおいて、Wikipediaのコンテンツを商用利用するための枠組みが拡大されることとなる。
これまで、これらの企業の多くは許可を得ることなくWikipediaのデータをスクレイピング(自動収集)して利用してきた経緯がある。しかし、今回の契約締結により、主要なAI開発企業の多くが「Wikimedia Enterprise」プログラムに参加することとなった。このプログラムは、Wikipediaが保有する6,500万件以上の記事に対し、無料の公開APIよりも高速かつ大量のデータアクセスを可能にする商用サービスである。なお、今回の契約における具体的な財務条件は明らかにされていない。
今回の発表における主なポイントは以下の通りである。
- 参加企業の拡大: 2022年に既に契約を締結していたGoogleに加え、今回の5社の参入により、主要なビッグテック企業の多くが商用パートナーとなった。
- 中堅・中小企業の参画: Ecosia、Nomic、Pleias、ProRata、Reef Mediaといった比較的小規模な企業も同プログラムに参加している。
- 財政基盤の強化: 従来、運営費の多くを一般からの寄付に頼ってきた非営利団体であるウィキメディア財団にとって、この収益はインフラコストを補う重要な財源となる。
Wikimedia Enterpriseのプレジデントであるレーン・ベッカー氏は、Wikipediaがこれらテック企業の事業において不可欠な要素であることを強調している。同氏によれば、無料プラットフォームから商用プラットフォームへの移行を促すための適切な機能やサービスを特定するまでに時間を要したものの、現在では各パートナー企業がWikipediaの活動を継続的に支援する必要性を認識しているという。
詳細はWikipedia will share content with AI firms in new licensing dealsを参照していただきたい。