4月20日、技術系メディア「Where's Your Ed At」が「Exclusive: Microsoft To Shift GitHub Copilot Users To Token-Based Billing, Reduce Rate Limits」と題した記事を公開した。
GitHub Copilotの運営コストが半年で倍増し、Microsoftがトークンベース課金への移行を計画していることが内部文書で明らかになった。現在月10~39ドルの定額制で提供されているサービスが、実際の利用量に応じた従量課金制に変わることで、AI開発補助ツールの「格安利用」時代が終わりを告げようとしている。
赤字補填が限界に — 運営コストが年初から倍増
GitHub Copilotは2021年のリリース以来、開発者の生産性向上ツールとして急速に普及し、2024年時点で180万人以上の有料ユーザーを獲得している。しかし、内部文書によると週間運営コストは1月以降ほぼ倍増しており、現在の定額課金モデルでは採算が取れない状況だ。
現在のGitHub Copilotは「リクエスト数」による制限を採用している:
- Pro(月10ドル): 月300リクエスト
- Pro+(月39ドル): 月1,500リクエスト
しかし、この仕組みでは実際のAI処理コストを反映できていない。例えば、高性能なAIモデルの処理には入力・出力トークンあたり数セントから数十セントのコストがかかるが、現在の定額制ではMicrosoftが大幅な赤字を補填している状況だ。
新規登録停止と利用制限の強化
コスト抑制策として、以下の措置が予定されている:
新規登録の一時停止
- GitHub Copilot Pro(月10ドル)
- **GitHub Copilot Pro+**(月39ドル)
- GitHub Copilot Student(無料版)
高コストモデルの段階的廃止
最もコストの高いAnthropic社のOpusファミリーへのアクセスが制限される:
- Pro: 全てのOpusモデルへのアクセスを完全削除
- Pro+: 最新版のOpusのみに統一(旧バージョンを削除)
料金倍率の大幅変更
各AIモデルには「プレミアムリクエスト倍率」が設定され、実質的な利用コストが決まる:
- 軽量モデル: 0.33倍(1回の利用で0.33リクエストを消費)
- 標準モデル: 1倍
- 高性能モデル: 3~7.5倍(1回の利用で最大7.5リクエストを消費)
開発者コミュニティではこの変更への懸念が広がっており、特にヘビーユーザーからは「実質的な大幅値上げ」との声が上がっている。
AI業界全体で「補助金時代」が終焉
この動きはMicrosoft単独の問題ではない。AI業界全体で実際のコンピュートコストより安い価格でサービスを提供する「補助金時代」が終わりつつある。
Anthropicも企業顧客をトークンベース課金に移行済みで、競合のCursorやCodeiumなども同様の課題を抱えている。業界全体での価格正常化が進んでいる背景には以下の要因がある:
コスト上昇の要因
- AIモデルの高性能化に伴う計算資源の消費量増大
- NVIDIA製GPU不足によるインフラコストの上昇
- データセンターの電力消費とエネルギーコストの増加
- 高品質な学習データの取得コスト上昇
各社とも持続可能なビジネスモデルへの転換を迫られており、「AI冬の時代」を避けるための構造的な変化と言える。
開発者への影響と対応策
今回の変更は特にヘビーユーザーに大きな影響を与える:
短期的な影響
- 高性能モデルの利用コストが明確化される
- 利用量を意識した開発スタイルへの転換が必要
- 予算管理の重要性が増す
推奨される対応策
- モデル選択の最適化: 簡単なタスクは軽量モデル、複雑なタスクのみ高性能モデルを使用
- プロンプト設計の改善: より少ないトークンで同じ結果を得られるよう工夫
- 代替案の検討: GitHub Copilot以外のツールとの併用
- チーム利用の見直し: GitHub Copilot Businessでの一括管理
長期的な展望
Microsoftは今週中に段階的な発表を予定しているが、具体的なトークンベース課金の開始時期は未定だ。開発者はGitHub BlogやGitHub Copilot公式ドキュメントで最新情報を確認することが推奨される。
AI開発補助ツールの「格安利用」時代の終了は避けられそうにないが、同時により透明性の高い価格体系への移行でもある。開発者は新しい課金モデルを見据えた利用戦略の見直しを迫られることになりそうだ。
詳細はExclusive: Microsoft To Shift GitHub Copilot Users To Token-Based Billing, Reduce Rate Limitsを参照していただきたい。