7月2日、Joseph CoxとEmanuel Maibergが「Companies Are Throttling Employees' AI Use Because It's Too Expensive」と題した記事を公開した。「できる限り早くAIを導入せよ」とクライアントに勧めてきたコンサルが、今度は「トークンエコノミクスを真剣に考える機会」と称して同じクライアントにコスト削減策を売り込み始めている——そんな皮肉な構図を軸に、AmazonやAdobe、Atlassianなど大手企業がAIコストの急騰を受けて社員の利用を制限・絞り込み始めている実態が詳述されている。
月額$15M超、Atlassian単社でコストが3倍に
Atlassianの内部ダッシュボードによると、同社のAI関連支出(AWS・Google Cloud・OpenAIなど大規模言語モデル=LLMのAPI利用費を含む)は、2025年8月の約500万ドルから2026年5月には1500万ドル超へと3倍以上に膨れ上がった。このペースでは、会計年度のAIツール支出が1億2000万ドルを超える見通しだという。Atlassianはこの数字が正確ではないとコメントしたが、どの部分が間違いかは明示しなかった。
なお、本記事タイトルに登場するAmazon・Adobe・Atlassianはいずれも独立した事例として報じられており、1500万ドルはAtlassian単社の数字である。
Atlassianは対応策として、社員が自分のAI利用コストをリアルタイムで確認できるダッシュボードを導入し、AIツールの無制限利用も終了させた。
「ワークフローをAI全振りに変えてしまった人が大勢いて、特にエージェントや最新のClaudeモデルを使うと2〜3日でトークンが枯渇する。Slackには『これじゃ仕事できない』という不満が飛び交っている」(Atlassian社員)
LLMの利用量は「トークン」という単位で計測される。日本語・英語を問わず、単語や文字のまとまりをトークンに分割して処理するため、長い会話や複雑な指示を与えるほどコストが増大する仕組みだ。エージェント型AIは自律的に複数ステップを実行するため、一回の操作でも消費トークン数が跳ね上がりやすい。
CitiはClaudeとGPTの上位モデルへのアクセスを一時シャットダウン
金融大手Citiは、Claude(Anthropic製)およびGPT(OpenAI製)の上位モデルへのアクセスを6月24日に一時遮断した(7月1日に再開予定)。元記事にはモデル名が具体的に記載されているが、いずれも2026年7月時点で公式リリースが広く確認されているわけではないため、本記事では名称の断言を避ける。背景には、GitHubが6月にフラット定額制からトークン使用量ベースの課金モデルへ移行したことへの直接的な対応があるという。
遮断前、Citiは社員に向けて「タスクに適したモデルを選べ」と呼びかけるメールを送っていた。内容は具体的で、
- クイックな質問・簡単なコード生成 → より軽量なモデルを使用
- コードレビュー・標準的なチャット → 中位モデルを使用
- アーキテクチャの検討 → 同上の中位モデルを使用
という使い分けを明示している。上位モデルほど処理能力が高い一方でトークン単価も高く、用途に合わせて使い分けることがコスト管理の鍵となる。Citiのトークンは企業全体でプール共有されており、ヘビーユーザーが使いすぎると他の社員の利用枠を圧迫する構造になっている。
なお、Citi広報はモデルを無効化していないと404 Mediaに回答しているが、記事が入手した内部メールやスクリーンショットはその説明と矛盾している。
Adobeは「6月30日まで使い切れ」
Adobeでは、Claude(Anthropic製LLM)への無制限アクセスが6月30日をもって終了した。社員への通知はシンプルで、「その日までにやれることを全部やれ」という趣旨だったという。
「低推論モデルを活用してトークン消費を抑えようというアイデアは出ていたが、変更の全容が実感されるのは実際に制限が効いてからだろう」(Adobe社員)
「低推論モデル」とは、複雑な推論ステップを省いて高速・低コストで動作するよう設計されたLLMのバリアントを指す。単純な要約や定型文生成など、精度よりも速度とコストを優先するタスクに向いている。
Amazon、エンタメ企業……各社で噴出するトークン問題
Amazonでは以前、社員のAI活用度をランキング表示する社内リーダーボードが存在していたが、先日廃止された。複数の社員は「浪費的なAI利用を助長していたから廃止されたのでは」と見ている。廃止後、社内Slackでは「トークン上限に達した」というスクリーンショットが共有され始めた。
「リーダーボード廃止から2週間も経たずに実際の使用量制限が始まるとは」(Amazonの社員Slackより)
あるエンタメ系企業では、1人の開発者が会社全体の月次ChatGPTトークン割り当ての約半分を消費し、「明確なROIなし」と指摘されたという。ROI(投資対効果)の観点からAI利用を評価する動きは、こうした極端な事例を契機に各社で広まりつつある。
コンサルが火をつけ、コンサルが消火役に
この問題を象徴する構図が、コンサルティング大手Accentureをめぐる報道だ。同社はクライアントに「できる限り早くAIを導入せよ」と促してきた張本人でもある。ところが今度は、トークン消費急増の解決策としてAccentureが売り込みを始めているという。リークされた音声によれば、同社の上級スタッフは顧客に対し「トークンエコノミクスを真剣に考える新たな機会」があると説いているという。
Accentureがトークン浪費の典型例として挙げているのは、LLMを使ったPDFのスライド変換だ。エンジニアの生産性向上ではなく、こうした雑務的な使われ方がトークン消費の主因になっているとAccentureは分析している。
一方でAccentureは社内では、AIを使ってワールドカップの優勝チームを予測するツールを作り続けているとも報じられている。「火をつけて消火役に回る」という批判を自ら体現しているような実態だ。
「使い放題」から「使用量管理」へ
フラット定額から使用量課金へのシフトは、GitHub Copilotをはじめ各AIプラットフォームで進んでいる。導入を急ぎすぎた企業がコスト管理の仕組みを後追いで整備する構図は、今後さらに顕在化するとみられる。社員教育・利用ガイドライン整備・モデル選定の最適化といった「AIガバナンス」が、次の企業課題として浮上しつつある段階だといえる。
詳細はCompanies Are Throttling Employees' AI Use Because It's Too Expensiveを参照していただきたい。