7月3日、InfoWorldが「AI token prices are cooling」と題した記事を公開した。LLMの利用コストが今年5月のピークから約20%下落しているというデータが示されているが、問題はその「理由」だ。原因がベンダー側の値下げ競争なのか、それとも市場全体が安価なモデルへシフトしているだけなのかによって、エンジニアやCTOが取るべきアクションは大きく異なる。
AIトークン単価、5月ピークから20%下落
LLMの利用コストを日次で追跡する指標、**Silicon DataのLLM Token Expenditure Index(SDLLMTK)によると、現在の指数は1.62ドル/100万トークンを記録している。これは昨年12月の指数開始時点からは上昇しているものの、今年5月のピーク時と比較すると20%の下落**となっている。
SDLLMTKは、複数のAIプロバイダーからトークン消費量・単価データを収集し、ブレンドレート(加重平均的な複合単価)として日次で算出される指数だ。Silicon Dataの指数ページでは過去の推移も確認できる。算出にあたっては、フロンティアモデル(GPT-4oやClaude 3.5 Sonnetのような最先端の商用モデル)とオープンウェイトモデル(LlamaやMistralのような重みが公開されているモデル)の利用割合を異なるウェイトで加味している。そのため、特定プロバイダーの公式価格改定とは独立して指数が動く場合があり、「価格が下がった」という事実の解釈には注意が必要だ。
なお、ブレンドレートのウェイト設定の具体的な根拠(例:実際の市場シェアに基づくのか、加入企業の利用実績に基づくのか)については元記事でも詳細が明かされておらず、指数の絶対値よりもトレンドの方向性として参照するのが適切だと考えられる。(※編集部の考察)
「なぜ下がっているか」の解釈が分かれる
記事の核心は、この下落の原因に複数の解釈が成り立つ点にある。
解釈1:企業がベンダーに値下げ圧力をかけている
エンタープライズ顧客がLLM調達においてコスト交渉力を持ち始め、プロバイダー側が価格を引き下げざるを得なくなっているとすれば、ユーザー側には朗報だ。ただしこの解釈が正しければ、現在IPOを目指しているAI企業(OpenAI、Anthropicなど)にとっては収益性への懸念材料となり得る。将来の価格水準の持続可能性にも疑問符がつく。
解釈2:利用が安価なモデルにシフトしている
フロンティアモデルよりもコストの低いオープンウェイトモデルや小型モデルへの移行が市場全体で進んでいれば、ブレンドレートの指数全体が下押しされる。この場合、OpenAIやAnthropicといった大手プロバイダーの実際の価格リストは変わっていないにもかかわらず、指数だけが下がるという現象が起きうる。記事では、この「構成変化による指数低下」と「値下げによる指数低下」を外部から区別することが難しいと指摘されている。
ウェイト設定の詳細が非公開である以上、どちらの要因が支配的かを指数の数値だけから断定することは困難だ。
プロバイダー各社の動向とIPOへの影響
記事はプロバイダー各社の競争状況にも言及している。Google、Amazon、Microsoftなどのクラウド大手がLLM APIの提供を強化する中、価格競争の圧力は実際に高まっている。一方でOpenAIやAnthropicのようにIPOを視野に入れている企業は、値下げを積極的に打ち出すことで短期的な収益指標を毀損するリスクを抱えている。
このダイナミクスは、「値下げ競争」説と「モデルシフト」説のどちらが正しいかによって、今後の市場構造に異なる含意を持つ。前者であれば競争激化が続き、後者であればフロンティアモデルの価格は横ばいのまま市場が分化していく可能性がある。
コスト最適化を進める開発者・CTOへの示唆
この指数の動向は、LLMを本番運用しているエンジニアやアーキテクトにとって実務的な判断材料となる。
原因が「ベンダーの値下げ競争」であれば、現在の長期契約やAPIの選定を見直す余地がある。特に大量のトークンを消費する用途では、複数プロバイダーへの見積もり依頼や、契約更新タイミングでの単価交渉が有効になり得る。プロバイダー間の価格比較にはArtificial Analysisのような独立系ベンチマークサービスも参考になる。
原因が「安価なモデルへの市場シフト」であれば、自社のモデル選定戦略がそのトレンドに乗れているかを確認するタイミングだ。すべてのユースケースにフロンティアモデルを使い続けることが最適とは限らず、タスクの複雑度に応じたモデルの使い分け(いわゆる「モデルルーティング」)を検討する価値がある。LiteLLMやRouteLLMといったOSSツールはその実装を支援する。
いずれの解釈が正しいにせよ、トークン単価は一方向に上昇し続けるわけではないという市場の実態が、この指数から読み取れる。AIコストの見積もりや予算策定において、静的な単価を前提にするのではなく、SDLLMTKのような動的な市場価格を追跡するツールの活用が今後ますます重要になるだろう。
詳細はAI token prices are coolingを参照していただきたい。