AIに「原始人語」で喋らせてトークンコストを65%削減 — UberやWalmartが利用制限に追い込まれる中、企業が取り始めたコスト対策

6月30日、Joseph Coxが「Companies Are Making Claude and Codex Talk Like Cavemen to Stop AI's Soaring Costs」と題した記事を公開した。UberがわずかI4か月でAI予算を使い切り、WalmartやGitHubも相次いで利用制限に動く中、企業のAIコスト問題は臨界点に達しつつある。その打開策として、LLMの出力を「原始人語」に変換してトークン消費を最大75%削減するツールが静かに広まっている実態を伝えている。

AIの出力から「丁寧さ」を剥ぎ取る

Claude CodeやCodexといったLLM（大規模言語モデル）は、通常、丁寧で回りくどい言葉を使う。「あなたのご指摘はもっともです。私の誤りでした」といった表現がその典型だ。

なお、トークンとはAIモデルが文章を処理する際の単位で、単語や文字のまとまりに相当する。APIの利用料金はこのトークン数に応じて課金される仕組みのため、出力が冗長であればあるほどコストが膨らむ。

Caveman（GitHubリポジトリ）はこの構造を根本から変えるツールだ。インストール後にClaudeへ確認を取ると、返答はこうなる——「Already active. What you need?」

このツールを作ったJulius Brusseeは、Claude Codeを多用する中でトークン消費の多くが「挨拶、断定回避の言い回し、つなぎ言葉、雑談」に費やされていることに気づき、2025年4月に開発した。

「モデルを礼儀正しいチャットボットではなく、無愛想なツールとして振る舞わせる。中身は同じで、言葉数が減る」（Julius Brussee）

実際の効果は数字で出ている。Brusseeの評価では、デフォルトの冗長出力と比べてアウトプットトークンを65〜75%削減できたという。404 Mediaの検証でも約5,800トークン、65%の削減を確認している。コード・コマンド・URL・関数名といった精度が求められる部分はそのまま保持し、周辺の自然言語だけを圧縮する設計だ。

「grunt」レベルと古典中国語モード

Cavemanにはユーザーが選べる出力レベルが4段階ある。

lite：軽度の圧縮
full（デフォルト）：標準的な原始人語
ultra：さらに短縮
Wenyan：出力を古典中国語（漢文）に変換

Wenyanモードは404 Mediaが動作確認済みだが、記者本人は「何が書いてあるかまったくわからない」と述べている。

また、caveman-codeというエージェントも提供されており、「同一タスクでCodexより約2倍少ないトークン」で動作するとGitHubリポジトリには記載されている。

OpenAIのエンジニアリング責任者がコードを提供

GitHubのコミット履歴によると、OpenAIのエンジニアリングディレクターであるShayne Sweeneyが数か月前にCavemanへコードを提供しており、「Add Codex plugin support」というコミットが残っている。Brusseeによれば、OpenAI・NVIDIA・GitHubのエンジニアが個人として利用または評価中だという。

企業がここまで追い詰められた理由

背景にあるのはトークンコストの急騰だ。

GitHubは2025年4月、Copilotの課金体系を定額制からトークン従量制に変更した
UberはClaude Codeなどへの利用上限を設定。同社CTOによるとわずか4か月でAI予算を使い切ったという
WalmartもAIツールの利用に上限を設ける対応を取った
コンサルティング大手Accentureは、急増するトークン支出の大きな原因がPDFをプレゼン資料に変換するAI利用にあると指摘している

Cavemanを社内ツールとして採用しているのが、データセンター事業も手がけるインフラ大手Legrandだ。404 Mediaが入手した社内メモには、「新しいクォータが実装されたため、予算を使い切らないようAI利用に注意が必要」とあり、コスト削減策の一つとして「caveman skillを使って出力消費を削減する（コードへの影響なし）」が明記されている。

なお、昨年はOpenAIのCEO Sam Altmanが「ユーザーがChatGPTに『please』『thank you』と言う習慣が、OpenAIに数千万ドル規模の電力コストをもたらしている」と発言して話題になった経緯もある。トークン節約の意識は、ユーザー個人から企業レベルまで広がっている。

Cavemanのリポジトリは最後にこう締めている——「Caveman save you token, save you money.」

詳細はCompanies Are Making Claude and Codex Talk Like Cavemen to Stop AI's Soaring Costsを参照していただきたい。