6月30日、Joseph Coxが「Companies Are Making Claude and Codex Talk Like Cavemen to Stop AI's Soaring Costs」と題した記事を公開した。UberがわずかI4か月でAI予算を使い切り、WalmartやGitHubも相次いで利用制限に動く中、企業のAIコスト問題は臨界点に達しつつある。その打開策として、LLMの出力を「原始人語」に変換してトークン消費を最大75%削減するツールが静かに広まっている実態を伝えている。
AIの出力から「丁寧さ」を剥ぎ取る
Claude CodeやCodexといったLLM(大規模言語モデル)は、通常、丁寧で回りくどい言葉を使う。「あなたのご指摘はもっともです。私の誤りでした」といった表現がその典型だ。
なお、トークンとはAIモデルが文章を処理する際の単位で、単語や文字のまとまりに相当する。APIの利用料金はこのトークン数に応じて課金される仕組みのため、出力が冗長であればあるほどコストが膨らむ。
Caveman(GitHubリポジトリ)はこの構造を根本から変えるツールだ。インストール後にClaudeへ確認を取ると、返答はこうなる——「Already active. What you need?」
このツールを作ったJulius Brusseeは、Claude Codeを多用する中でトークン消費の多くが「挨拶、断定回避の言い回し、つなぎ言葉、雑談」に費やされていることに気づき、2025年4月に開発した。
「モデルを礼儀正しいチャットボットではなく、無愛想なツールとして振る舞わせる。中身は同じで、言葉数が減る」(Julius Brussee)
実際の効果は数字で出ている。Brusseeの評価では、デフォルトの冗長出力と比べてアウトプットトークンを65〜75%削減できたという。404 Mediaの検証でも約5,800トークン、65%の削減を確認している。コード・コマンド・URL・関数名といった精度が求められる部分はそのまま保持し、周辺の自然言語だけを圧縮する設計だ。
「grunt」レベルと古典中国語モード
Cavemanにはユーザーが選べる出力レベルが4段階ある。
- lite:軽度の圧縮
- full(デフォルト):標準的な原始人語
- ultra:さらに短縮
- Wenyan:出力を古典中国語(漢文)に変換
Wenyanモードは404 Mediaが動作確認済みだが、記者本人は「何が書いてあるかまったくわからない」と述べている。
また、caveman-codeというエージェントも提供されており、「同一タスクでCodexより約2倍少ないトークン」で動作するとGitHubリポジトリには記載されている。
OpenAIのエンジニアリング責任者がコードを提供
GitHubのコミット履歴によると、OpenAIのエンジニアリングディレクターであるShayne Sweeneyが数か月前にCavemanへコードを提供しており、「Add Codex plugin support」というコミットが残っている。Brusseeによれば、OpenAI・NVIDIA・GitHubのエンジニアが個人として利用または評価中だという。
企業がここまで追い詰められた理由
背景にあるのはトークンコストの急騰だ。
- GitHubは2025年4月、Copilotの課金体系を定額制からトークン従量制に変更した
- UberはClaude Codeなどへの利用上限を設定。同社CTOによるとわずか4か月でAI予算を使い切ったという
- WalmartもAIツールの利用に上限を設ける対応を取った
- コンサルティング大手Accentureは、急増するトークン支出の大きな原因がPDFをプレゼン資料に変換するAI利用にあると指摘している
Cavemanを社内ツールとして採用しているのが、データセンター事業も手がけるインフラ大手Legrandだ。404 Mediaが入手した社内メモには、「新しいクォータが実装されたため、予算を使い切らないようAI利用に注意が必要」とあり、コスト削減策の一つとして「caveman skillを使って出力消費を削減する(コードへの影響なし)」が明記されている。
なお、昨年はOpenAIのCEO Sam Altmanが「ユーザーがChatGPTに『please』『thank you』と言う習慣が、OpenAIに数千万ドル規模の電力コストをもたらしている」と発言して話題になった経緯もある。トークン節約の意識は、ユーザー個人から企業レベルまで広がっている。
Cavemanのリポジトリは最後にこう締めている——「Caveman save you token, save you money.」
詳細はCompanies Are Making Claude and Codex Talk Like Cavemen to Stop AI's Soaring Costsを参照していただきたい。