7月1日、Graham Barlowが「The AI chatbot war is turning into an agent war with the release of Claude's 'most agentic Sonnet model yet'」と題した記事を公開した。この記事では、AnthropicがリリースしたClaude Sonnet 5が「エージェント特化」を前面に打ち出し、AI競争の軸がチャットからエージェントへ移行しつつあることが詳しく紹介されている。
チャットボット戦争から「エージェント戦争」へ
AnthropicがClaude Sonnet 5をリリースした。同社はこのモデルを「これまでで最もエージェント的なSonnetモデル」と位置づけており、今回のリリースが単なるバージョンアップではないことを強調している。
エージェント型AI(AIエージェント)とは、ユーザーの質問に答えるだけでなく、自律的に計画を立て、ツールを使い、タスクを実行するAIを指す。ブラウザやターミナルといった外部ツールを操作しながら、人間の細かい指示なしに作業を進める能力が求められる形態だ。
Anthropicによれば、Sonnet 5は「数ヶ月前まで、より大規模で高価なモデルを必要としていたレベルで、計画を立て、ブラウザやターミナルなどのツールを使い、自律的に動作できる」という。
コーディング性能:Sonnet 4.6から大幅向上
Sonnet 5はコーディングと日常的なプロフェッショナル業務を主なターゲットとして設計されている。ベンチマークTerminal-bench 2.1によるAgentic Codingスコアでは、**Sonnet 4.6の67%に対し、Sonnet 5は80.5%**を記録した。
Terminal-bench 2.1は、ターミナル操作を伴う実務的なコーディングタスクの遂行能力を評価するベンチマークであり、自律的なコマンド実行・ファイル操作・デバッグといった一連の作業フローを通じてモデルの実用性を測る指標だ。このスコア差は、エージェントとしての実用性において実質的かつ有意な改善を示している。
全プランで無償提供、デフォルトモデルに昇格
特筆すべきは提供範囲の広さだ。Sonnet 5はFreeプランを含む全Anthropicプランで利用可能であり、FreeおよびProユーザーのデフォルトモデルとなった。Max・Team・Enterpriseユーザーにも提供されるほか、Claude CodeおよびClaude Platformでも利用できる。
Anthropicの公式発表でもこの提供範囲の広さは強調されており、エージェント機能をより多くのユーザーに開放する意図が読み取れる。
業界全体の流れ:各社がエージェント競争に参入
Sonnet 5のリリースは、業界全体の動きと軌を一にしている。Googleはすでにエージェント型パーソナルAIアシスタントをリリースしており、エージェント機能をめぐる競争は各社で加速している。元記事ではこうした状況を「チャットボット戦争からエージェント戦争への移行」と表現しており、競争の主戦場が変わりつつあるという見方を示している。
記事ではこの流れを次のように総括している。
「次のAI戦争の勝者は、最も賢い回答を返すチャットボットではない。混沌としたタスクを引き受け、計画を追跡し、実際に有用な成果を出せるアシスタントだ。」
AIモデルの競争軸が「回答の質」から「タスク完遂能力」へと移行しつつある、というのが本記事の核心だ。Anthropic単社の動きではあるが、GoogleをはじめとするほかのAI各社も同様にエージェント機能の強化を打ち出しており、この方向性は業界全体のトレンドとして捉えることができる。
※編集部の考察:エージェント型AIの普及には、信頼性・安全性・コスト効率など、純粋なベンチマーク性能以外の要素も大きく関わってくる。Sonnet 5が「全プランでデフォルト」という形で広く展開された背景には、エージェント機能を実際のユーザー行動データで磨いていく意図もあるのかもしれない。
詳細はThe AI chatbot war is turning into an agent war with the release of Claude's 'most agentic Sonnet model yet'を参照していただきたい。