7月1日、Pragmatic Engineerが「Impressions from visiting OpenAI, Anthropic, & Cursor」と題した記事を公開した。OpenAI・Anthropic・Cursorの3社をサンフランシスコで直接訪問した執筆者のGergely Oroszが見えてきたのは、「AIエージェントはローカルマシンで動かす時代から、クラウドで動かす時代へ移行しつつある」という業界全体に共通する確信だ。3社がそれぞれ独立してこの方向へ舵を切っていることは、単なるトレンドではなく構造的なシフトが起きていることを示している。
次のメガトレンド:クラウドで動くAIエージェント
Oroszがサンフランシスコで開催中のAI Engineer's World Fairへの参加に合わせ、OpenAI・Anthropic・Cursorの各オフィスを訪問した。そこで見えてきた最大のテーマが「クラウドエージェント」だ。
ローカルマシン上でAIエージェントを動かす場合、CPUが熱くなり、マシン全体が重くなる。複数エージェントを並行実行すればなおさらだ。Peter Steinbergerというエンジニアはこの問題に嫌気が差し、OpenClawエージェントをクラウドで動かすためのCrabboxを自作した。同じ発想がAnthropicでも独立して生まれており、Claude Managed Agentsという名称でホステッドサービスが構築されている。Anthropicのエンジニアリングヘッド、Katelyn Lesseによれば、このプロジェクトは6ヶ月かけて構築した大規模なものだという。
OpenAIは一歩踏み込み、クラウド開発環境(CDE)のリーダーだったOna(※旧Gitpod。2025年にOpenAIに買収されブランド名を変更)を買収した。発表文には以下のように書かれている。
「Codexがより高度になるにつれ、その最も価値ある作業は数分ではなく、数時間・数日にわたって展開される。私たちは、人々が作業の開始地点となったマシンに縛られることなく、より野心的な仕事を委任できるようになるべきだと考えている。」
OpenAIのエンジニアに「クラウドエージェントへのシフトは本物か」と聞いたところ、「まさにそうだ」という回答が返ってきた。現在もCloud Agentsチームのエンジニアを採用中で、求めるスキルはPython・Rust・分散システム・クラウドインフラとある。
Cursorも昨年末にCloud Agentsをリリース済みで、6月30日にはiOSアプリも公開した。スマートフォンからソフトウェアを開発するという体験は、クラウドエージェントなしには成立しない。
なぜ今なのか
Oroszは「今このタイミング」になった理由を以下のように分析している。
- コーディングモデルが実用レベルに達した。 最新世代のモデルが登場する以前の世代では、長時間の自律的なコーディングは現実的ではなかった(※記事中に登場する具体的なモデル名はOroszの分析として引用されているが、公開時点の最新モデルを指しているため、本稿では詳細なバージョン名の記載を省略する)
- エージェントへのコンテキスト付与インフラが成熟した。 MCP(Model Context Protocol)やスキルといった仕組みが普及した
- コンテキストウィンドウが拡大した。 現在は最大100万トークンを扱えるモデルが登場し、長時間タスクに必要な情報量を渡せるようになった
- クラウドプロバイダーのGPUキャパシティが拡大した。 ここ数年のGPUクラスター投資が実を結んでいる
Cursorが発見した「クラウドエージェント固有の問題」
Cursorの共同創業者Sualeh Asifとの対話で明らかになった点が興味深い。
ローカル実行であれば、エージェントが警告やエラーに遭遇したとき、人間に知らせてフィードバックを受けられる。しかしクラウドで長時間動くエージェントにはそのフィードバックループがない。Cursorはこれに対し、エージェントが定期的に「告白(confess)」する仕組みを考案した。その「告白」内容はインフラチームと共有され、エージェントの実行環境の改善に使われる。
また、実行中のノードが停止した場合に別ノードへ処理を引き継ぐ問題など、長時間タスク特有のインフラ課題も新たに浮上している。
非エンジニアの95%以上がCodexを使う
OpenAIの内部では、非エンジニア職の95%以上がChatGPTではなくCodexを使っているという。Codexはコード生成に特化したツールだが、それを非開発者が使いこなしている事実は、「コーディングハーネスの非エンジニアへの普及」という別のトレンドを示唆している。
エンジニアの次の主な仕事:エージェントの効率化
AnthropicとCursorでの取材を通じて見えてきたもう一つの傾向が、エンジニアリング業務の重心がエージェントの実行環境整備へシフトしていることだ。エージェントがより効率的に動けるよう環境を整えること自体が、主要なエンジニアリング業務になりつつある。
あわせて、AI利用コストの最適化も重要なテーマとして浮上している。エンジニアによるAI利用コストが膨らむ中、プラットフォームチームがトークンあたりのコストを削減する動きが本格化している。記事ではCoinbaseの事例が取り上げられており、大規模な組織がエージェント利用コストをどう管理・最適化しているかの具体的な取り組みが紹介されている。
「Claude Tag」が示す新しいエージェント起動体験
最後に取り上げられているのが、SlackでClaudeをメンションするだけでタスクを開始できる「Claude Tag」だ。Andrej Karpathyが「新しいパラダイム」と表現したことはSNS上で議論を呼び、「ただのSlack統合では」という批判も多かった。しかしAnthropicのエンジニアが強調したのは、ローカルセットアップもツールの切り替えも不要で、コマンド一つでエージェントをクラウド上で起動できるという体験の変化だった。クラウドエージェントが前提となって初めて成立するユーザー体験として、Claude Tagはその象徴的な例といえる。
詳細はImpressions from visiting OpenAI, Anthropic, & Cursorを参照していただきたい。