9月16日、OpenAI Blogで「Introducing upgrades to Codex」と題した記事が公開された。この記事では、エージェント的なコーディングに最適化された「GPT-5-Codex」と、それを取り巻くCodexの新機能や改善点について詳しく紹介されている。以下に、その内容を簡潔にまとめて紹介する。
GPT-5-Codexの特徴
- GPT-5を基盤に、実際のソフトウェア開発業務を意識して最適化されたモデルである。
- 短時間の対話型利用と、長時間に及ぶ大規模なリファクタリングや新規機能追加などの複雑なタスクを両立できる。
- コードレビュー能力が強化され、クリティカルなバグを検出することが可能。
- SWE-bench Verifiedの500タスク全てで評価が行われ、従来より広範な性能測定が実施された。
開発フローでの適用範囲
- Codex CLI、IDE拡張機能、クラウド環境、GitHub統合で利用可能。
- VS CodeやCursorといったエディタ上で、ローカルとクラウドをシームレスに行き来しながら作業できる。
- フロントエンド開発ではスクリーンショットや画像を入力として利用でき、生成物の視覚的な検証も可能。
実際のパフォーマンスと利用事例
- 単純なリクエストでは応答が高速化され、複雑な作業では7時間以上独立して作業を継続した事例もある。
- トークン使用量はタスクに応じて動的に調整され、小規模タスクでは93.7%の削減、大規模タスクでは推論・テスト時間を倍増させて成果物の品質を高めている。
- Cisco Merakiの技術リードが「別チームの大規模リファクタリングを安全にCodexへ委任できた」と評価している。
Codex CLIとIDE拡張の刷新
- CLIはエージェント的なワークフローを重視して再設計され、画像の添付やタスク進行管理(ToDoリスト)に対応。
- ターミナルUIも改善され、ツール呼び出しや差分表示が読みやすくなった。
- 承認モードは「読み取り専用」「限定的自動化」「完全アクセス」の3段階に整理。
- IDE拡張では開いているファイルや選択範囲を文脈として活用し、短いプロンプトで高速な結果が得られる。
GitHub統合とコードレビュー機能
- PRに自動でレビューを追加し、差分や依存関係を解析した上でテスト実行による検証を行う。
- 「@codex review for security vulnerabilities」といった指示で特定の観点に絞ったレビューも可能。
- OpenAI社内ではすでに大半のPRレビューをCodexが担当しており、日々数百件の問題を検出している。
セキュリティと安全設計
- Codexはサンドボックス環境で実行され、デフォルトでネットワークアクセスが無効化されている。
- 危険な操作は明示的に許可を求める仕組みを採用。
- クラウド環境では信頼済みドメインにアクセスを制限でき、CLIやIDE拡張では開発者が承認制御を設定可能。
- 出力には常にログやテスト結果が付随し、人間による確認を前提とした利用が推奨されている。
提供プランと利用範囲
- CodexはChatGPT Plus、Pro、Business、Edu、Enterpriseプランに含まれる。
- Proでは週単位のフルワークロードをサポートし、Enterpriseではチーム単位でクレジットを共有できる。
- API経由での利用も今後提供予定。
Codexは単なる補助ツールではなく、開発者と並んで作業を進める「チームメイト」として進化しつつある。
詳細はIntroducing upgrades to Codexを参照していただきたい。