12月12日、OpenAIがGPT-5.2をリリースした。
この記事では、最新モデルGPT-5.2の改善点について簡単に紹介する。。
1. GPT-5.2の全体像
GPT-5.2は、 プロフェッショナルな知識労働向けに設計された 最新モデルシリーズである。スプレッドシート作成、プレゼン構成、コード生成・デバッグ、画像理解、長文コンテキスト処理、ツール連携といった実務タスクで、前世代より大きく性能が向上したとされている。
ChatGPTでは GPT-5.2 Instant / Thinking / Pro が有料プランから順次利用できるようになり、APIではすでに全開発者が利用可能である。
2. 知識労働とコーディングでの性能向上
GDPval:専門家レベルの知識仕事
- 44職種にまたがる、よく定義された知識労働タスクを測る GDPval で最高成績(SOTA: State-of-the-Art)を達成。
- 専門家審査員による比較で、GPT-5.2 Thinkingは 約7割のケースで業界のトッププロと同等以上 と評価された。
- スプレッドシートやスライドなど「そのまま業務に使える成果物」の生成品質が大きく改善したと報告されている。
GPT-5.1と5.2において、以下のプロンプトを用いてスプレッドシートを出力させると、顕著な違いが見て取れる。
Create a workforce planning model: headcount, hiring plan, attrition, and budget impact. Include engineering, marketing, legal, and sales departments.
参考訳: 「エンジニアリング・マーケティング・法務・営業の各部門について、採用計画・離職・人件費への影響を含む人員計画モデルを作成せよ」
SWE-bench:実務レベルのソフトウェアエンジニアリング
- 実世界のバグ修正タスクを含む SWE-bench Pro でSOTAを達成。
- Python以外も含む4言語対応の評価で高スコアを記録し、
「プロダクションコードのデバッグ、機能追加、大規模リファクタリングを、より少ない人手介入でこなせるようになった」と説明されている。 - フロントエンドや3D UIなど、複雑なインターフェースを伴う開発でも、GPT-5.1より明確な改善が見られたとされる。
`Create a single-page app in a single HTML file with the following requirements:
Name: Ocean Wave Simulation
Goal: Display realistic animated waves.
Features: Change wind speed, wave height, lighting.
The UI should be calming and realistic.`
参考訳: 「単一HTMLファイルで、風速・波高・ライティングを操作できる“癒やし系”のリアルな波シミュレーションSPAを作成せよ」:
このようなプロンプトから、HTML/CSS/JavaScriptをまとめた単一ページアプリを生成できることが強調されている。
3. 長文コンテキスト・ツール連携・ビジョン
GPT-5.2 Thinkingは、次の3点で前世代から大きく改善したとされる。
- 長文コンテキスト推論
- 長大なレポート、契約書、研究論文、マルチファイルプロジェクトなどを一貫性を保って扱えることがアピールされている。
- ツール連携とエージェント的ワークフロー
- 複数エージェント構成を「ツールを多数持つ1つのメガエージェント」にまとめて運用している事例も紹介されている。
- ビジョン(画像理解)
- チャートやソフトウェアUIの理解におけるエラー率が約半減。
- ダッシュボードや図面、UIスクリーンショットなどの構造をより正しく把握できるようになり、業務ツールの画面を直接読ませるワークフローに適していると説明されている。
4. 安全性・年齢保護とモデルラインナップ
安全性とメンタルヘルス対応
- GPT-5シリーズで導入された「safe completion」の考え方を引き継ぎつつ、GPT-5.2では自殺・自傷・メンタルヘルス・モデルへの過度な情緒依存といったセンシティブな会話への対応を強化した。
- GPT-5.1やGPT-5 Instant/Thinkingと比べて、「望ましくない応答」の発生率が減ったと報告されている。
また、18歳未満ユーザーへの自動コンテンツ制限を実現するため、年齢推定モデルの導入も進めている。
ChatGPTとAPIでの提供形態・料金
- ChatGPTでは、Plus / Pro / Go / Business / Enterprise の有料プランからGPT-5.2(Instant, Thinking, Pro)を順次ロールアウト。
- GPT-5.1はChatGPT上で3か月間はレガシーモデルとして利用可能で、その後終了予定。
- APIでは:
gpt-5.2(Thinking)gpt-5.2-chat-latest(Instant)gpt-5.2-pro(Pro)
として提供される。
- 料金は以下の通りである。
- 入力: $1.75 / 1M tokens
- 出力: $14 / 1M tokens
- キャッシュ入力は90%割引
- トークン単価はGPT-5.1より高いが、必要トークン数が減ることで「一定品質に到達する総コスト」は下がるケースも多いと説明されている。
5. 開発・インフラ面の位置づけ
GPT-5.2は、MicrosoftとNVIDIAとのパートナーシップのもと、AzureデータセンターとH100/H200/GB200-NVL72といったGPUインフラ上で訓練されている。これにより、知能の向上と大規模モデルの安定提供を両立していると説明されている。
OpenAIは、GPT-5.2を「継続的な改善の中の一歩」と位置づけており、今後も安全性・信頼性・知能の向上を続ける方針を明確にしている。
詳細はIntroducing GPT-5.2を参照していただきたい。