6月4日、AnthropicのInstituteが「When AI builds itself」と題した記事を公開した。
AIが自らのコードを書く時代が現実に
衝撃的な事実から始めよう。2026年5月時点で、Anthropicのコードベースにマージされるコードの80%以上を、同社のAIアシスタントClaude自身が作成している。これは2025年2月のClaude Codeリサーチプレビュー開始前の一桁台から、わずか1年余りで達成された劇的な変化だ。
この数字が示すのは、AIシステムがもはや人間の補助ツールではなく、AI開発の主力となりつつある現実だ。現在のトレンドが続けば、AIが自身の後継システムを完全自律的に設計・開発する「**再帰的自己改良**」の実現も視野に入ってくる。
なぜ今AI自己改良が注目されるのか
AI自己改良への関心が高まる背景には、AIの能力向上ペースの急激な加速がある。特に2024年後半以降、大規模言語モデルの性能向上により、従来人間にしかできなかった複雑なプログラミングタスクをAIが処理できるようになった。
実際、AIモデルが自律的に完了できるタスクの複雑さは約4ヶ月ごとに倍増している。これは以前の7ヶ月ごとという傾向から大幅な加速だ:
- 2024年3月:Claude Opus 3が人間で約4分のソフトウェアタスクを完了
- 2025年:Claude Sonnet 3.7が約1時間半のタスクを処理
- 2026年:Claude Opus 4.6が12時間のタスクを管理
この傾向が続けば、2026年中に数日規模、2027年には数週間規模のタスクも射程に入る。
ベンチマークが示す圧倒的な進歩
客観的な指標でも進歩は明らかだ。実世界のソフトウェア開発能力を測定する**SWE-benchでは、AIモデルのスコアが2年間で一桁台からほぼ100%まで向上した。また、既存研究の再現を測定するCORE-Bench**でも、2024年の約20%成功率から15ヶ月後にはベンチマークを飽和させている。
Anthropicの社内データはさらに具体的だ。エンジニア1人当たりの開発効率は、2021-2025年と比較して四半期あたり平均8倍に達している。130名の研究チーム員を対象とした2026年3月の調査では、Mythos Previewを使用することでAIなしの場合と比較して約4倍の成果を上げているという。
品質面でも人間を上回る領域が出現
注目すべきは、単なる効率向上にとどまらず、品質面でもAIが人間を上回る領域が現れていることだ。最も困難な未解決問題において、Claudeの成功率は2026年5月に76%に到達し、6ヶ月間で50ポイント向上した。
具体例として、通常のアップグレードで数万の訓練ジョブがクラッシュしたインシデントでは、Claudeが実行中のジョブを調査し、環境設定を一つずつテストして、クラッシュを引き起こす特定のデバッグフラグを特定。約2時間で修正を完了した。これは通常2-3日を要する作業だった。
研究面では、小規模AIモデルの訓練コード高速化テストで、Claude Mythos Previewが約52倍の高速化を実現。熟練した人間研究者が4倍の高速化に4-8時間を要することを考えると、この領域でClaudeは1年足らずで超人的能力を獲得したと言える。
完全自律研究の実証実験
2026年4月には歴史的な実証が行われた。AI安全性の未解決問題において、Claudeエージェントが仮説の提案、テスト、並行エージェントとの知見共有、反復改良を自律的に実行。人間研究者2名が約1週間で達成した進歩の23%に対し、エージェントは800時間の累積作業と約18,000ドルの計算資源で97%を回復した。
Anthropic研究者のコメント:
Claudeは1-2日という短期間で、私からの最小限のサポートでこれらすべてを実行した。もし後輩の同僚が同じ期間でこのような結果を持ってきたら、私は軽く感銘を受けるだろう。未来は今ここにある。
自己改良実現への課題と展望
完全な再帰的自己改良の実現にはまだ課題が残る。現在のAIシステムは手法の決定には優れているが、目標設定における判断力で大きなパフォーマンスギャップがある。これが現在のAIと自律的に後継システムを設計できる未来のシステムとの差だ。
完全な再帰的自己改良は技術史における重大な発展となり得る。科学、医療、その他の分野でenormous good for the worldをもたらす可能性がある一方で、人間がAIシステムをコントロールできなくなるリスクも増大する可能性がある。
しかし現在のデータが示す傾向を見る限り、AIによるAI開発の時代は既に始まっている。問題はそれがいつ完全自律になるかではなく、どのようにそのプロセスを安全に管理するかだ。
詳細はWhen AI builds itselfを参照していただきたい。