Claude Opus 4.8 effort=high VS effort=max React習熟度比較
DRANK
皆さんこんにちは。前回の記事では、Claude Opus 4.8のリリースを受けて、いつものベンチマークでReact習熟度を測定しました。その結果、effort=high同士の比較で、Opus 4.7から明らかな改善が見られました。今回は、effort=maxでのOpus 4.8の実力を測りました。前回記事はこちらです。 Sonnet 4.6)が採点する形式で行っています。以下はスペックごとのスコアです。3回実行して平均を取っています。 * の意味は記事後半の生レポートを参照してください。スペックdefault 平均(レンジ)max 平均レンジΔ001 イベント登録フォーム91.7(90–94)90.385–94−1.3002 データダッシュボード81.3(74–85)91.791–93+10.3 *003 クイズビルダー80.7(75–84)83.079–87+2.3004 ユーザープロフィール閲覧72.7(69–77)75.372–77+2.7005 システムステータス監視72.0(62–77)85.783–88+13.7 *006 通知アクティビティフィード70.3(70–71)72.769–77+2.3007 SNSフィード79.7(77–81)78.377–81−1.3008 フォームアクション76.0(70–83)80.077–85+4.0009 再利用コンポーネント82.7(76–86)82.373–90−0.3010 ツリーファイルエクスプローラ70.7(70–72)80.779–83+10…