6月30日、Luke Jamesが「Chinese Z.ai's latest model tops AI ranking charts amid Anthropic Fable 5 ban」と題した記事を公開した。この記事では、中国のZ.aiがHuawei製チップのみで訓練したオープンウェイトモデル「GLM-5.2」がAIランキング首位に立った経緯と、その技術的・地政学的背景について詳しく紹介されている。
Fable 5が突然消え、GLM-5.2が浮上した
6月10日、AnthropicはFable 5(同社の最新クローズドモデル)を公開した。だが2日後の6月12日、米商務省が外国籍の人物へのアクセスを全面遮断する輸出管理指令を発動。Anthropicは米国ユーザーだけに限定して提供継続する手段を持たず、結果として全ユーザーに対してモデルを自主的にシャットダウンせざるを得なかった。規制当局に命じられた「撤退」ではなく、Anthropic自身の判断による停止である点は注意が必要だ。
商務省が問題視したのは、Fable 5のセーフガードを回避するジェイルブレイク手法の存在だ。これに対してAnthropicは「該当の脆弱性は限定的であり、GPT-5.5(OpenAIが同時期に提供している競合モデル)を含む他の公開モデルでも同様の挙動が得られる」と反論し、指令は「誤解に基づく」として撤回を求めている。だが現時点ではモデルは止まったままだ。
翌6月13日、北京を拠点とするZ.ai(旧称:Zhipu AI、香港取引所では「Knowledge Atlas Technology」として上場)がGLM-5.2の展開を開始した。MIT licenseで公開されたオープンウェイトモデルで、誰でもダウンロード・ファインチューニング・セルフホストが可能だ。
Nvidia不使用——Huawei Ascend 910B×約10万基で訓練
GLM-5.2の最大の注目点は、NvidiaのGPUを一切使わずに訓練されたと主張している点だ。
Z.aiは2025年1月に米国のエンティティリスト(輸出規制の対象となる企業・団体のリスト)に追加され、H100・H200・B200といったNvidiaの最先端アクセラレータを調達できない状況にある。そのZ.aiが採用したのが、Huawei Ascend 910B(Huaweiが自社開発したAI向けアクセラレータ)を約10万基使用し、MindSpore(Huaweiが開発したオープンソースのディープラーニングフレームワーク)で訓練する構成だ。
ただし、ハードウェアの性能差は無視できない。外交問題評議会(Council on Foreign Relations)の2024年12月レポートによれば、Ascend 910CはNvidia H100の推論性能の約60%にとどまり、効率やクラスタースケールでも大きな差がある。同レポートは早ければ来年中に、米国製最上位チップがHuawei製を17倍以上上回る可能性を示している。
一方でHuawei側は、1,000基のAscendクラスターでDeepSeek V4のフルパラメータ後訓練を処理したと主張している。これが事実であれば、中国国産シリコンが訓練クラスのジョブを担えることは示されているが、モデルの性能水準(モデルのパリティ)とチップの処理能力水準(ハードウェアのパリティ)は別の話だ。前者は後者を必ずしも意味しない。
ベンチマーク:首位だが万能ではない
GLM-5.2の性能は、「強いが偏りがある」という評価が正確だ。
- Design Arenaのコーディング人間評価ボード:1位(Fable 5に約10 Elo差)
- Artificial AnalysisのIntelligence Index v4.1:スコア51でオープンウェイトモデル首位。MiniMax-M3、DeepSeek V4 Pro、Google Gemini 3.1 Pro Previewを上回る
- SWE-bench Pro(ソフトウェアエンジニアリングタスクの実力を測るベンチマーク):62.1(GPT-5.5の58.6を上回る)
一方で弱い領域もある。
- Terminal-Bench 2.1(ターミナル操作・シェルコマンドの実行能力を評価するベンチマーク):GLM-5.2が81.0に対し、Opus 4.8(Anthropicの別系列モデル)が85.0、GPT-5.5が84.0
- AA-Briefcase(数千の断片的入力から構成される数週間分の知識タスク):Fable 5が1,587 Elo、Opus 4.8が1,356、GLM-5.2が1,266で3位
「首位」という評価は、上位にいたFable 5とMythos 5(同ランキングで上位に位置していた別の高性能クローズドモデルで、こちらも輸出規制の影響でアクセス不能となった)が輸出規制でアクセス不能になったという文脈込みで読む必要がある。
実用面:MIT licenseでも動かすのは重い
GLM-5.2は総パラメータ数744億、1トークンあたりのアクティブパラメータ40億、コンテキストウィンドウ100万トークンという構成だ。MIT licenseで自由に利用できるとはいえ、デスクトップで動かせる代物ではなく、エンタープライズ向けGPUクラスターか高メモリワークステーションが必須となる。また、コンテキストが数万トークンを超えるとスループットが急落する点も留意が必要だ。
現実的な利用方法はAPIだ。料金はインプット**$1.40/百万トークン、アウトプット$4.40/百万トークン。Claude Opus 4.8($5/$25)やFable 5($10/$50)と比べると大幅に安い。AA-Briefcaseのベンチマーク実行では、Fable 5が1タスクあたり平均$31だったのに対し、GLM-5.2は$2.40——約13倍のコスト差**だ。
株価と今後の注目点
GLM-5.2の公開を受け、6月22日にZ.aiの株価は一時42%上昇してHK$2,980を記録。時価総額はHK$1兆(約1,280億ドル)を超えた。創業者のTang Jie氏は、Elon Musk(Tesla・xAI CEO)が公開のインタビューで言及したタイムライン——「中国が米国と同等の最先端AIモデルを持つまでには数年かかる」という趣旨の発言——より早く、Fable 5クラスの中国製モデルが登場すると公言している。
直近の注目点は7月8日だ。Z.aiの初期コーナーストーン投資家のロックアップ期限が切れ、大きな株式ブロックが市場に出回ることになる。これがGLM-5.2の株価ラリーに対する最初の実質的な試練となる。
詳細はChinese Z.ai's latest model tops AI ranking charts amid Anthropic Fable 5 banを参照していただきたい。