7月3日、Euronewsが「What is GLM 5.2? The new Chinese AI model that's rivalling Anthropic」と題した記事を公開した。中国のZ.aiが開発したオープンソースAIモデル「GLM-5.2」が、AnthropicやOpenAIのモデルに匹敵するベンチマーク性能を示したと報じている。なお以下で引用するベンチマーク数値はいずれもZ.ai自社発表値であり、独立機関による検証は現時点では確認されていない。
Z.aiとGLMシリーズの背景
GLM-5.2を開発したZ.ai(旧称:ZhipuAI)は、中国の名門・清華大学の知識工学グループ(KEG)から生まれたAIスタートアップだ。GLMとは「General Language Model」の略で、清華大学KEGとZhipuAIが共同で研究・開発を続けてきたモデル系列を指す。GLM-4などの先行モデルを経て、今回GLM-5.2が公開された。オープンソース戦略を核に据え、モデルの透明性とアクセス性を重視している点がZ.aiの特徴だ。
米輸出規制の翌日にリリース、という文脈
GLM-5.2のリリースタイミングは地政学的な観点から注目されている。元記事によれば、米国がAnthropicの特定モデルを非米国人向けに供給禁止とした翌日にGLM-5.2は公開されており、この輸出規制はその後6月30日に解除されたとされている(この日付の詳細は元記事の記述に基づく)。
米国がAI輸出規制で技術的優位を守ろうとする動きに対し、中国勢はオープンソース・低コストという別の戦略で対抗している構図だ。DeepSeekのR1が2025年1月に「安価で省エネ」として世界を驚かせたのと、同じ文脈にある。
ベンチマーク性能:長時間コーディングタスクに特化
GLM-5.2が明確に狙いを定めているのは長時間・複雑なコーディングエージェントタスクだ。Z.aiは「長く、煩雑なコーディングエージェントの実行全体で品質を維持する」ことを設計目標として掲げている。
Z.ai発表の3つのベンチマーク結果は以下の通り:
- 数時間〜数日かかるオープンエンドの技術プロジェクトを評価するテスト:Anthropic Claude Opus 4.8にわずか1%差で追随。GPT-5.5とOpus 4.7は上回る
- 単一GPUで小規模モデルを改善する能力を測定するテスト:GPT-5.5とOpus 4.7を上回り、Opus 4.8に次ぐ2位
- コンパイラ構築のようなマラソン級エンジニアリングタスク:Opus 4.8に13%差で劣るが、全体では2位
Z.aiは「3つのベンチマークすべてで、オープンソースモデルの中では1位」と主張している。繰り返しになるがこれらは同社の自己申告値であり、第三者機関による追試結果が出るまでは留保付きで受け止める必要がある。
また、コンテキストウィンドウは100万トークン(約75万語相当)で、長大なコードベースや仕様書を一度に扱える設計になっている。
オープンソース、かつ地域制限なし
GLM-5.2はオープンソースで公開されており、Z.aiは「地域制限なし、技術アクセスに国境なし」と明言している。モデルの出力変更・再配布・商用利用を含む任意の目的での改変が可能だ。
これはAnthropicやOpenAIのクローズドソースモデルとは根本的に異なるアプローチだ。クローズドモデルはプロバイダへの依存が避けられず、ユーザー側での変更はできない。Z.aiがオープン路線を打ち出す背景には、米国の輸出規制がクローズドモデルへのアクセスを制限しうる状況への対抗意識もあると見られる。
米中AI競争の現在地
米国は半導体の輸出規制でAIの優位を守る戦略を採る一方、中国は安価でオープンなモデルで独自の存在感を高めている。GLM-5.2はその流れを加速させる一手だ。ヘルスケアから安全保障まで幅広い領域に影響を与えうるAI技術で、両国の競争は激化している。Z.aiのような清華大学発スタートアップが最前線に立つ構図は、中国のAI開発が特定の巨大企業に集約されるのではなく、アカデミア発のプレイヤーが競争を牽引しているという点でも注目に値する。
詳細はWhat is GLM 5.2? The new Chinese AI model that's rivalling Anthropicを参照していただきたい。