中国のAI企業であるZ.aiがAIモデル「GLM-5.2」を日本時間の2026年6月17日に正式発表しました。GLM-5.2は各種ベンチマークでClaude Opus 4.7を上回るスコアを記録しており、人間によるブラインドテストではClaude Fable 5を上回った例もあります。

GLM-5.2: Built for Long-Horizon Tasks

https://z.ai/blog/glm-5.2

GLM-5.2の情報は、2026年6月13日に「Claude Fable 5」と「Claude Mythos 5」のサービスが停止した際に一部が発表されていました。最初の発表時点では「強力なコーディング機能を備え、100万トークンの入力に対応し、長期的なタスクの継続実行が可能」ということがだけが明らかになっていましたが、今回の正式発表によって性能の詳細が明らかになりました。

Claude Fableのサービス停止を受けて中国企業が最先端モデル「GLM-5.2」を急遽発表、2026年6月中に無料公開へ - GIGAZINE



GLM-5.2はパラメーター数7530億の大型モデルで、100万トークンの入力に対応しています。「GLM-5.2」「GLM-5.1」「Claude Opus 4.8」「GPT-5.5」「Gemini 3.1 Pro」の各種ベンチマーク結果が以下。GLM-5.2は複数のテストでGPT-5.5を上回り、Claude Opus 4.8に迫るスコアを記録しています。



GLM-5.2は長時間におよぶタスクの実行性能の高さを特徴としています。以下のグラフは「GLM-5.2」「Claude Opus 4.8」「Claude Opus 4.7」「GPT-5.5」「Gemini 3.1 Pro」で長時間におよぶタスクの実行性能を比較したもので、GLM-5.2がClaude Opus 4.7やGPT-5.5を上回りました。



以下のグラフはコーディングエージェントとしての性能を示したもので、横軸が出力トークン数、縦軸が性能です。GLM-5.2(青)の長大なタスクにおける性能の高さが分かります。



GLM-5.2は「AIの名前を伏せた状態で人間に性能を評価させる」という形式のテストでも高く評価されています。Arena(旧称:LMArena)のコーディング性能テストではClaude Opus 4.7やClaude Opus 4.8を上回って世界2位の性能と評価されました。



また、Design Arenaのコーディング性能テストではClaude Fable 5にも勝利して世界1位となっています。



GLM-5.2はZ.aiのチャットAIサービスで利用可能なほか、「ZCode」「Claude Code」「OpenCode」といったコーディングエージェントでも利用できます。また、以下のリンク先でMIT Licenseのオープンモデルとしても配布されています。

zai-org/GLM-5.2 · Hugging Face

https://huggingface.co/zai-org/GLM-5.2