Image: Shutterstock

ついにClaudeがAI性能で頂点に、しかし話は単純ではありません。

2026年4月7日、AI企業「Anthropic」が新AIモデル「Claude Mythos Preview」を発表しました。Anthropicは昨今何かと話題のAIコーディングエージェント「Claude Code」の開発元であり、ChatGPTのOpenAI・GeminiのGoogleと並んで注目されています。

Claude Mythos Previewは既存のAIモデルを大きく上回る性能を備えています。ベンチマークでは軒並みトップ。コーディングから多言語対応にマルチモーダル、超高難易度問題やPC利用能力まで、何から何までナンバーワン。

System Card 186ページ目に掲載されているベンチマーク結果。SWE-benchは実践的なソフトウェアエンジニアリング能力を測定し、Terminal-BenchはPCをコマンドラインから動かして課題を解決する能力を測定する
Image: Anthropic

Anthropicの現行フラッグシップ「Claude Opus 4.6」と比べても、各数値が大きく向上しているのがわかります。

System Card 187ページ目に掲載されているベンチマーク結果。GPQAは選択式のサイエンス問題集、MMMLUは多言語での知識を問うテスト、USAMOは米国の高校数学オリンピックの課題、GraphWalksはグラフノードと長いコンテキストを扱うベンチマーク、HLEは人間の知性の限界に挑む超高難易度テスト、CharXiv Reasoningでは図表の理解能力を問い、OSWorldはPCを用いて文書編集やネット調査を行う能力を測るベンチマークです。
Image: Anthropic

それだけでなく、OpenAIの最新モデル「GPT-5.4」も、Googleの「Gemini 3.1 Pro」をもかなり上回っています。本当にトップ性能なのです。

最強だけど一般公開されない

System Card(2ページ目)には「Claude Mythos Previewは大きな性能向上を見せたが、一般公開はできない」と書かれています
Image: Anthropic

ところが、このClaude Mythos Previewは一般には公開されません。

その理由は「サイバー系の能力が伸びた結果、よく利用されているOSやWebブラウザのゼロデイ脆弱性を自律的に発見する能力も非常に高くなっているから」。

人を攻撃するのに活用されるのを、Anthropicは懸念しているのです。

System Cardの12-13ページ目。Claude Mythos Previewが一般公開されない理由としてゼロデイ脆弱性を自律的に発見する能力が高いことが挙げられている
Image: Anthropic

しかし、死蔵するわけでもありません。

攻撃に使えるということは、防御にも使えます。Anthropicは「サイバーセキュリティを重視する少数のパートナー企業にのみClaude Mythos Previewを提供することにした」と述べています。

Claude Mythos Previewは一般にはモデルカードしか公開されない初のClaudeモデルとなります。素直に受け取れば慎重に責任あるAIを目指す姿勢ですが、一部の人間のみが高性能AIにアクセスできるという方向性でもあります。

AIシーンは今、ものすごい勢いで変化を続けています。コンシューマ向けで見ても、ChatGPT→Gemini→Claude Codeと話題の中心がどんどん変わっていっており、ローカルLLMの性能も劇的に向上していっています。

高性能化したAIは今後どのように扱われていくのでしょうか? 私たちの手元に、やってくるのでしょうか?

MacBookで動くし、ぶっ壊れ性能。いま最強のローカルLLM「Qwen3.5」を解説しちゃう

Source: Anthropic (1, 2)