「Claude Sonnet 4.6」が登場、人間の代わりにPCを操作する能力が高くGemini 3 ProやGPT-5.2を複数のテストで上回る

AnthropicがAIモデル「Claude Sonnet 4.6」を2026年2月17日にリリースしました。Claude Sonnet 4.6は前世代モデルと比べてコーディング性能やPC使用性能が強化されているほか、最大100万トークンという長大な入力にも対応しています。
Introducing Sonnet 4.6 \ Anthropic
https://www.anthropic.com/news/claude-sonnet-4-6
「Claude Sonnet 4.6」「Claude Sonnet 4.5」「Claude Opus 4.6」「Claude Opus 4.5」「Gemini 3 Pro」「GPT-5.2」の各種ベンチマーク結果を並べた表が以下。ほとんどのテストで前世代モデルのClaude Sonnet 4.5を上回り、PCを用いた自部処理性能を測定するOffice tasksでは全モデルの中でトップの性能を示しました。

AIの知能を測定するARC-AGI-2ではGPT-5.2 Proより低いコストで高いスコアを達成しています。また、初期テストに参加したユーザーの59%は「Claude Sonnet 4.6はClaude Opus 4.5より優れている」と評価したとのこと。

Claude Sonnet 4.6は特にPCを操作するタスクで高い性能を発揮します。AIのPC使用能力を測定するOSWorldでは72.5%というスコアを記録。これは「PCに熟達した人間」よりは低いスコアですが、AIモデルとしては高いスコアです。

Claude Sonnet 4.6によるブラウザなどの操作例は以下の動画で確認できます。また、セキュリティ対策も重視されており、前世代モデルと比べてプロンプトインジェクション攻撃への耐性が大幅に向上しています。
Our most capable Sonnet model yet - YouTube
Claude Sonnet 4.6は最大100万トークンの入力に対応しており、「コードベース全体」「長大な契約文書」「数十件の研究論文」を一度に読み込んで推論することができます。これにより長期的な計画能力が大幅に向上しており、仮想自動販売機を経営するVending-Bench Arenaでは「初期に大幅な設備投資を行う」という戦略を実行してClaude Sonnet 4.5よりはるかに高い利益を得ることに成功しています。

Claude Sonnet 4.6は無料ユーザーを含む全ユーザーが利用可能です。100万トークン当たりの料金は入力が3ドル(約460円)、出力が15ドル(約2300円)です。
