AIモデルは“賢くない”ことをアピールする時代に? 『Claude Sonnet 5』登場も「サイバー能力は大幅に低い」と主張
米Anthropicは6月30日、AIモデル『Claude Sonnet 5』を発表した。
参考:Googleが4,000億円で取り戻した天才は、なぜ2年で去ったのか AI“頭脳争奪戦”の異常な1週間
Sonnet 5は、同社のClaudeシリーズにおいて「毎日使う中核モデル」と位置付けられるSonnet系の最新版で、ブラウザやターミナルなどのツールを使い、計画を立てて作業を進める「エージェント型AI」としての能力を大きく伸ばした点が特徴だ。Anthropicは「数カ月前なら、より大きく高価なモデルが必要だった水準の自律実行能力」をSonnet 5で実現したと説明している。
Sonnet 5は全プランで利用でき、FreeとProでは既定モデルとなる。Max、Team、Enterpriseのユーザーにも提供され、開発者向けのClaude CodeやClaude Platform、APIでも使える。
Anthropicによると、Sonnet 5は前世代のSonnet 4.6に比べて、推論、ツール利用、コーディング、ナレッジワークで大きく改善し、上位モデルのOpus 4.8に近い性能を低価格で提供するとされる。一般ユーザーにとっては、長い資料の要約、調査、文章作成、コード相談、業務文書の下書きなどでより粘り強く作業できるようになる。開発者や企業にとっては、コード修正、テスト、デバッグ、社内システムをまたぐ手順処理などをAIに任せる用途で使いやすくなるという。
性能面では、Anthropicが公開した主なベンチマークで、Sonnet 5はSonnet 4.6をほぼ全項目で上回っている。ソフトウェア開発系のSWE-bench Proでは63.2%で、Sonnet 4.6の58.1%を上回る一方、Opus 4.8の69.2%には届かない。ターミナル操作を伴うTerminal-Bench 2.1では80.4%で、Sonnet 4.6の67.0%から大きく伸び、Opus 4.8の82.7%に近づいた。業務能力系の評価であるGDPval-AA v2ではOpus 4.8とほぼ同等の数値を示している。
API価格は、2026年8月31日までは100万入力トークンあたり2ドル、100万出力トークンあたり10ドルの導入価格で提供される。9月1日以降は標準価格として、入力3ドル、出力15ドルになる。これはSonnet 4.6と同じ標準価格帯で、Opus 4.8の入力5ドル、出力25ドルより安い。
Sonnet 5では新しいトークナイザーが採用され、同じ入力でもSonnet 4.6より多くのトークンとして数えられる可能性がある。Anthropicは、同じテキストが約30%多いトークンになる場合があるとしており、長文資料や大量のコードを扱う開発者・企業は、実際の利用ログでコストを再計算する必要がある。
仕様面では、Sonnet 5は100万トークンのコンテキストウィンドウと最大12.8万トークンの出力に対応する。Anthropicのモデル一覧では、Sonnet 5は「速度と知能の最良の組み合わせ」と位置付けられ、比較レイテンシは「Fast」とされている。テキストと画像入力、テキスト出力、多言語対応、ビジョン機能をサポートし、スクリーンショット、図表、PDF由来の画像、UI画面などを読み取るワークフローでも使われることを前提としている。
安全性については、Anthropicは事前安全評価で、Sonnet 4.6より望ましくない挙動が全体として少なく、悪意ある要求の拒否やプロンプトインジェクションへの耐性も改善したとしている。ハルシネーションやユーザーへの過度な迎合もSonnet 4.6より低いという。一方で、より高性能なOpus 4.8やClaude Mythos Previewと比べると、不適切な挙動の発生率はやや高いとしている。
サイバーセキュリティ面では、AnthropicはSonnet 5を意図的にサイバータスク向けに訓練していないと説明。Sonnet系モデルはOpus 4.8やMythos 5より危険なサイバー能力が大幅に低いとしている。(文=リアルサウンド編集部)

