NVIDIAの高性能GPUはAIの開発および製品展開のために欠かせない存在となっています。そんなNVIDIA製GPUの中でも記事作成時点で最先端製品のGB300 NVL72について、「H200と比べて処理性能が50倍に向上しコストは35分の1になった」とアピールする記事がNVIDIA公式ブログに掲載されました。

New Data Shows NVIDIA Blackwell Ultra Delivers up to 50x Better Performance and 35x Lower Costs for Agentic AI | NVIDIA Blog

https://blogs.nvidia.com/blog/data-blackwell-ultra-performance-lower-cost-agentic-ai/?linkId=100000408009989

GB300 NVL72はAIファクトリー向けラックとして販売されているAI処理システムで、72個のNVIDIA Blackwell Ultra GPUと36個のNVIDIA Grace CPUを搭載しています。すでにMicrosoftやCoreWeaveといったAIクラウド企業が導入を進めており、長大なコンテキストを扱うエージェントコーディングなどのタスクで活用されています。



GB300 NVL72は前世代モデルのGB200 NVL72で蓄積されたカーネル最適化などの成果を継承しており、コンピューティング能力を最大限に発揮することができます。性能の高さとコストの低さを両立しているのも特徴で、GB200 NVL72より低いコストで処理を実行できます。



GB300 NVL72はFP4に量子化したモデルを実行できるのも特徴で、FP4に対応していないHopper世代のGPUと比べて各段に高速な処理が可能です。H200でDeepSeek-R1のFP8版を実行するシナリオとGB300 NVL72でDeepSeek-R1のNVFP4版を実行するシナリオを比較すると、GB300 NVL72は50倍多くのトークンを処理可能です。



さらに、H200と比べてコストを35分の1に抑えることができます。



NVIDIAは次世代アーキテクチャの「Rubin」を採用したGPUを2026年後半に出荷開始予定です。Rubin世代のGPUはBlackwell世代のGPUと比べて100メガワット当たりのスループットが最大10倍に向上し、100万トークン当たりのコストは10分の1に削減できるとのこと。さらに、Blackwell世代のGPUと比較してMoEモデルの学習に必要なGPUの数が4分の1に減ることもアピールされています。