NVIDIAが、次世代のエージェント型AIおよび物理AIを推進するAIファクトリー向けにGoogle Cloud AI Hypercomputerを拡張することを発表しました。最大で96万基のRubin GPUまでスケール可能なNVIDIA Vera Rubin搭載の「A5X」インスタンスを企業が利用できるようになります。

NVIDIA and Google Cloud Collaborate to Advance Agentic and Physical AI | NVIDIA Blog

https://blogs.nvidia.com/blog/google-cloud-agentic-physical-ai-factories/





新たに発表された「A5X」はNVIDIA Vera Rubin NVL72ラックスケールシステムを採用したベアメタルインスタンスです。ベアメタルインスタンスとは、仮想サーバーではなく物理サーバー単体を一社が独占利用できるシステムを指します。

A5Xは前世代と比べてトークンあたりの推論コストが最大10分の1に削減され、メガワットあたりのトークンスループットが最大10倍に向上しているとのこと。ネットワーキングシステム「NVIDIA ConnectX-9 SuperNIC」と「Google Virgo」を組み合わせることで、単一サイトのクラスターで最大8万基、マルチサイトクラスターで最大96万基のNVIDIA Rubin GPUまでスケール可能になるとのことです。

このほか、NVIDIA BlackwellおよびNVIDIA Blackwell Ultra GPU上で動作するGoogle Distributed Cloud上のGoogle Geminiのプレビュー、NVIDIA Blackwell GPUを備えた機密VM、そしてNVIDIA NemotronのオープンモデルとNVIDIA NeMoフレームワークを用いたGemini Enterprise Agent Platform上のエージェント型AIなど、さまざまなシステムも統合できます。

NVIDIAが1200億パラメータ規模の日本語対応ハイブリッドMoEオープンウェイトAIモデル「Nemotron 3 Super」を発表 - GIGAZINE



これらのサービスを利用することで、Mixture-of-Expertsによる推論、マルチモーダル推論、データ処理、フィジカルAIやロボティクスの複雑なシミュレーションに至るまで、あらゆるワークロードの最適化を実現できるとNVIDIAはアピールしました。

GoogleとNVIDIAとの提携は10年目の節目を迎えるとのことです。