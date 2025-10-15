日本オラクル株式会社

Oracle AI World、ラスベガス ― 2025年10月15日

（本資料は米国2025年 10月 14日にオラクル・コーポレーションより発表されたプレスリリース(https://www.oracle.com/news/announcement/ai-world-oracle-unveils-next-generation-oci-zettascale10-cluster-for-ai-2025-10-14/)の抄訳です）

オラクルは本日、クラウドにおける最大のAIスーパーコンピュータである「Oracle Cloud Infrastructure(https://www.oracle.com/jp/cloud/) (OCI) Zettascale10」を発表しました。「OCI Zettascale10」は数十万台規模のNVIDIA GPUを複数データセンター間で相互接続し、マルチギガワット級のクラスターを構成、ピーク性能で前例のない最大16 zettaFLOPSを実現します。「OCI Zettascale10」は、テキサス州アビリーンでOpenAIと連携して構築中のフラッグシップ・スーパー クラスター（Stargateの一部）を支える基盤ファブリックです。次世代の「Oracle Acceleron RoCE」ネットワーク・アーキテクチャの上に、NVIDIAのAIインフラを組み合わせることで、画期的なスケール、クラスター全体での極めて低いGPU間レイテンシ、業界をリードする価格性能比、クラスター利用率の向上、そして大規模AIワークロードに必要な信頼性を提供します。

「OCI Zettascale10」は、2024年9月に発表(https://www.oracle.com/jp/news/announcement/ocw24-oracle-offers-first-zettascale-cloud-computing-cluster-2024-09-11/)した初代Zettascaleクラウド・コンピューティング・クラスターの強力な進化版です。「OCI Zettascale10」クラスターは、密度を最適化したギガワット級の大規模データセンター・キャンパス（半径2キロ以内）に配置され、大規模AI学習ワークロードに最適なGPU間レイテンシを実現します。このアーキテクチャは、アビリーンのStargateサイトでOpenAIとともに展開されています。

Oracle Cloud Infrastructure担当エグゼクティブ・バイスプレジデントのマヘッシュ・シャガラジャン（Mahesh Thiagarajan）は次のように述べています。「『OCI Zettascale10』により、OCIが誇る革新的な『Oracle Acceleron RoCE』ネットワーク・アーキテクチャと次世代のNVIDIA AIインフラを融合し、他に類を見ないスケールでマルチギガワット級のAIキャパシティを提供します。お客様は、性能当たりの消費電力を抑えながら、高い信頼性をもって最大規模のAIモデルを本番環境で構築・学習・展開できます。さらに、オラクルの分散型クラウド全体で強力なデータおよびAI主権コントロールの下、自由度の高い運用が可能になります。」

OpenAIのインフラストラクチャ＆インダストリアル・コンピュート担当バイスプレジデント、Peter Hoeschele氏は次のように述べています。「『OCI Zettascale10』のネットワークおよびクラスター・ファブリックは、テキサス州アビリーンのStargateフラッグシップサイト（オラクルとの共同スーパークラスター）で初めて開発・導入されました。高度にスケーラブルなカスタムRoCE設計により、ギガワット規模でもファブリック全体の性能を最大化し、電力の大部分を計算に振り向けられます。アビリーン、そしてStargate全体の拡張を引き続き進められることを嬉しく思います。」

OCIは「OCI Zettascale10」のマルチギガワット規模での展開をお客様向けに提供する計画です。初期段階では、最大80万基のNVIDIA GPUを備え、予測可能な性能と高いコスト効率を実現するクラスター展開を想定しており、「Oracle Acceleron」の超低遅延RoCEv2ネットワーキングによって高帯域のGPU間接続を提供します。

NVIDIAのハイパースケール担当バイスプレジデント、Ian Buck氏は次のように述べています。「オラクルとNVIDIAは、OCIの分散型クラウドと当社のフルスタックAIインフラを組み合わせ、かつてないスケールでAIを実現します。NVIDIAのフルスタックAIインフラを搭載した『OCI Zettascale10』は、最先端のAI研究を前進させ、世界中の組織が実験段階から産業化されたAIへ移行するのに必要な計算ファブリックを提供します。」

Oracle Acceleron RoCE ネットワーキングで、OCI Zettascale10上のAIにスケール、信頼性、効率性を提供

「Oracle Acceleron RoCE」 ネットワーキング・アーキテクチャは、クラウド上でAIワークロードの構築・学習・推論を行うお客様にとって、「OCI Zettascale10」の性能と能力を最大限に引き出すための重要なイノベーションです。最新GPU用NICs(https://www.nvidia.com/en-us/networking/products/ethernet/supernic/)（ネットワーク・インターフェイス・カード）に内蔵されたスイッチ機能を活用し、複数のスイッチに同時接続（各スイッチは独立したネットワーク・プレーン）します。この手法により、あるプレーンに問題が生じた場合でも他プレーンへトラフィックを退避でき、全体のスケールと信頼性を飛躍的に高め、コストのかかる停止や再開を回避します。主な特長は以下のとおりです。

- スケールかつ階層が少なく、耐障害性の高いファブリック: GPU NICをミニスイッチとして用い、物理・論理的に分離された複数プレーンへ接続。ネットワーク階層、コスト、消費電力を抑えつつスケールを拡大。- 高い信頼性: プレーン間のデータ共有を排除し、不安定・輻輳したプレーンからトラフィックを退避。学習ジョブの継続性を維持し、コストの高いチェックポイント再開を回避。- 一貫した性能: 従来の三層設計から一層削減し、GPU間レイテンシのばらつきを低減。大規模学習・推論の予測可能性を改善。- 省電力光学: LPO（Linear Pluggable Optics）とLRO（Linear Receiver Optics）に対応し、400G/800Gのスループットを維持しつつネットワーク／冷却コストを削減。- 運用の柔軟性: プレーン単位のメンテナンスや独立したネットワークOS更新により、ダウンタイムを削減し、新機能の展開を加速。

OCIは現在、「OCI Zettascale10」の受注を開始しており、来年下半期に最大80万基のNVIDIA AIインフラGPUプラットフォームとともに提供開始予定です。

参考リンク

- マヘシュ・シャガラジャンによるOracle AI Worldの基調講演(https://www.oracle.com/ai-world/on-air/)- OCI AI infrastructure(https://www.oracle.com/jp/ai-infrastructure/)

