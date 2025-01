2025年の幕開けに、パーソナルコンピュータのハードウェア技術の動向を占う毎年恒例の特集記事「PCテクノロジートレンド」をお届けする。本稿はGPU編だ。近年、コンピュータハードウェアの中でもとりわけ注目を浴びるのがこのGPUであり、その中でも独走状態と言えるのがNVIDIAであるのだが、2025年はついにNVIDIAのBlackwellが市場に出てくる。追う立場のAMDとIntelがどう立ち向かうのか、ロードマップをまとめてみたい。

***2025年のNVIDIA GPU - Blackwellが来る! RTX 5000をCESで解禁へ長らくGeForce RTX 4000シリーズのまま続いてきたNVIDIAのコンシューマ向けGPUであるが、やっと2025年になって後継製品が出るようだ。もっとも過去の歴史で言えばGeForce GTX 900シリーズ : 2014年9月GeForce GTX 1000シリーズ: 2016年5月GeForce RTX 2000シリーズ: 2018年8月GeForce RTX 3000シリーズ: 2020年9月GeForce RTX 4000シリーズ: 2022年9月という感じになっており、平均2年間隔で新シリーズ投入という感じだから、すごく遅れたという訳でも無い。こんな風に2年毎に新製品というのは、もはやアーキテクチャよりもプロセス微細化の方が性能向上に効く(プロセスを変えずにアーキテクチャだけいじっても、そんなに性能が上がらない)関係で、新プロセスノードが利用できる様になるごとに新製品を投入しており、これが大体2年に1回程度だからという話である。スマートフォン向けだと、例えばTSMCのN7とN7P、N6で別々のプロセスノードと見做してそれぞれ新製品を投入するという事もあるが、GPUの場合はロジック密度が大きく向上しないと大きな性能差に繋がらない。そうなるとN7からN5に移行するまで見送りとなり、この結果2年ほどの間隔になる訳だ。もっとも2023年から2024年にかけて、NVIDIAの売上の大半はData Center向けのGPUに集中しており、しかも2024年発表のBlackwellは更に大きな売り上げに繋がると見られていた事で、エンジニアリングリソースをこちらに割いた結果として多少コンシューマ向けの開発が遅れても無理は無いだろう、とは思う。さてそんなNVIDIAであるが、恐らく2025年1月のCESのタイミングで新製品を発表するものと思われる。ちなみにそのCESに向けたTeaserがこちら(https://x.com/NVIDIAGeForce/status/1867396590983368886)なのだが、中央の50は表向きGeForce LAN 50に掛けたものである。ただ実際にはこれがGeForce RTX 5000シリーズの意味も兼ねているという説もある。It all starts now…🟢 CELEBRATE 25 Years of GeForce🟢 PLAY along & join our GeForce LAN 50🟢 WATCH our NVIDIA Keynote at CES 2025 on 1/6/25#GeForceGreats → https://t.co/LGRaII9HUV pic.twitter.com/enMKzdr5OK- NVIDIA GeForce (@NVIDIAGeForce) December 13, 2024さて現在聞こえてきている情報では、コンシューマ向けのGeForce(恐らくGeForce RTX 5000シリーズ)はBlackwellアーキテクチャベースになるらしい。GeForce RTX 4000シリーズがAda Lovelaceで、これはサーバー向けにA100と同じベースである。ただその後サーバー向けにはHopperが挟まっており、一方コンシューマ向けにはHopperベースの製品は出なかったから、次はBlackwellになるというのは一応整合性が取れている。というのはGeForce系列とData Center向け(旧Tesla系列)のアーキテクチャを並べると、という具合に、2016年以降は同じアーキテクチャと違うアーキテクチャが交互に来ている。2022年は異なっていた(Ada LovelaceとHopper)から、今度は同じBlackwellになるのは自然である。事前情報(≠NVIDIAからの情報)ではProcessはTSMC 4NP。TSMC 4Nと比較してロジック密度30%向上まず発表されるのはGeForce RTX 5080とGeForce RTX 5090だが、出荷はGeForce RTX 5080が先行し、2025年1月中に発売開始。GeForce RTX 5090は2025年1月末ないし2月に発売予定GeForce RTX 5090はGB202ベースで、21,760 CUDA Core、512bit/28Gbps 32GB GDDR7。TBP 600WGeForce RTX 5080はGB203ベースで、10,752 CUDA Core、256bit/30Gbps 16GB GDDR7。TBP 400Wといった話が流れている。まぁ間もなくNVIDIAの正式発表があるだろうから、分析はそれを受けてからでいいだろう。ただ一つだけ疑問なのは、そのプロセスであるTSMC 4NPである。現在の4Nプロセスの改良版だが、トランジスタ密度を30%も引き上げるのは普通に考えれば無理で、もうそれは3nmプロセスだと思う。あるいはより小型化したCell Libraryを利用する事で、ロジック密度(≠トランジスタ密度)を「最大」30%縮小というならまぁ判らなくもないのだが。ただ既存のBlackwell(GB100)が144SM、18,432 CUDA Core構成だから、84 SMのGB203はともかくGB202は170SMになる。GB100の推定ダイサイズは783.4平方mmほどで、これはGH100の814平方mmよりはやや小さいのだが、144SM→170SMで18%ほど大きくなることを考えると、4Nプロセスのままだと924.8平方mmほどになり、明らかにReticle Limitをはみ出す。これが仮に30%縮まれば647.4平方mmという、割と現実的な数字に収まる筈なのだが、そうではなく単にロジック密度が上がっただけだとすれば800平方mm台は間違いない。こうした事を考えると、TSMC N3Eベースの3Nとかになると思うのだが、これは事前情報と異なる話である。この辺は発表を待ちたいところだ。さて第1四半期にそんな訳でTop Endの2製品が発表される訳だが、その下のSKUとしてはGeForce RTX 5070 Ti:GB203、8,960 CUDA Core(70 SM)、256bit/28Gbps 16GB GDDR7、TBP 300WGeForce RTX 5070:GB205、6,144 CUDA Core(48 SM)、192bit/28Gbps 12GB GDDR7、TBP 250Wといった製品が用意されているらしい。ただしCESのタイミングでこれを全部発表するかは不明だし、登場時期も2025年第1四半期末〜第2四半期というあたりと思われる。その下のSKUに関しては、2025年中に出るか、もしくは2026年まで持ち越しになるのかも含めて不明である。まぁこのグレードに関しては既存のGeForce RTX 4000シリーズ(GeForce RTX 4060/4060 Tiとか、何ならGeForce RTX 4070 Superを値下げして出すという案もある)で十分賄えるので、2025年前半に急いで出す必要は無いだろう。恐らく出ても2025年後半、下手をすると2026年になるかと思われる(この辺は競合製品の動向を見ながらスケジュールが変更されそうだ)。実際GeForce RTX 4000シリーズの場合といった具合で、ローエンドのGeForce RTX 4060が発売されたのはGeForce RTX 4090から8か月遅れだった。なので急いで出す必要は無さそうだ。ついでにデータセンター向けについても簡単に説明しておきたい。以前はTeslaシリーズで通じたのだが、最近Teslaを使わなくなってしまったので、説明が面倒くさい。まぁそれはともかく、現在NVIDIAはBlackwellベースのGB200の量産準備の最終段階である。本来だと2024年中に発売される筈だったのが、ProcessのTSMC編で説明したように、まずCoWoS-Lの製造に関して何かトラブルがあったようで、この解決のために若干遅れ、更に消費電力が当初想定よりも大きくなった(そもそもGB200×2+Grace CPUを組み合わせたGB200 Grace Blackwell Superchipに利用されるGB200の消費電力が、当初想定の1200Wから実際には1400Wに増えたらしい)事で、ラック回りの設備の作り直しなども発生、結局出荷が2025年からになってしまった模様だ。ちなみにGrace CPUは250W程度と想定される(これはGrace×2構成のGrace CPU Superchipの消費電力が500Wとなっていることから、1個あたり250Wと推定できる)事を考えると、GB200NVL72(https://www.nvidia.com/ja-jp/data-center/gb200-nvl72/)に搭載されるモジュール1枚あたりの消費電力は1400×2+250=3050W。これが36枚で109,800KW。つまりスイッチやら冷却システムやらを加味しなくても110KWに達しており、システム全体では140KWになるというのはまぁ妥当というか、何と言うか。さて以前のロードマップ(Photo01)では2024年中にB100やB40も投入される予定だったのだが、GB200の遅れもあってこうしたものが全部2025年にズレ込んだ模様だ。その辺もあってか、2024年6月のCOMPUTEXにおける基調講演で、このあたりのロードマップを全部刷新した(Photo02)。B40は消え、またB100単体もラインナップから消えている。その代わり、BlackwellベースながらHBM3E 12HiのStackを8つ搭載したBlackwell Ultraを2025年中に出すとしている。また2026年には新しいRubin GPUと、現在のGrace CPUの後継となるVera CPUを投入予定だとする。多分詳細は2025年中にどこまで出て来るかは怪しいところで、2026年のGTCで語られるかと思う。Photo01: これはNVIDIAが2023年10月にInvestor Meetingで示したもの。GB200以外に、1ダイのB100や、そのサブセット版のB40も並んでいる。Photo02: もっともこれハイエンドだけなので、B40とかは省かれているだけの可能性もある。そんな訳で2025年はあんまり新製品とかは無く、単に現在の鬼のようなBlackwellのバックオーダーを片付けるので精一杯という感じではないか、と想像される。ちなみにRubinの中身とかVeraの中身も同様に不明である。Veraに関しては、そもそもGraceがNeoverse V2ベースだったから、Neoverse V3あたりが考えやすいが、あるいは現在Armが開発中のNeoverse V4を先行して実装している可能性もあるかもしれない(登場時期を考えると、既にNeoverse V3は陳腐化している時期だからだ)。2025年のAMD GPU - CES発表はRDNA4ベースのRadeon RX 9000かコンシューマ向けGPUのシェアでNVIDIAに大きく水を開けられているAMD。もっとも現行のRNDA3ベースの製品で言うとといった感じで、そもそもラインナップそのものがやや乏しい。あと通常の3D描画は兎も角DirectX Ray Tracingが入ると性能が落ちるのが欠点で、このあたりもNVIDIAに水を開けられている理由の一つである。そんなAMDであるが、2025年はRDNA4ベースの製品を投入するとされる。これも発表は2025年1月のCESとなる予定である。事前情報(≠AMDからの情報)では、Radeon RX 9070 XT:Navi48 XTベース。64CU、64MB Infinity Cache、256bit/20Gbps 16GB GDDR6。TDP 330WRadeon RX 9070:Navi48 XTベース。48CU(?)、48MB Infinity Cache、192bit/18Gbps 12GB GDDR6。TDP 285W(?)Radeon RX 9060 XT:Navi44ベース。32CU、32MB Infinity Cache、128bit/18Gbps 16GB GDDR6。TDP 250W(?)Radeon RX 9060:Navi44ベース。28CU(?)、32MB Infinity Cache、128bit/16Gbps 8GB GDDR6。TDP 195W(?)といったラインナップであると伝えられる((?)がついているのは数字がばらついている、あるいは不明のもの)。の4つがあるらしい。一番上のグレードが64CUという事は、SP(Streaming Processor)は4096基である。RDNA 3世代からSPあたりの演算性能が倍増しているので、端的に言えばNVIDIAのCUDA Core換算で言えば8192基相当になる。要するにトップエンド向けではなくミドルレンジ向け、という事になる。実際型番もNVIDIAに合わせた風情があり、要するにRadeon RX 9070 XT : GeForce RTX 5070 Ti対抗Radeon RX 9070 : GeForce RTX 5070対抗Radeon RX 9060 XT : GeForce RTX 5060 Ti対抗(NVIDIAの当該製品が出るかどうかは不明)Radeon RX 9060 : GeForce RTX 5060対抗(同上)といった扱いであり、GeForce RTX 5080/5090対抗製品はラインナップされないことになる。このあたりはNVIDIAとちょっと方向性の違いが明確である。NVIDIAの場合、Data Center向けとアーキテクチャが共通で、大きなダイを作りやすい&引き続きMonolithicベースのダイで製造している(Blackwell GB200は、同じダイを2つ繋げただけで、あれはChipletとは呼べない構造である)のに対し、AMDはCDNAは完全にChiplet構造に移行してしまっている。なのでRDNAはCDNAとは全く異なる最適化の方向に向けることが可能となり、そうなるとYieldが下がる大型ダイではなく、比較的コンパクトに収まるミドルサイズのダイで実現できるミドルレンジに焦点を当て、そこでの確実な売上を狙った方が良いという判断だろう。ちなみにこれもまだ未確定情報だが、GeForce RTX 5090は$1,999(多分国内価格は40万円程)、GeForce RTX 5080は$1,599(同32万円)程、と超高価になるという話がある。こうした高価な製品はそれほど大量には売れないし、その割に開発コストが馬鹿にならないから、実質的な利幅は非常に薄くなる。Data Center向けにバカ売れしているお陰で記録的な黒字状況が続き、開発資金も潤沢なNVIDIAに比べ、XboxやPS5向けの生産が縮小/終了した事もあって売り上げが急減、2024年第3四半期には部門別利益が0に近い(辛うじて赤字にはなっていない)AMDのGraphics部門が同じことをできる訳もない。ミドルレンジに焦点を当てて、ここでシェアを稼ぎたいというAMDの戦略は堅実なものではあると言えよう。もっとも長期的に見ると、こうしたトップエンドのSKUが無い状況で、ゲームメーカーがどこまでAMDを積極的にサポートし続けてくれるのか? というのはちょっと疑問であり、どこかでまたトップエンド向けも手掛けないといけない気はするのだが、少なくともそれは2025年ではないという事だろう。話を戻すと、Navi 44/48はどちらもMonolithic構成のダイである。Navi 31ではGPUダイ(GCD)とInfinity Cache/GDDR6 I/Fダイ(MCD)を分離したChiplet構成を取ったが、メインストリーム向けではChipletの形で機能分割するより、Monolithicの方がトータルでコストが安くなると判断された様だ。こうなると、「単なるRNDA 3 Refreshなのでは?」という気もする訳だが、半分正しい。実は元々RDNA 4はもっと積極的なChiplet構成を取る予定だったらしい。つまり複数のGCDから構成されるというものだが、開発途中でこのアイディアは放棄された。この話は2024年のロードマップでも触れたが、もともとRDNA 3の世代でもChiplet構成を取ろうとするとInterconnectが多くなりすぎて無理という話があった。で、CPUのAMD編の最後の方でSamuel Naffziger氏に質問をした事を記したが、このGPUについても「RDNA 3の世代ではInterconnectが多くなりすぎて無理と言っていたが、今は? CDNAはもう完全にChipletに移行したよね?」と尋ねたところ「今もRNDAのChipletは技術的に無理だ。CDNAとは要求が違う」という返事が返ってきた。話を戻すとそんな訳で元々のRDNA 4の開発が没になった関係で、現在のRDNA 4はRDNA 3のRefresh版として開発されなおしたものである。ただしいくつか重要な相違点がある。一つはRay Tracing Engineの強化で、これに関してはNVIDIA(の同グレード製品)と比肩しうる程度まで強化された「らしい」。またDirectML向けの演算性能も改善されたらしい。なので、Refreshとは言っても従来の弱点は見事にカバーされた模様である。Radeon RX 9070 XT/Radeon RX 9070は2025年2月出荷、Radeon RX 9060 XT/9060は同3月出荷を予定しているらしい。2025年中はどうもこれ以上の製品は出そうにないのはちょっと残念である。まぁその分価格はかなり下がるらしいので、ここに期待したいところだ。2025年のIntel GPU - Battlemageは無事立ち上がるも、その後が予断許さず2024年のロードマップでは出荷そのものを疑ったBattlemageベースのIntel Arcであるが、2024年12月にArc Bシリーズとして発表された。ベンチマーク結果も上々で、Arc B580は$249ながらGeForce RTX 4060と互角以上の性能を発揮する事も確認されている。2024年12月22日のレポートでは既に秋葉原でも発売が始まっている。もっとも平均5万円ちょいといったところで、安いものだと\41,976まで下がっているGeForce RTX 4060と比較すると厳しいという見方もあるが、この最安値のGeForce RTX 4060は8GB Memory、一方Arc B580は12GB Memoryであることを考慮すると、そう高くもない。まぁそれは兎も角無事に発売されたのは何よりである。ただ状況が状況だけに、今後がどうなるかはさっぱり見えない。以前のロードマップ(Photo03)によればこのあとCelestia/Druidというコアが予定されていた筈なのだが、Celestial以降がまだDiscrete Graphicsに向けた開発を行っているかどうかがさっぱり不明なためだ。普通に考えたら厳しそうな気はするのだが、現状では何とも言い難い。ただ普通に考えれば2025年中にCelestialベースのカードが出てくる事は無さそう、という事だけは言えると思う。Photo03: これは2021年のIntel Architecture Dayの時のもの。ただこのロードマップを立てたRaja Koduriが既にIntelに不在なのが...