●アップデート情報 / 3DMark

既報の通り、既に筆者の手元にはRadeon RX 7970 XT/XTXの機材が届いているので、これを利用しての性能比較をお届けしたい。

写真は「Radeon RX 7970 XTX」。今回入手したRadeon RX 7970 XTとRadeon RX 7970 XTXの外観やスペック概要は、別掲載の開封記事でも詳しく紹介しているので参考にしてほしい。

ちなみに開封の儀では説明できなかったアップデート情報が一つ。当初の情報では、Radeon RX 7970 XTのTBP(Total Board Power)は300Wとされていたが、これが315Wに改定された。想定よりも消費電力が大きかったらしい。また開封の儀では、動作状態を示す事が出来なかったので、Radeon RX 7970 XTX(Photo01〜02)とRadeon RX 7970 XT(Photo03〜04)のGPU-Zの結果も一緒に示しておく。

テスト環境は表1の通りだ。今回は対抗馬としてGeForce RTX 4080 Founder Editionを利用した。AMD自身もRadeon RX 7900 XT/XTXのターゲットをGeForce RTX 4080と明言しているので、比較対象として手頃かと思う。

表1が今回のテスト環境となっている。グラフ中の表記は

RTX 4080 :GeForce RTX 4080 Founder Edition

RX 7900XT :Radeon RX 7900 XT Reference

RX 7900XTX:Radeon RX 7900 XTX Reference

となっている。また本文中の解像度表記は、いつものように

2K :1920×1080pixel

2.5K:2560×1440pixel

3K :3200×1800pixel

4K :3840×2160pixel

とさせていただいた。

ちなみにいくつかのテストではRay Tracingの有無、及びSuperSamplingの有無で更に表記が変わるが、これについては都度説明したい。

Photo01: 96CU、2.27GHz/2.5GHz駆動に設定されている。Memory Clockは2.5GHzなので、GDDR6 20Gbpsという計算になる。

Photo02: Game Clockは2.3GHzという話だったが、実際はもう少し低く2.27GHz。Power Limitは最大+15%なので、フルに引き上げると408Wまで行く計算になる。

Photo03: ROPの数は96のままなのが意外だが、TMUは336なので84CU相当になる。Game Clockは2.025GHz。それはともかくまだCrossFireが利用可能なのか(いや、互換性を保つので残るとは言われていたのだが)。

Photo04: こちらもPower Limitは最大+15%なので、362Wまで行く計算。

○◆3DMark v2.25.8043(グラフ1〜3)

3DMark v2.25.8043

UL Benchmarks

https://benchmarks.ul.com/3dmark

グラフ1

グラフ2

グラフ3

まずは手頃にこちらから。Overall(グラフ1)を見ると、WildLifeではGeForce RTX 4080が高速だが、NightRaid〜TimeSpyではRadeon RX 7900 XTXが優位。ただしPortRoyalとSpeedWayでは再び逆転といったところ。いずれのテストでもRadeon RX 7900 XTは一番スコアが低い(特にSpeedWayでこれが顕著)が、ただ例えばPortRoyalの13621は、(古いデータで恐縮だが)Radeon RX 6900 XTの9542を上回っている事を考えると、絶対的な性能そのものは明確に向上しており、ただ今回の3製品の中ではちょっと分が悪いといったころ。もっともNightRaid〜TimeSpyではGeForce RTX 4080にちょっとだけ及ばない程度の、かなり良いスコアを示しているあたりは(予想は出来た事だが)「Ray Tracingを使わない限りにおいては良い勝負」と言える。

グラフ2はGraphics Scoreで、CPUが全部一緒である事を考えるとほぼ3DMark Scoreに近いわけで傾向は当然同じである。多少バラけるのがCombined Scoreで、Graphics Scoreから考えるとRadeon RX 7900 XTのスコアがもう少し上でも良さそうな気はするのだが。

●ゲームその1: Assassin's Creed / Borderlands 3 / Cyberpunk 2077 / F1 22

○◆Assassin's Creed Valhalla(グラフ4〜10)

Assassin's Creed Valhalla

UBISOFT

https://www.epicgames.com/store/ja/p/assassins-creed-valhalla

グラフ4

グラフ5

グラフ6

グラフ7

グラフ8

グラフ9

グラフ10

久々にこれを引っ張り出してきてみた。ベンチマーク方法はこちらのAssassin's Creed Valhallaの項目に準ずる。設定は

Quality:Ultra High

とし、あとはデフォルトのままである。ちなみにこれ(と後で出てくるForza Horizon 5)は、In-Game Benchmarkはあるがフレームレート変動を取得する方法が無い。以前はここでOCATを使っていたのだが、結構ゲームと干渉する事も多かった。そこで今回からNVIDIAのFrameViewを利用してフレームレート変動を取得している。

さて結果であるが、Overall(グラフ4〜6)では明確に

Radeon RX 7900 XT < GeForce RTX 4080 < Radeon RX 7900 XTX

という結果が判る。もっともRadeon RX 7900 XTとGeForce RTX 4080の性能差はそれほどない事もお分かりいただけるかと思う。実際フレームレート変動(グラフ7〜10)からもこれは明らかで、流石に4Kともなるとグラフが明確に分離するが2K〜2.5K位だとそれほど差が無い事が判る。というか、2KだとUltra Highの設定でも160fps以上で常時動作し、4Kでも70fps超えというあたりでRadeon RX 7900 XTの性能の高さは十分示されていると言えるし、これより高速なGeForce RTX 4080と、更に高速なRadeon RX 7900 XTXの性能の高さは明白である。

○◆Borderlands 3(グラフ11〜17)

Borderlands 3

2K Games

https://borderlands.com/ja-JP/

ベンチマーク方法はこちらのBorderland 3の項目に準ずる。設定は

全体的な品質:バッドアス

アンチエイリアス:テンポラル

とした。

グラフ11

グラフ12

グラフ13

グラフ14

グラフ15

グラフ16

グラフ17

そもそもBorderlands 3でバッドアスを選ぶと本当に負荷が洒落にならないほど高いのに、Overall(グラフ11〜13)を見ると2Kで平均200fps超え、4Kでも平均80fps超えというのは流石にどうかしていると言わざるを得ない。

それはともかくとして面白いのは、2KではAssassin's Creed同様に

Radeon RX 7900 XT < GeForce RTX 4080 < Radeon RX 7900 XTX

の構図なのが2.5K以上では

Radeon RX 7900 XT ≒ GeForce RTX 4080 < Radeon RX 7900 XTX

になっていることである。実際フレームレート変動(グラフ14〜17)を見ると、2.5Kあたりではほぼ互角だし、3K以上ではむしろRadeon RX 7900 XTの方が上回る場合もしばしばある。少なくともこの差であれば、同等と評しても差し支えないのではないかと思う。

○◆Cyberpunk 2077(グラフ18〜26)

Cyberpunk 2077

CD PROJEKT RED

https://www.cyberpunk.net/us/ja/

リリースは2020年12月と結構古いのだが、当初In-Game Benchmarkが存在しなかったため、筆者も購入してそのまま放棄していた。ただ今年2月に公開されたPatch 1.5でIn-Game Benchmarkを実装しており、それもあって今回ベンチマークに加えることにした。

ベンチマーク方法だが、Main Menu(Photo05)→Settings→Video(Photo06)で画面解像度を、Graphics(Photo07)で画質の設定を行う。

Photo05: ベンチマークが終わると毎回ここに戻るのはちょっと面倒。

Photo06: 当然VsyncはOffにしておく。

Photo07: FSRは特定のH/Wに依存しないので、GeForce RTX 4080の場合でも有効になる。

Photo08: Ray-Traced Lightingの最上位は"Psycho"だが、流石にこれはやめてUltraにした。

Photo09: 結果はこんな感じで示される。

今回のベンチマークでは

画面解像度:2K/2.5K/3K/4K(フルスクリーン)

Quick Preset:Ultraに設定後、FSR 2.1をOffにする(ので、Custom扱いになる)

とした。またデフォルトではRay TracingはOffであるが、これを有効にするとReflection/Sun Shadows/Local Shadowingの3項目のOn/Offが可能になる(Photo08)。またPhoto07でにもあったが、Cyberpunk 2077はFLSSとFSR 2.1に対応している。ということで今回のテストパターンは

解像度 2K/2.5K/3K/4K Ray Tracingなし

解像度 4K Ray Tracingフル(Reflection/Sun Shadows/Local Shadowing有効、Lighting Ultra)

解像度 4K Ray Tracingフル(Reflection/Sun Shadows/Local Shadowing有効、Lighting Ultra)+Super Sampling(DLSS Quality/FSR 2.1 Quality)

を実施してみた。ちなみにベンチマークが終わると結果が画面に表示される(Photo09)ほか、マイドキュメント\CD Projekt Red\Cyberpubk 2077\benchmarkResults の下にフレームレート変動がcsvの形で自動保存されるので、これを利用して結果を取得した。

グラフ18

グラフ19

グラフ20

グラフ21

グラフ22

グラフ23

グラフ24

グラフ25

グラフ26

ということで、まずはRay Tracing無しのOverall(グラフ18〜20)であるが、こちらは綺麗に

Radeon RX 7900 XT < GeForce RTX 4080 < Radeon RX 7900 XTX

の構図が示されている。ただ解像度が上がってゆくと、Radeon RX 7900 XTとGeForce RTX 4080の性能差が縮まっていっており、これはフレームレート変動(グラフ21〜24)からも見て取れる。強いて言えば、一番性能の高い筈のRadeon RX 7900 XTXが、時折スパイク的に性能が下がる事があるのが気になる程度だ。

さてここでRay Tracingを有効にするとどうなるのか? というのがグラフ25である。解像度4Kで、DLSSなりFSR無しでRay Tracingを有効にすると、GeForce RTX 4080の場合でフレームレート半減、Radeon RX 7900 XT/XTXだと3分の1まで落ちる。これがDLSSなりFSRを併用する事で大幅に性能が回復するのだが、GeForce RTX 4080だと1割落ち程度まで復活するのに、Radeon RX 7900 XT/XTXは半分強、大体55%といったところである。やはりRay TracingはRDNA 3にとってまだ重荷というか、NVIDIAに比べるとやや見劣りする事は避けられないようだ。

グラフ26がその4Kにおけるフレームレート変動である。実線がRay Tracingなし、短破線がRay Tracingあり/Super Samplingなし、長破線がRay Tracingあり/Super Samplingありの結果である。ここから言えるのは、現時点でRay Tracingを使う場合、GeForce RTX 4000シリーズに拮抗する性能を出すためには、もう少しFSRの強度を上げる(現在はQuality Settingだが、BalancedあるいはPerformance Settingにする)必要がある、ということだろう。

○◆F1 22(グラフ27〜35)

F1 22

EA Sports

https://www.ea.com/ja-jp/games/f1/f1-22

ベンチマーク方法はこちらのF1 22の項目に準じる。設定は

Anti Alias:TAA only

Anisotropic Filter:16X

Detail Preset:Ultra High

である。

さて、F1 22もDetail PresetをUltra HighにするとRay Tracingがデフォルトで有効になる(この際Ray Tracing QualityはHighになる)。なのでこれはこのまま実施するとして、それとは別にRay Tracing QualityをUltra Highにした場合、それとRay TracingをUltra HighにしてDLSS/FSR 1.0を併用した場合を別に測定した。つまりテスト項目は

解像度 2K/2.5K/3K/4K Ray Tracingデフォルト(High)

解像度 4K Ray Tracing Quality Ultra High

解像度 4K Ray Tracing Quality Ultra High+Super Sampling(DLSS Quality/FSR 1.0 Quality)

となる。

グラフ27

グラフ28

グラフ29

グラフ30

グラフ31

グラフ32

グラフ33

グラフ34

グラフ35

まずはデフォルト状態(グラフ27〜29)で、案の定というかRay Tracingを有効にするとRadeon RX 7900系はやや性能低下が目立つ結果として

Radeon RX 7900 XT < Radeon RX 7900 XTX < GeForce RTX 4080

になるのはやむを得ないだろう。ただRadeon RX 7900 XTXとGeForce RTX 4080の性能差はそう大きくないのは、フレームレート変動(グラフ30〜33)からも明らかである。Radeon RX 7900 XTはちょっと差が大きいが、恐らくこれRay Tracingを無効化すれば性能差はかなり縮まる様に思える。

一方Ray Tracing QualityをUltra Highにした場合(グラフ34)だが、そもそもRay Tracing Quality Highの時点でそれなりに性能のペナルティがあるためか、それほど性能差が無い。そしてDLSSなりFSRを併用すると、むしろ性能が引きあがるという事になってしまった。で、このDLSSなりFSRを併用した場合だと、

Radeon RX 7900 XT ≦ GeForce RTX 4080 < Radeon RX 7900 XTX

という結果になるのは非常に興味深い。実際フレームレート変動(グラフ35)の長破線を比較して頂くと判るが、Radeon RX 7900 XTとGeForce RTX 4080の性能差がむしろ縮まっているのが判るかと思う。FSRを併用してRay Tracingを生かすのが、F1 22の正しいアプローチなのかもしれない。

●ゲームその2: Far Cry 6 / Forza Horizon 5 / Hitman 3 / Metro Exodus

○◆Far Cry 6(グラフ36〜42)

Far Cry 6

Ubisofy Entertainment

https://www.ubisoft.com/ja-jp/game/far-cry/far-cry-6

ベンチマーク方法はこちらに準ずる。設定は

Quality:High

Antialias:TAA

DXR Reflections/Shadows Off

としている。Ray TracingをOffにしたのは、Far Cry 6がFSRには未対応なためである。

グラフ36

グラフ37

グラフ38

グラフ39

グラフ40

グラフ41

グラフ42

このFar Cry 6ではまた違った傾向が出て来た。Overall(グラフ36)が判りやすいが、解像度が低い(=負荷が軽い)ところでは

GeForce RTX 4080 < Radeon RX 7900 XT ≦ Radeon RX 7900 XTX

だが、解像度が上がると

Radeon RX 7900 XT < GeForce RTX 4080 ≦ Radeon RX 7900 XTX

に綺麗に推移する。解像度的に言えば2.5Kと3Kの中間位でRadeon RX 7900 XTとGeForce RTX 4080のフレームレートがクロスする。これはフレームレート変動(グラフ39〜42)からも明らかで、2.5KまではRadeon RX 7900 XTはRadeon RX 7900 XTXとほぼ変わらないのに、3K以降でガクッと落ちるのは、ひょっとするとInfinityCacheの容量が不足しているのかも? という気になる。とはいえ、4KでもRadeon RX 7900 XTとGeForce RTX 4080の性能がさほど変わらないあたりは、割と頑張っているとは言えるのだが。

○◆Forza Horizon 5(グラフ43〜51)

Forza Horizon 5

Playground Games

https://playground-games.com/projects/forza-horizon-5/

昨年11月にリリースされた割に取り上げるのが遅かったのは、単にIn-Game Benchmarkがある事に気が付いてなかったためである。ただしログを取る機能は無いので、FrameViewとの併用となる。

さてベンチマーク方法であるが、まず起動画面で"オプション"を選び(Photo10)、設定メニューのビデオ(Photo11)から解像度の選択を行う(当然VSyncはオフである)。次がグラフィック(Photo12)で、ここではプリセットをエクストリームとした。ただしこれをやると自動的にレイトレーシング品質:最高となる(Photo13)ので、これは手動でオフに設定する。設定が終わったら、Photo12の一番上にある「ベンチマークモードの開始」を選ぶと、初回開始まで数分かかるがその後ベンチマークが開始、約90秒のベンチマークの後で結果が表示される(Photo14)。ちなみに一度ベンチマークモードに入ると、「続ける」を押すまでの間は延々とベンチマークを実行できるので、あとは解像度とか品質を変えながら繰り返す形だ。

Photo10: ちなみに実行にはMicrosoft Accountが必要である。

Photo11: この画面はGeForce RTX 4080で取得したのでDLSSが有効になっているが、FSR/DLSS共にOffにする。またMSAAは8xに設定した。

Photo12: 厳密にはまだSSAOとかリフレクションとかのレベルを更に上げられるが、まぁプリセットのエクストリームで十分だろう。

Photo13: レイトレーシング品質も、この上にエクストリームがある。

Photo14: この結果をログに残してくれると楽だったのだが。

今回のテスト項目は、描画品質はエクストリーム(ただしRay Tracingはオフなのでカスタム扱い)のまま

解像度 2K/2.5K/3K/4K

に加えて

解像度 4K 描画品質エクストリーム(つまりRay Tracingは「最高」)

解像度 4K 描画品質エクストリーム+Super Sampling(DLSS Quality/FSR 2.2 Quality)

となる。

グラフ43

グラフ44

グラフ45

グラフ46

グラフ47

グラフ48

グラフ49

グラフ50

グラフ51

まずはRay Tracing無しの結果だが、Overall(グラフ43〜45)だと

Radeon RX 7900 XT < GeForce RTX 4080 ≦ Radeon RX 7900 XTX

といった感じである。これはフレームレート変動(グラフ46〜49)からも明らかで、低解像度では粘るGeForce RTX 4080を、高解像度でRadeon RX 7900 XTXが突き放す感じだ。

そしてかなり意外だったのはRay Tracing有効の場合(グラフ50)。平均フレームレートで言えば

と、初めてRay Tracing有効な状態でRadeon RX 7900 XTXが最高速になった。ただもっと意外だったのは、ここでSuper Samplingを有効にした場合で

と、むしろGeForce RTX 4080の伸びが顕著だったことだ。フレームレート変動(グラフ51)を見ても、確かにGeForce RTX 4080が飛びぬけている。とはいえ、一番低いRadeon RX 7900 XTでもFSRを併用すると平均96.3fps、というのは4Kでのプレイには十分と見なして良いのではないかと思う。

○◆Hitman 3(グラフ52〜60)

Hitman 3

IO Interactive A/S

https://www.epicgames.com/store/ja/product/hitman-3/home

ベンチマーク方法はこちらのHitman 3の項目に準じる。実はフレームレート変動が取れない(OCATを噛ますとゲームが起動しない)という問題があったHitman 3だが、FrameViewだとちゃんと動作した上に、何といつの間にかフレームレートをちゃんと記録する機能が付いていた。具体的にはC:\user\ユーザー名\hitmanというフォルダに自動的にフレームレートが記録される機能が実装されていた。ということでこのフレームレートの記録を利用してグラフを作成した。

余談だがcsvの形でFrame Timeが保存されるのは大変便利なのだが、個々のFrameの時間ではなく起動からの累積時間が保存されているので差分を取る必要があるのと、CPU TimeとGPU Timeが縦に並んでいる関係で、抜き出しに手間が掛かるのはちょっと考えものである。とは言えあるだけでも大変に助かるのだが。

Photo15: 昔はSuper SamplingだけでRay Tracing対応は無かった。

さて、Hitman 3もRay Tracingに対応しており(Photo15)、またSuper SamplingもDLSS/FSR 2/XeSSに対応している。という訳で設定であるが

Adaptive Supersampling Technique:Off

Ray Tracing:Off

Level of Detail:Ultra

Texture Quality:High

Texture Filter:Anisotropic 16x

SSAO:Ultra

Shadow Quality:Ultra

Mirrors Refrection Quality:High

Reflection Quality:High

Variable Rate Shading:Off

Motion Blur:High

Simulation Quality(Graphics):Best

としたうえで解像度 2K/2.5K/3K/4Kのテストを行い、更に

解像度 4K Ray Tracing On/Ray Traced Sun Shadows:On/Ray Traced Reflections On

解像度 4K Ray Tracing On/Ray Traced Sun Shadows:On/Ray Traced Reflections On+Super Sampling(DLSS Quality/FSR2 Quality)

も行ってみた。

グラフ52

グラフ53

グラフ54

グラフ55

グラフ56

グラフ57

グラフ58

グラフ59

グラフ60

さてまずRay Tracing無しのOverallがグラフ52〜54で、またもや

Radeon RX 7900 XT ≦ GeForce RTX 4080 < Radeon RX 7900 XTX

である。やっぱり2.5Kと3Kの間でRadeon RX 7900 XTとGeForce RTX 4080のフレームレートがクロスする格好だ。とは言えRadeon RX 7900 XTの4Kでの平均フレームレートは141.7fpsだから、悪くはない。フレームレート変動(グラフ55〜58)を見ると、結構変動が激しいのでちょっと見ずらいが、例えば60sec近くの谷はどの製品でもほぼ同等のフレームレートで、負荷が軽い時に性能差が出るという感じだから実際にプレイするとそこまで性能差は感じられないかもしれない。

一方Ray Tracingを有効にした場合(グラフ59)だが、これはもうどの製品も洒落にならない落ち込み方で、そもそもHitman 3のRay Tracingの負荷が"超"高いという話であり、そもそもGeForce RTX 4080でも実用に耐えるか? というとDLSSを併用してギリギリな感じ。一方Radeon RX 7900はFSRを併用してもまだ厳しいという感じで、もう少しRay Tracingの負荷を減らすか、より強力なFSR(Balanced/Performance)を選んだ方が良いだろう。やはりRay Tracingは鬼門であった。

○◆Metro Exodus PC:Enhanced Edition(グラフ61〜67)

Metro Exodus PC:Enhanced Edition

4A Games

https://www.metrothegame.com/

ベンチマーク方法はこちらのMetro Exodus Enhanced Editionの項に準じる。設定はExtremeプロファイルに準ずる。つまり

Shading Quality:Extreme

Ray Tracing:Normal

DLSS:Off

Reflections:Hybrid

Reflection:Raytraced

Variable Rate Shading:1x

Hairworks/Advanced PhysX:Off

Tesselation:Full

である。そもそもMetro Exodus PC:Enhanced EditionではRay Tracingがデフォルトであり、またDLSS以外のSuper Samplingには未対応なので、今回はDLSSも無効のままとしている。

グラフ61

グラフ62

グラフ63

グラフ64

グラフ65

グラフ66

グラフ67

ということでOverall(グラフ61〜63)を見ると、やはりRay Tracingの影響か、

Radeon RX 7900 XT < Radeon RX 7900 XTX < GeForce RTX 4080

が明白で、しかもフレームレート差も結構大きい。Extremeだと3製品とも平均フレームレートが60fpsを切ってる辺りは、もう少し設定を考えないと実際のプレイには厳しそうだ(最小フレームレートも、4Kだとかなり落ちる)。

フレームレート変動(グラフ64〜67)もある意味綺麗というか、見事に分離したグラフになっており、ここでの性能差は明白である。Ray Tracingの影響はまだまだ大きいという事でもある。

●ゲームその3: Tomb Raider / The Division 2 / Watch Dogs

○◆Shadow of the Tomb Raider(グラフ68〜76)

Shadow of the Tomb Raider

SQUARE ENIX

https://tombraider.square-enix-games.com/en-us

ベンチマーク方法はこちらに準じる。ところでこのShadow of the Tomb Raiderでちょっと面白い(いやShadow of the Tomb Raiderそのものに関わる話では無いのだが)話がある。Shadow of the Tomb RaiderはSuper SamplingとしてDLSSとXeSSに対応している(XeSSは後追いで追加された)のだが、FSRは未対応である。なのだが、実はRadeon RX 7900シリーズではXeSSが利用可能なのである。

何故? という話であるが、実はXeSSはDirectX 12でサポートされるShader Model 6.4で提供されるDot-Products 2/4のAPIを利用しているからだ。もっと正確に言えば、XeSSはMicrosoftがWindows向けに提供しているDirectML(Direct Machine Learning)というML向けのフレームワークを利用して実装されており、このDirectMLが内部でShader Model 6.4を利用している(=Shader Model 6.4で提供されるDot-ProductsのAPIを呼んでいる)ため、Shader Model 6.4に対応し、かつDot-ProductsのAPIが提供されていれば、必ずしもIntel ArcシリーズでなくてもXeSSが使えるという事になる。実際、Shader Model 6.6に対応している(=Shader Model 6.4もサポート)のRadeon RX 6600でShadow of the Tomb Raiderを起動すると、XeSSの選択が可能になる(Photo16)し、ちゃんと動作する(Photo17)。これに未対応のGeForce RTX 4080の場合、XeSSはOffのまま選べなくなって(Photo18)いることから、ちゃんと内部でShader Model 6.4との互換性をチェックして判断している訳だ。

Photo16: Radeon RX 6600でもXeSSは利用できる。もっともDot-Productsのアクセラレータが無いので、XeSSを使っても結構遅い。

Photo17: Result画面より。Intel XeSSがUltra Qualityになっているのがお分かりかと思う。

Photo18: GeForce RTX 4080だとXeSSはOffのまま選べない。まぁDLSSを使えばいいのだが。

そんな訳でRadeon RX 7900ではXeSSを利用できるわけだが、Radeon RX 6600と異なりRadeon RX 7900というかRDNA 3にはWMMA(Wave Matrix Multiply Accumulate)という機能が追加されており、RDNA 2世代に比べてDot-Productsの演算を遥かに高速に実行する事が出来る。先の記事ではこのAPIが不明と書いたが、どうもAMDはShader Model 6.4にあるdot4add_u8packed()/dot4add_i8packed()/dot2add()といったAPIからこのWMMAを呼び出せるようにしているようで、ということはXeSSを利用すると内部的にはこのWMMAが動く形でMLベースのSuperSamplingが行える、という訳だ。

話が長くなったがそんな訳でShadow of the Tomb RaiderについてはSuper SamplingはDLSS及びXeSSを利用して実施する事にした。

そんな訳で実際のテスト項目だがGraphics TabのPresetはHightestとした上で

解像度 2K/2.5K/3K/4K Ray Traced Shadow Quality:Off のテストを行い、更に

解像度 4K Ray Traced Shadow Quality:Ultra

解像度 4K Ray Traced Shadow Quality:Ultra+Super Sampling(DLSS Super Quality/XeSS Super Quality)

での比較を行ってみた。

グラフ68

グラフ69

グラフ70

グラフ71

グラフ72

グラフ73

グラフ74

グラフ75

グラフ76

まずRay Tracing無しのOverall(グラフ68〜70)だが、珍しく

Radeon RX 7900 XT < Radeon RX 7900 XTX < GeForce RTX 4080

という構図になった。Ray Tracingありは珍しくないが、無しでここまで性能差が出るのは初めてだと思う。

もっともフレームレート変動(グラフ71〜74)を見ると、例えば2Kだと15秒付近や40付近、80〜140秒などはあまり差は見られず、主に0〜15秒とか20〜40秒、45〜80秒といった比較的負荷が軽い部分で性能差が出ている格好だ。その意味では、性能差は間違いなくあるものの、それが体感できるほど差が出るか?というとそうでもない様に思える。

さて問題のRay Tracingである。グラフ75がOverallだが平均フレームレートを拾うと

ということで、

Ray Tracingの負荷はそれなりに大きい

DLSSだと意外に性能が伸びるが、XeSSは今一つ。とは言えないよりはずっとマシ。

といった結果になった。ただフレームレート変動(グラフ76)を見ると、例えばGeForce RTX 4080だとRT+DLSSがRTなしをはっきり上回っているのは負荷の軽い70〜110秒(と一時的に20秒付近)で、それ以外の箇所ではむしろRTなしを下回っている訳で、単純にDLSSで性能が持ち上がる、とも言いにくい。まぁそれでも平均値で同等だから、GeForce RTX 4080はDLSSのSuper Qualityで十分使い物になるが、Radeon RX 7900はもうQuality/Balancedあたりを狙わないとやや不満が残る、というあたりだろうか。まぁFSRでなくXeSSを使っている事が問題と言えば問題なのだろうけど。

○◆Tom Clancy's The Division 2(グラフ77〜83)

Tom Clancy's The Division 2

Ubisoft

https://www.ubisoft.co.jp/division2/

ベンチマーク方法はこちらの"Tom Clancy's The Division 2"に準ずる。設定は

品質:ウルトラ

とした。こちらはRay TracingもSuper Samplingも未対応である。

グラフ77

グラフ78

グラフ79

グラフ80

グラフ81

グラフ82

グラフ83

ということで結果であるが、Overall(グラフ77〜79)で見ると

Radeon RX 7900 XT < Radeon RX 7900 XTX ≦ GeForce RTX 4080

といったところ。Radeon RX 7900 XTXはかなり健闘しているものの、GeForce RTX 4080に一歩及ばずというあたり。Radeon RX 7900 XTは明確に差がついてはいるものの、例えば4Kでも94.4fpsなのだからこれまでのGPUに比べればかなり高速である事は間違いないし、2Kでの他との差はかなり少ない。

実際フレームレート変動(グラフ80〜83)を見ると、2KでRadeon RX 7900 XTが他より下回っているとはちょっと思えないほど。2.5/3Kでは流石にRadeon RX 7900 XTは明確にグラフが分離するが、Radeon RX 7900 XTXはそれでもまだ差は大きくない(60sec以降はちょっと離れるが)。4KではRadeon RX 7900 XTXとGeForce RTX 4080の差は再び縮まっており、一応どちらが上かと言えばGeForce RTX 4080となるが、Radeon RX 7900 XTXも言うほど性能差はない感じだ。

○◆Watch Dogs:Legion(グラフ84〜90)

Watch Dogs:Legion

Ubisoft

https://www.ubisoft.co.jp/wdlegion/

ベンチマーク方法はこちらの"Watch Dogs:Legion"に準ずる。こちらもSuper SamplingはDLSSのみサポートということで今回は

Quality;Ultra

RT Reflection:Off

DLSS:Off

の条件で比較した。

グラフ84

グラフ85

グラフ86

グラフ87

グラフ88

グラフ89

グラフ90

Overall(グラフ84〜86)で見ると傾向はThe Division 2に近く、2KではRadeon RX 7900系が高速だが、そこから急速にフレームレートを落としてゆくのに対し、GeForce RTX 4080はその落ち方が緩やかであり、結果4Kではかなりの性能差になっている。なのでトータルで見れば

Radeon RX 7900 XT < Radeon RX 7900 XTX < GeForce RTX 4080

としてしまって差し支えないだろう。

フレームレート変動(グラフ87〜90)もこの傾向を裏付けており、2Kは大差ないのがどんどん差がつき、4Kでは3本のグラフが完全に分離しているし、その差もかなり大きい。これに関してはGeForce RTX 4080の勝利、としてしまって良い様に思える。

●PCMark / 消費電力 / 評価まとめ

○◆PCMark 10 v2.1.2574(グラフ91〜96)

PCMark 10 v2.1.2574

UL Benchmarks

https://benchmarks.ul.com/pcmark10

グラフ91

グラフ92

グラフ93

グラフ94

グラフ95

グラフ96

一応2D系のベンチマークも、ということでPCMark 10だが、Overall(グラフ91)で判るように性能差らしきものは無い。実は何が目的かというと、PCMark 10の場合はいくつかのベンチマークでOpenCLを利用しており、これにGPUが使われるのでOpenCL系の比較に丁度良いだろう、と判断した訳だ。ただ実際結果を見て頂くと、言うほどの差がない。比較的大きめなのが、Essentials(グラフ93)におけるVideo ConferencingとかProductivity(グラフ94)のSpreadSheets、Digital Contents Creation(グラフ95)のRendering and Visualizationということになる。例えばVideo ConferencingのOpenCLを利用する作業、生データだと表2の通りで、殆どの処理はほぼ同等だが、VideoConferencingDetectPrivateOclとVideoConferencingDetectGroupOclの2つが極端に性能が異なっており、これが結果に結びついた感じだ。あるいはSpreadsheetsだと表3の2つがOpenCLを利用する処理だが、MonteCarloだとむしろGeForce RTX 4080の方が高速であり、ただ逆にEnergyMarketではGeForce RTX 4080の方が遅く、トータルした結果がスコアの差である。そしてRendering and Visualizationは表4の通りだが、ここでGt1というのは3DMark Sling ShotをOpenGL 4.3で実施した性能なので、OpenCLは無関係である。つまるところ、殆どのOpenCLの処理は性能差が無く、一部の処理のみRadeon RX 7900の方が高速、という程度に判断しておくのが無難だろう。

○◆消費電力測定(グラフ97〜103)

最後は恒例の消費電力測定だが、今回はハイエンドGPUカードということもあり、また今更FireStrikeでもないだろう、ということでテスト項目を入れ替えた。具体的には

3DMark SpeedWay(グラフ97)

Cyberpunk 2077 4K Ray Tracing無し(グラフ98)

Hitman 3 4K Ray Tracing無し(グラフ99)

Metro Exodus:PC Enhanced Edition 4K Ray Tracing無し(グラフ100)

Watch Dogs:Legion 4K Ray Tracing無し(グラフ101)

の5つとした。各テストの画質設定は先に説明したものと同じである。解像度をSpeedWay以外(SpeedWayは2.5Kで動作する)4Kに統一したのは、CPUの負荷をなるべく減らしてGPUの消費電力が反映されやすくするためである。またRay Tracingを無効にしたのは、これを有効にするとRay Tracing Engineがボトルネックになり、シェーダそのものはむしろ遊んでしまう可能性が高いためだ。

グラフ97

グラフ98

グラフ99

グラフ100

グラフ101

グラフ102

グラフ103

このグラフ97〜101の、それぞれベンチマーク実行時の平均消費電力をまとめたのがグラフ102、そこから待機時の消費電力との差を求めたのがグラフ103となる。

なんというか、まぁTBPの数値通りの結果になったというべきだろう。Radeon RX 7900 XTはほぼGeForce RTX 4080と変わらないし、Radeon RX 7900 XTXはそこから最大で50Wほどの上乗せがされる格好だ。ハイエンドビデオカードだからそれなりになるのは致し方ないのだろうが、少なくともこの部分でアドバンテージがあるか? と言われれば、GeForce RTX 4080に対しては「ない」という答えになる。

○考察 - 性能は肉薄し価格は安いが、Ray Tracing次第

ということで駆け足でご紹介してきた。結果から言えば

Ray Tracingを使わなければ、Radeon RX 7900 XTはGeForce RTX 4080に肉薄する成績を300ドル安い金額で入手できるし、Radeon RX 7900 XTXはGeForce RTX 4080と同等以上の成績を、200ドル安い金額で入手できる。これはお買い得感がかなり高い。

Ray Tracingを使う場合の性能は、やはりGeForce RTX 4080には及ばない。以前に比べると差は縮まった気はするし、FSRなりXeSSを使う事で実用的な性能まで引き上げる事は可能だが、Ray Tracingを使っての性能を重視するのであれば、GeForce RTX 4080の方が現実的。

という事になる。原稿執筆時点での日本円での価格は公開されていないが、円高基調に入りつつある昨今では、それなりに期待できる金額になりそうな気もする。個人的には、そこまでRay Tracingの機能がゲームに必須か? と言われるとかなり謎であり、そのあたりを割り切れる人にはRadeon RX 7900 XT/XTXは良い買い物に思える。意外にXTとXTの性能差が無いのも驚きで、その意味では狙い目はXTの方かもしれない。