[画像] Radeon RX 6900 XTを試す - RTX 3090と最強対決、更に新世代GPUを総ベンチマーク

●3DMark / SuperPosition / Basemark GPU / Bright Memory Infinite

Radeon RX 6800/6800XTに続き、Radeon RX 6900 XTもついに発売である。というか、もうすぐ販売開始(PCショップ筋からは販売解禁が12月11日という情報も出ている)だろうに未だに日本での価格が伝えられてないあたりがいつものAMDという気はするのだが、それはともかくとして評価機は問題なく入手できたので、性能評価をお届けしたい。ちなみに今回テスト環境は、先のRadeon RX 6800/6800 XTをそのまま継承。一部テストを除きテストデータも流用している。

今回入手したRadeon RX 6900 XTのリファレンスカード


○テスト環境 - Radeon RX 6000シリーズとGeForce RTX 30シリーズをまとめて

まずパッケージはRadeon RX 6800 XTと殆ど見分けがつかず(Photo01)。開封した状態(Photo02)も同じであるが、中蓋を取るとRadeon RX 6900 XTがマウスパッド(?)に包まれた状態で入っていた(Photo03,04)。さて外観はこんな感じ(Photo05〜11)であるが、Radeon RX 6800 XTと更に見分けがつかない。実際外寸は285mm×102mm×50mmで、Radeon RX 6800 XTと全く同一。思うのだが、多分部材(外装パーツ、基板、メモリチップ)などはRadeon RX 6800 XTと6900 XTで完全に同一であり、チップのみが違うという格好なのではないかと思う。ちなみに重量は実測値で1507.5gで、Radeon RX 6800 XTの1501.9gよりもちょっと重い。誤差の範囲の可能性もあるが、ひょっとすると電源のPhase数が1つ多いとかの可能性もある(Radeon RX 6800 XTではパターンだけあって実装されていなかったところに実装したというパターン)。ただ今回は分解不可なので、部品配置がどうなっているかまでは確認が出来なかった。

Photo01: 右上の"RADEON RX 6900 XT"の文字以外、Radeon RX 6800 XTと同じ外観。


Photo02: "Welcome to the Red Team"も同じく。


Photo03: 最初は何が入っているのか判らなかった。


Photo04: 展開後。パッド裏側は滑り止め加工、表側はスムーズな加工になっており、多分マウスパッドと思われる。それにしてもデカい。


Photo05: 型番が入っていない事もあって、このアングルだと見分けが全くつかない。


Photo06: 右のシールに入っている型番で辛うじて6900と判る。


Photo07: こちらも同じ。補助電源も8pin×2。


Photo08: 反対側から。特に差はみられず。


Photo09: 当然出力もHDMI×2、DisplayPort×2、USB Type-C×1と同じ。


Photo10: カードエッジからのはみだし具合も全く同一。


Photo11: ブラケット取り付け部も同一。


GPU-ZではRadeon RX 6900 XTと正常に認識されている(Photo12)。Power Limitは-10%〜+15%の範囲(Photo13)とされており、TDPは通常300Wなのでピークで345W位まで上げられる設計になっているようだ。

Photo12: こちらで紹介した通り、80CU/5120SP構成。動作周波数そのものはRadeon RX 6800 XTと同じなので、性能差はCUの数ということになる。理論上は25%向上する筈だが、さて。


Photo13: Base Clockは1825MHzで、これもRadeon RX 6800 XTと同じ。


ところで対抗馬であるが、今回はMSIよりGeForce RTX 3090 GAMING X TRIO 24Gを借用した(Photo14〜23)。当然OCモデルで、GeForce RTX 3090 Founder Editionが定格 1400MHz/Boost 1700MHz駆動のところを、Boost 1785MHzまで引き上げている。ちなみに原稿執筆時点におけるAmazonでの価格は\228,586であった。

Photo14: パッケージは、一昔前のNVIDIA風という感じ。ちなみにかなりデカい。


Photo15: 3連大径ファンがそれなりのインパクト。ただ大径ファンのおかげか、フル稼働中も騒音は非常に低かった。外寸は325mm×127mm×57mm、重量は1570.5g(いずれも実測値)だった。


Photo16: 裏面はバックプレートに覆われている。


Photo17: チップ真裏。MLCCの塊と化している。以前評価したASUSのROG-STRIX-RTX3090-O24G-GAMINGとはまた異なっているが、特にテストで問題になることはなく安定していた。


Photo18: 出力はDisplayPort×3+HDMI×1


Photo19: こちらもかなりバックプレートからはみ出している。


Photo20: 一応ブラケット取り付け金具が用意されているのが判る。


Photo21: 補助電源は8pin×3。


Photo22: 真横から。ほぼ全面をヒートシンクで覆っている構造なのが判る。左側がGPUとGDDR6X、右がVRMと思われる。


Photo23: 1.5Kgものビデオカードだけに、サポート用のステイ金具が標準で用意されていた。


その他の環境は表1に示す通りである。冒頭に述べたように、基本的には前回のテスト結果をそのまま継承しながら、新たにRadeon RX 6900 XTとGeForce RTX 3090を追加した格好である。ただ前回時間の関係で省いていたテストをいくつか追加している。

なお、以下のグラフでは

RTX 3070:GeForce RTX 3070 Founder Edition

RTX 3080:GeForce RTX 3080 Founder Edition

RTX 3090:MSI GeForce RTX 3090 GAMING X TRIO 24G

RX 6800:Radeon RX 6800 Reference

RX 6800XT:Radeon RX 6800 XT Reference

RX 6900XT:Radeon RX 6900 XT Reference

と表記している。またDXRTを利用するシーンにおいては

RTX 3070(RT):GeForce RTX 3070 Founder Edition。DXRT有効、DLSS無効

RTX 3080(RT):GeForce RTX 3080 Founder Edition。DXRT有効、DLSS無効

RTX 3090(RT):MSI GeForce RTX 3090 GAMING X TRIO 24G。DXRT有効、DLSS無効

RX 6800(RT):Radeon RX 6800 Reference。DXRT有効

RX 6800XT(RT):Radeon RX 6800 XT Reference。DXRT有効

RX 6900XT(RT):Radeon RX 6900 XT Reference。DXRT有効

となっている。解像度表記は何時ものごとく

2K:1920×1080pixel

2.5K:2560×1440pixel

3K:3200×1800pixel

4K:3840×2160pixel

とさせていただく。またテスト環境やテスト方法などは(追加したテスト以外)前回と全く同一にしているので、今回説明は割愛する。

○◆3DMark v2.15.7088(グラフ1〜6)

3DMark v2.15.7088

UL Benchmarks

https://benchmarks.ul.com/3dmark

前回はv2.15.7078だったが、今回はv2.15.7088にアップデートしている。ちなみにこのv2.15.7088からResult Screenが大幅に改定されたのだが、その代わりバッチで複数テストをまとめて実施すると結果が表示できなくなるという「仕様」(これはUL Benchmarksに確認した。将来は対応するけど、現時点では1テスト分しか表示できないとの事)になっており、ちょっと不便な感じである。それはともかく、このv2.15.7088でテストデータを取り終わった段階になって、v2.16.7133がリリースされたのだが、さすがにこれに切り替えてやり直している時間はなかったので、v2.15.7088のまま実施している。

グラフ1


グラフ2


グラフ3


グラフ4


さてまずグラフ1がOverallである。今度はちゃんとRadeon RX 6800でもWildLifeが動作した。全体の傾向としては、Radeon RX 6900 XTは確かに高速で、GeForce RTX 3090と甲乙つけがたい。一つ言えるのはPort Royalのスコアの低さで、GeForce RTX 3070こそ追い抜いているものの、GeForce RTX 3080には及ばない程度。まぁRay Tracingの第一世代としては健闘している方、としてもいいのだろうが。Graphics(グラフ2)、Physics/CPU(グラフ3)、Combined(グラフ4)も大体傾向としては同じである。

グラフ5


DXRT Feature Test(グラフ5)はRadeon RX 6000系の弱点がモロに露呈しているテストで、こちらだとRdeon RX 6900 XTはGeForce RTX 3070にも及ばない程度でしかない。前回の考察でも書いたが、とりあえずRay Tracing性能に期待はしない方がいいだろう。

グラフ6


グラフ6のPCI Express Testだが、なんでこうじりじり性能が下がるのかはよくわからない。ただ大きな差とは言えない。とりあえずPCI Express Gen4をちゃんと使っているとは言えるだろう。

○◆SuperPosition v1.1(グラフ7〜13)

SuperPosition v1.1

Unigine

https://benchmark.unigine.com/superposition

グラフ7


グラフ8


グラフ9


次はこちら。Average(グラフ7)を見ると

GeForce RTX 3090 > Radeon RX 6900 XT > Radeon RX 6800 XT≒GeForce RTX 3080 > Radeon RX 6800 > GeForce RTX 3070

という関係なのが面白い。要するにラインナップによる性能差が、NVIDIAの方が大きめであり、AMDはこれに比べると性能差が小幅である。最大/最小(グラフ8・9)も概ねこの状況がそのままである。

グラフ10


グラフ11


グラフ12


グラフ13


フレームレート変動(グラフ10〜13)もこの傾向を裏付けており、GeForce RTX 3090とRadeon RX 6900 XTの差は小さくないというか、明確にグラフがが分離されている。ただそれでもRadeon RX 6800 XT/GeForce RTX 3080との差もやはり明確であり、ちゃんと性能向上はしているのだが、GeForce RTX 3090が更に上回る性能差を出しているという感じだ。

○◆Basemark GPU 1.2(グラフ14〜19)

Basemark GPU 1.2

Basemark

https://www.basemark.com/products/basemark-gpu/

前回は割愛したBaseMark。GeForce RTX 3000シリーズのテスト同様にCustome Testを利用し

解像度:4K・フルスクリーン

Contents Quality:HIGH

Texture Compression:bc7

としたうえでDirectX 12/OpenGL/Vulkanの各APIで測定を行っている。

グラフ14


グラフ15


グラフ16


まずグラフ14〜16がそれぞれの結果である。DirectX 12(グラフ14)とVulkan(グラフ16)に関しては3DMarkとよく似た傾向だが、相変わらずOpenGL(グラフ15)におけるRadeonの性能は低い。勿論コンシューマ向けGPUカードでOpenGLのサポートはおまけでしかないが、それにしてももう少しAMDには何とかしてほしいところだ。最低フレームレートを見る限りむしろNVIDIAを上回ってるので、ハードウェア的に遅いという訳ではなさそうに見える訳で、恐らくはドライバの出来(というかサポートしているAPIの少なさ)が問題なのだろうと想像される。

グラフ17


グラフ18


グラフ19


フレームレート変動(グラフ17〜19)を見ると、グラフ14〜16の結果がそのまま反映されているという感じだ。ただグラフ18を見ると、NVIDIAも平均フレームレートこそAMDより高いものの、ドライバの出来はあまり良くなさそうだ。まぁ今時コンシューマ向けでOpenGLが必要とされるシーンは殆ど無いから仕方ないのかもしれないが。

○◆Bright Memory Infinite Ray Tracing Benchmark(グラフ20〜26)

Bright Memory Infinite Ray Tracing Benchmark

FYQD Personal Studio(飛燕群島個人工作室)

https://store.steampowered.com/

グラフ20


グラフ21


グラフ22


グラフ23


グラフ24


グラフ25


グラフ26


3DMarkのPortRoyal同様、GeForce RTX系が圧倒的なこちらのテスト。平均フレームレート(グラフ20)を見ると、Radeon RX 6900 XTはなんとかGeForce RTX 3070は超えているものの、GeForce RTX 3080には及ばないという程度で、これもPortRoyalと同じ傾向である。フレームレート変動(グラフ23〜26)は相変わらずスパイクが多いので傾向が見えにくくなっているが、大きな傾向としては

GeForce RTX 3090 > GeForce RTX 3080 > 残り4つ

という感じである。まぁそれでもRadeon RX 6900 XTはGeForce RTX 3070よりは高いDXRT性能が期待できそうではあるが。

●ゲームその1:Borderlands 3 / Dirt 5 / F1 2020 / FF XV / Horizon Zero Dawn

○◆Borderlands 3(グラフ27〜33)

Borderlands 3

2K Games

https://borderlands.com/ja-JP/

グラフ27


グラフ28


グラフ29


ここからはGame Benchmarkを。平均/最大/最小フレームレート(グラフ27〜29)で見ると、Radeon RX 6900 XTはGeForce RTX 3090を上回るスコアを出しているのは流石。ただRadeon RX 6800 XTとの差が、Radeon RX 6800 XTとRadeon RX 6800の差ほどにはない、というあたりが価格性能比で考えると厳しい部分ではある。

グラフ30


グラフ31


グラフ32


グラフ33


フレームレート変動(グラフ30〜33)で見ると、2KではRadeon RX 6900 XTは他と明確に性能差があるが、4Kあたりになると大分GeForce RTX 3090とかRadeon RX 6800 XTとの差がなくなってくるのはまぁ仕方ないのだろうが。

○◆Dirt 5(グラフ34〜40)

Dirt 5

Codemasters

https://dirtgame.com/dirt5

グラフ34


グラフ35


グラフ36


Borderlands 3同様にRadeon RX 6000系が得意なゲームがこちら。平均フレームレート(グラフ34)を見ると、GeForce RTX 3090はRadeon RX 6800 XTにすら及ばない(というかRadeon RX 6800並)、という凄まじさではあるのだが、その一方でRadeon RX 6900 XTとRadeon RX 6800 XTがあまり性能差が無いのが気になるところだ。

グラフ37


グラフ38


グラフ39


グラフ40


これはフレームレート変動からも明白で、2K(グラフ37)だと90秒あたりまではそれでもまだ性能差があるのだが、それを過ぎた先ではあまり明確な性能差があるとは言いにくい。2.5K(グラフ38)では、かなりグラフが重なってきており、性能差が出る場所と出ない場所が明白になってきている。この傾向は3K/4K(グラフ39・40)でも同じで、もう少し性能差があってもいいのに、と思わなくもない。一方GeForce RTX 3090は概ねRadeon RX 6800といい勝負といったところで、価格や消費電力を考えるとRadeon RX 6800のコストパフォーマンスの高さが光る結果になってしまった。

○◆F1 2020(グラフ41〜47)

F1 2020

Codemasters

http://www.codemasters.com/game/f1-2020/

グラフ41


グラフ42


グラフ43


前回もちょっと書いたが、結果がちょっとインフレ気味過ぎる。平均フレームレート(グラフ41)を見るとRadeon RX 6900 XTは2Kで300fpsに近いところまで性能を引き上げている。4Kですら136fpsだから、もう明らかに負荷が足りない。GeForce RTX 3090は、4Kになると同等だが、2KとかだとRadeon RX 6800 XTにも負けている感じで、ちょっとこれは意外であった。CPUがボトルネック、という訳ではなくもうゲームエンジンとの相性、という感じであるが。

グラフ44


グラフ45


グラフ46


グラフ47


フレームレート変動(グラフ44〜47)を見ると、次第にRadeon RX 6900 XTとGeForce RTX 3090の差が縮まってゆくのが判る。それはいいのだが、気になるのはRadeon RX 6800 XTとの差である。勿論4Kで言えば平均フレームレートで10fps程度の差があるから、これは無視できないのだが、逆に言うと10fpsしか差が無い(ちなみにGeForce RTX 3090とGeForce RTX 3080の間には20fpsの差がある)のが、コストパフォーマンス的に微妙な感じである。

○◆FINAL FANTASY XV WINDOWS EDITION ベンチマーク Version 1.2(グラフ48〜54)

FINAL FANTASY XV WINDOWS EDITION ベンチマーク Version 1.2

SQUARE ENIX

http://benchmark.finalfantasyxv.com/jp/

今回グラフを見て思ったのだが、このベンチマークのスコアは、平均フレームレートを100倍にしたものにかなり近い感じだ。一つの目安にはなりそうである(つまりスコアを100で割れば平均フレームレートが出てくる)。

グラフ48


グラフ49


グラフ50


グラフ51


それはともかくとして、まずScore(グラフ48)を見るとGeForce RTX 3090の性能がとびぬけているのが判る。勿論Radeon RX 6900 XTも健闘しているが、一歩及ばない感じだ。

グラフ52


グラフ53


グラフ54


これはフレームレート変動(グラフ52〜54)を見ても明らかで、実際変動を見るとRadeon RX 6800 XTとRadeon RX 6900 XT、GeForce RTX 3080の3つが一塊になっている感じである。GeForce RTX 3080はともかくとして、Radeon RX 6800 XTと大差ない、というのはRadeon RX 6900 XTの立場がやや微妙に感じざるを得ない。

○◆Horizon Zero Dawn(グラフ55〜61)

Horizon Zero Dawn

SIE

https://www.jp.playstation.com/games/horizon-zero-dawn/

グラフ55


グラフ56


グラフ57


平均フレームレート(グラフ55)を2Kで見た時と4Kで見た時で傾向がまるっきり変わるのが面白いところ。2KだとRadeon RX 6800 XTとRadeon RX 6890 XTが最高速で、GeForce RTX 3090はGeForce RTX 3080と大差ないあたりなのに、4KになるとそのGeForce RTX 3090がRadeon RX 6900 XTを上回る性能を出しているあたり、解像度が低い時にNVIDIA系は何かボトルネックがある様に思えるが、それが何かは見当が付かない。

グラフ58


グラフ59


グラフ60


グラフ61


最大/最小フレームレート(グラフ56・57)は役に立たないのでフレームレート変動(グラフ58〜61)を見ると、GeForce RTX 3090は3KあたりでRadeon RX 6900 XTと並び、4Kで追い越しているという感じである。もっとも追い越しているとは言え、10fps未満の差であるから、大きな性能差があるとは言いにくいところだ。

●ゲームその2:Metro Exodus / Red Dead Redemption 2 / Tomb Raider / Division 2

○◆Metro Exodus(グラフ62〜75)

Metro Exodus

4A Games

https://www.metrothegame.com/

グラフ62


グラフ63


グラフ64


前回は実線と破線で1つのグラフにDXRTアリとナシを混ぜてお届けしたが、今回6製品×2で12本のグラフにしたら重なり過ぎで見分けがつかなくなったので、あきらめて2つに分けた。まずはDXRT無効の場合(グラフ62〜68)。Radeon RX 6900 XTはGeForce RTX 3080よりは上だが、GeForce RTX 3090にはちょっと差があるという程度に落ち着いている。

グラフ65


グラフ66


グラフ67


グラフ68


面白いのはフレームレート変動(グラフ65〜68)である。例えば2K(グラフ65)を例にとると65秒あたりまでは圧倒的にGeForce RTX 3090のフレームレートの方が高い。ところがそこから80秒あたりまでの15秒間は、むしろRadeon RX 6900 XTの性能の方が上である。これは他の解像度にも共通する話で、何かしら相性があるらしい。ただ全体としてこの時間がそう長くないというのは、その意味ではDirt 5とかと逆に、Radeon系列はこのゲーム(というかゲームエンジン)と相性が宜しくないということだろう。

グラフ69


グラフ70


グラフ71


次にDXRT有効の場合(グラフ69〜75)。平均フレームレート(グラフ69)を見るとRadeon RX 6900 XTとRadeon RX 6800 XTが殆ど重なっているというのは、CU以外の部分がボトルネックになっている感じだ。あるいはInfinityCacheを使い切ってしまったとかだろうか? 実際フレームレートそのものも何とかGeForce RTX 3070よりは上という程度で、Port Royalの結果の再現である。最大/最小フレームレート(グラフ70・71)もそんな感じである。Radeon RX 6800と比較すると多少フレームレートの向上がみられるから、CU数も必要ではあるが、Radeon RX 6800 XTの64CUあたりでリソース(InfinityCacheが怪しい、と筆者は推察している)を使い切ってそれ以上フレームレートが上がらない、という感じに見て取れる。

グラフ72


グラフ73


グラフ74


グラフ75


フレームレート変動(グラフ72〜75)もこれを裏付ける結果になっている。

○◆Red Dead Redemption 2(グラフ76〜82)

Red Dead Redemption 2

Rockstar Games

https://www.rockstargames.com/jp/games/info/reddeadredemption2

グラフ76


グラフ77


グラフ78


平均/最大/最小フレームレート(グラフ76〜78)を見ると、グラフの形そのものは違っているが、性能の傾向はHorizon New Dawnに近いものがある。解像度が低いところではRadeon RX 6000系が有利で、実際Radeon RX 6900 XTが最高速、GeForce RTX 3090はRadeon RX 6800 XTより低いが、4KだとGeForce RTX 3090が最高速。Radeon RX 6900 XTはGeForce RTX 3080と同程度という結果だ。もっと4Kだと大分性能差は縮まっているが、その中でRadeon RX 6900 XTに10fps以上の差をつけているGeForce RTX 3090は流石である。

グラフ79


グラフ80


グラフ81


グラフ82


実際のフレームレート変動を見てみると、2K(グラフ79)でRadeon RX 6900 XTはほぼGeForce RTX 3090と同じ。これが2.5K(グラフ80)だとちょっと差が開いている。3K(グラフ81)だと差が更に開き、4K(グラフ82)ではほぼGeForce RTX 3080に近い結果になっている。高解像度で性能が伸び悩むというのは、扱うべきデータ量が増えてInfinityCacheが不足気味になるという可能性が高い。この辺がRadeon RX 6900 XTの問題かもしれない。

○◆Shadow of the Tomb Raider(グラフ83〜96)

Shadow of the Tomb Raider

SQUARE ENIX

https://tombraider.square-enix-games.com/en-us

グラフ83


グラフ84


グラフ85


グラフ86


グラフ87


グラフ88


グラフ89


Metro Exodus同様にこちらもDXRT無効と有効でグラフを分けた。まずはDXRT無効(グラフ83〜89)から。平均フレームレート(グラフ83)はHorizon New DawnとかRed Dead Redemption 2の再現という感じになっている。Radeon RX 6900 XTは2KだとGeForce RTX 3090を上回るが、3Kあたりで重なり4Kでは逆転されている。最大/最小フレームレート(グラフ84・85)も大体そんな感じだ。フレームレート変動を見ると、2K〜2.5K(グラフ86・87)では明確にRadeon RX 6900 XTが最高速である。ところが3K(グラフ88)だと微妙に逆転され、4K(グラフ89)では完全にGeForce RTX 3090の価値である。グラフ83だと4Kで6fps程度の差だが、80秒あたりのピークだと10fps近い差があるあたり、性能差は小さいとは言いにくいと思う。

グラフ90


グラフ91


グラフ92


グラフ93


グラフ94


グラフ95


グラフ96


次はDXRT有効の場合(グラフ90〜96)。もうこれでRadeon RX 6900 XTの性能が出ないのはやる前から明らかではあったのだが、平均フレームレート(グラフ90)を見るとGeForce RTX 3080にかなり近い程度の性能が出てる辺りは意外に健闘している感じだ。最大フレームレート(グラフ91)もそこそこだ。ただ最低フレームレート(グラフ92)が落ち込んでいるのは、やはり厳しい感じである。

面白いのはフレームレート変動で、例えば2K(グラフ93)で60秒あたりまではRadeon RX 6900 XTはかなり落ち込んでいる。ところがその後の盛り上がりではGeForce RTX 3090に比肩するフレームレートを見せ、ただしその後急速にまた下がっている。恐らくはこれ、60〜110秒あたりまではあまりDXRTの負荷が無いのであろう。Radeon RX 6900 XTだけでなく、Radeon RX 6800 XTとかRadeon RX 6800も似たような傾向であり、DXRT無効の場合の7割近いフレームレートを示している事もこの傍証となる。このあたりのフレームレートが高いがゆえに、平均フレームレートでは相対的に健闘している様に見える、という話である。逆に言えば、Bright Memory Infinite Ray Tracing Benchmarkの様にDXRT使いまくりだと、もっと激しく性能が落ちるということだ。

○◆Tom Clancy's The Division 2(グラフ97〜103)

Tom Clancy's The Division 2

Ubisoft

https://www.ubisoft.co.jp/division2/

グラフ97


グラフ98


グラフ99


ゲームテストの最後はこちらであるが、やはり結果はこれまでと似たものであった。平均フレームレート(グラフ97)を見ると2KはRadeon RX 6900 XTはGeForce RTX 3090と互角であるが、そこから解像度が上がってゆくにつれてGeForce RTX 3090にジリジリと引き離されてゆく感じである。最大/最小フレームレート(グラフ98・99)も大体そんな感じである。まぁ引き離されて、といっても4Kの段階で辛うじてGeForce RTX 3080よりは僅かに上回っているのだが。

グラフ100


グラフ101


グラフ102


グラフ103


これはフレームレート変動(グラフ100〜103)からも明確で、また高解像度になるほどRadeon RX 6800 XTとの差が縮まってゆくのも同じである。妙な話ではあるが。高解像度が苦手、という傾向がRadeon RX 6900 XTの最大の問題かもしれない。

●PCMark 10 / TMPGEnc Video Mastering Works 7 / Sandra 20/20

○◆PCMark 10 v2.1.2506(グラフ104〜109)

PCMark 10 v2.1.2506

UL Benchmarks

https://benchmarks.ul.com/pcmark10

グラフ104


グラフ105


グラフ106


グラフ107


グラフ108


グラフ109


Game Benchmarkはこの程度にして、最後にその他を色々。まずはお約束でPCMark 10。ここのPCMark 10の考察で書いた、OpenCL系が苦手という傾向は今回も遺憾なく発揮され(?)、SpreadSheetの結果が軒並み半分近い(グラフ107)ということで、Overall(グラフ104)では妙な差がついているが、これを除けば概ね同等というか、変な結果は一切出ていないことが判る。まぁここで変な結果が出たらまずいのだが。

○◆TMPGEnc Video Mastering Works 7 V7.0.18.20(グラフ110)

TMPGEnc Video Mastering Works 7 V7.0.18.20

ペガシス

http://tmpgenc.pegasys-inc.com/ja/product/tvmw7.html

前回は時間の関係で割愛した、内蔵Media Encoderの性能比較。手順としてはここのTMPGEnc Video Mastering Works 7と同じく、AMDにはAMD Media SDKを、NVIDIAにはNVENCをそれぞれ指定して、4ストリームの4K VP9動画を4K HEVC動画にトランスコードする速度を比較した。GeForce RTX 3090であっても、同時エンコードは2ストリームまでになっており、一方Radeon RX 6000シリーズは4ストリームでも同時エンコード可能ということで、4 StreamはRadeon RX 6000シリーズのみになっている。

グラフ110


ということで結果は御覧の通りである。面白いのはRadeon RX 6900 XTが一番高速なことで、コアの動作周波数そのものは変わらないのになぜRadeon RX 6800 XTより高速なのかが今一つ判らない。まぁそれはともかく内蔵エンコーダはAMDの方が今のところ優秀、という結果になった。もっともこれ速度だけの比較なので、画質とかを言い始めるとまた難しい比較になるのだが。

○◆Sandra 20/20 2020.11.30.80(グラフ111〜121)

Sandra 20/20 2020.11.30.80

SiSoftware

https://www.sisoftware.co.uk

グラフ111


グラフ112


性能比較の最後はこちらを。まずGPGPU Processing(グラフ111・112)では、Half PrecisionだとCUDAを利用した場合にGeForce RTX系が高速だが、OpenCLだと同等。Single PrecisionだとなぜかRadeon RX 6000系が性能が芳しくないが、逆にDouble PrecisionだとGeForce RTX系をぶっちぎり、という傾向がそのまま継承されている。ただSingle/DoubleでRadeon RX 6800XTとRadeon RX 6900XTの性能比を見ると7〜14%程度でしかなく、CUの数の比を考えればもう少し性能が上がっても良いのに、と思わざるを得ない。

グラフ113


グラフ114


グラフ115


AES Encryption/Decryption(グラフ113・114)はまぁ同じ傾向で、Radeon RX 6900XTはGeForce RTX 3080は超えたもののGeForce RTX 3090に辿り着くには至らずというところ。面白いのは次のHasing(グラフ115)で、SHA-1とSAH2-256でRadeon RTX 6800 XTとRadeon RTX 6900 XTがほぼ同じ性能(300GB/sec)というのは、要するにInfinityFabricがボトルネックになっている、という事と思われる。SHA2-512でRadeon RX 6000系が芳しくないのは持病というかこれまでも同じ傾向だったので不思議ではないが、ここでもRadeon RTX 6800 XTとRadeon RTX 6900 XTがかなり近いというか、Radeon RTX 6900 XTが頭打ちになっている気がする。

グラフ116


グラフ117


グラフ118


グラフ116〜118がFinancial Analysisであるが、3つに共通して

Single PrecisionだとGeForce RTX 3000シリーズが優位

Double PrecisionだとRadeon RX 6000シリーズが優位

という傾向は、そもそもTensor Coreを使ってSingle Precisionの計算が可能なGeForce RTX 3000系が有利という事を考えれば不思議ではない。それはいいのだが、Black-Scholesの結果(グラフ116)でRadeon RX 6000系3製品がそろって14.2GOPT/secのスコア、というのはもうCUではなく何か他のものがボトルネックになっている気がする。多分これもInfinityCacheではないかと筆者は考えるのだが。

グラフ119


グラフ120


グラフ121


最後にグラフ119〜121がScientific Analysisであるが。こちらも傾向は近い。ただGEMM(グラフ119)とN-Body(グラフ121)はまぁ順当な結果なのだが、FFT(グラフ120)のみまたRadeon RX 6000系3製品がほぼ同じ性能になっている。FFTの場合、バタフライ演算を行う関係で猛烈な量のメモリアクセスが発生する。生データを見ると、FFT実施時のBlock Sizeは128MB。つまりInfinityCacheがフルにデータで埋まっている状態である。これを超えるとメモリアクセスになるので性能が激減する。要するにここではInfinityCacheの「容量」がボトルネックになっていると判断できる。

ちなみに先ほどまでGame Testで頻発した「2K解像度だと性能が高いのに、4Kまで上げると性能が急速に落ちる」のは、むしろInfinityCacheの「帯域」が足りてないのではないかと筆者は考える。もっとも何で帯域が足りないかと言えば、結局容量が不足してGDDR6をアクセスする必要が出て、これが足を引っ張るからで、その意味ではやはり容量の問題ともいえなくもないのだが。

●AMD Smart Memory Accessの効果 / 消費電力 / 考察

○◆SAM(AMD Smart Memory Access)の効果(グラフ122〜127)

さて、ここまでのテストは常にSAM(AMD Smart Memory Access)をOnにして実施してきた。SAMの話はこちらでちょっと触れているが、もう少し説明をしたい。

そもそもPCI Expressの場合、デバイス側のメモリはデフォルトだと256MBまでの範囲でホスト(つまりCPUのメモリ空間)に張り付ける事が出来た。これがMemory I/O空間というものだが、この256MBという値は元々はPCIの標準化の際に決まった数値で、それをPCI Expressがそのまま引き継いだ形だ。このMemory I/O空間を管理しているのがPCI ExpressのConfiguration Space(管理用レジスタなどが置かれたメモリ空間)の中にあるBAR(Base Address Register)である。さて、PCIとか初期のPCI Expressでは、256MBで別に問題は無かった。当時はビデオカードにそんな大量のメモリが搭載されることはなかったし、CPU自身も32bitで使われる方が多かったから、256MBあれば十分だった。ところがCPUが64bitに移行するという頃になって、「BARが256MB対応のままでいいのか?」という議論が出てきた。最終的にPCI Express 2.0に対するECN(Engineering Change Notice)として、Resizable BAR Capabilityが2008年1月にリリースされ、2008年4月に承認。2009年4月にリリースされたPCI Express Base Specification Revision 2.1に取り込まれた。これはBARのサイズを1MB〜512GBまで変更できるというものである。ただしこれは必須ではなくオプション扱いとなっている。もっともこれ、ハードウェアの対応だけではなくOSやドライバの対応も必須である。幸いOSに関してはWDDM v2でこれに対応した事を2017年4月にMicrosoftが表明している。なので後はドライバが対応すれば、最大512GBまでのメモリを直接ホストのメモリ空間に張り付ける事が可能になる訳だ。

話をSAMに戻すと、SAMはこのResizable BAR Addressを利用して、16GBのメモリを直接CPUのMemory I/O空間に張り付ける技法である。これによる性能向上は5〜11%というのがAMDの説明であるが、さて実際にはどうか? という話である。

今回比較対象としては3DMark、FINAL FANTASY XV WINDOWS EDITION ベンチマーク、Metro Exodus、Shadow of the Tomb Raiderの4つを選んでみた。ちなみにMetro ExodusとShadow of the Tomb Raiderについては、DXRT無効/有効の両方で試してみた。

ということで結果を。さすがにここでもう一度フレームレート変動とかまで示すとグラフが更に増えるので、平均フレームレートないし代表値のみの比較である。

グラフ122


まずグラフ122が3DMark。今回はOverallのみである。はっきり言って、SAMを無効にした方が性能が伸びるという状況だった。性能差は主にGraphics Testの結果に起因しており、Physics/CPU Testの結果は1%以内の差で、誤差の範囲といったところ。特にWildLifeなどの負荷が軽いベンチでのスコア向上は著しい。

グラフ123


次はFINAL FANTASY XV WINDOWS EDITION ベンチマーク(グラフ123)だ。実践がSAM有効、破線がSAM無効であるが、SAMを有効にすると確かにわずかにスコアが上がっているものの、むしろ下がっているものもあるため、3つのビデオカードの平均を取ったら「差が無し」になってしまった。

グラフ124


グラフ125


Metro Exodus(グラフ124・125)も非常に微妙なところである。DXRT無効(グラフ124)だと、4Kでは性能が改善している一方2Kではむしろ下がっている。DXRT有効(グラフ125)だと、むしろ全般的にフレームレートが僅かながら落ちている始末。3枚のビデオカードの、4つの解像度における改善具合の平均値をとると、DXRT無効の場合は2.23%のフレームレート向上だが、DXRT有効の場合は0.73%のフレームレート下落という事になっており、これを効果があると言ってよいのか良く判らない。

グラフ126


グラフ127


今回のテストで唯一改善らしい改善が見られたのがShadow of the Tomb Raiderである。DXRT無効(グラフ126)の場合は最大で5.5%、平均で3.5%のフレームレート向上。DXRT有効(グラフ127)の場合は最大で4.7%、平均で3.0%のフレームレート向上の効果が得られた。AMDの示す例に比べるとちょっと少ない気がするが、このあたりは当然アプリケーションによって差が出るところだから、まぁ何もしないでこれが得られただけでも良しとすべきなのだろう。

○◆消費電力(グラフ128〜132)

最後にこちらを。まずグラフ128〜132が順に

3DMark FireStrikeのDemo

FF15 Bench(2K、高品質、フルスクリーン)

Metro Exodus(2K、Ultra)

Shadow of the Tomb Raider(2K・Highest)

のそれぞれの最初から最後までの消費電力変動を測定したものだ。Metro ExodusとShadow of the Tomb Raiderでは、Ray Tracing有効/無効の両方を測定している。

グラフ128


グラフ129


グラフ130


グラフ131


グラフ132


この消費電力変動を見て判るのが

GeForce RTX 3090の消費電力が飛び抜けている

Radeon RX 6900 XTの消費電力がRadeon RX 6800 XTと殆ど変わらない

事だ。GeForce RTX 3090に関してはOCモデルという事もあるが、例えばMetro Exodus(グラフ130)だと軽く620Wを超えており、GeForce RTX 3080比で70W近い消費電力アップである。どうもMSIはかなり攻めた構成にしており、その分消費電力が上がるのは仕方ないのかもしれない(まぁその分、特に4Kでは最高速な事が多かったが)。一方のRadeon RX 6900 XTは、逆に「何でこんなに消費電力が少ないの?」という感じだ。何しろGeForce RTX 3080よりも低いのだから。

このあたりは平均値(グラフ132)を見ると、より判りやすい。Radeon RX 6900 XTは、Radeon RX 6800 XT比で数W(下手をすると1W未満)しか消費電力が増えていない。それでいて性能が改善しているのだから、これは大したものだという気もする。

○考察 - 確かに最高性能のRadeon、ただ実売価格によっては他の候補も

ということで今回は更にグラフの枚数が増えていて申し訳ないが、Radeon RX 6900 XTの大まかな性能は見えたと思う。筆者の率直な評価は「微妙」である。

なんで微妙か? このクラスのビデオカードだと主戦場は4Kになるが、その4Kでは性能がRadeon RX 6800 XTと大差ないからだ。理由はInfinityCacheにある。思うに現状の128MBという容量は、Radeon RX 6800 XTだと丁度手頃なサイズであるが、Radeon RX 6900 XTだとちょっと不足気味になる。で、InfinityCacheがあふれた場合はGDDR6でのアクセスになり、ここがボトルネックになる。このあたりは先ほどSandra 20/20の考察の所で述べた通りだ。64CU/128MBあたりがベストバランスだとしたら、Radeon RX 6900 XTではInfinityCacheの容量を160MBあたりに増やす必要があるという計算になるが、勿論そんなことは不可能である。であれば、無理にRadeon RX 6900 XTでなくてもRadeon RX 6800 XTでいいのでは? という判断になる。少なくとも4Kでの絶対性能が欲しいならGeForce RTX 3090にはまだ敵わないし、そこそこの性能でいいならRadeon RX 6800 XTでも多分満足できるだろう。

ここで判断のポイントとなるのは価格である。もっとも冒頭で愚痴った通り、いまだにAMDから推定市販価格が伝えられていないので想像するしかないが、こちらにもある様に、先行したGPUでは

なので、換算レートは133〜135円/$程度になるだろう。Radeon RX 6900 XTは数も少ないので、更に価格を上げて例えば138円/$とかになるとすると、$999のRadeon RX 6900 XTの実売価格は\138,000位になる計算だ。さて、果たしてこのカードにそれだけの価値があると見るかどうかだ。

個人的な感想で言えば、これが秋葉原の店頭価格で10万を切るなら「即買い」だし、12万を切るなら「まぁ納得できる」範囲だが、これを超えたらちょっと「微妙」にならざるを得ない。まぁGeForce RTX 3090カードが軒並み20万円以上で販売されている現状を考えると、仮に\138,000だとしても買いなのかもしれないが、このカードでしかまとも動かない上に何が何でも遊びたいゲームなどがうっかり出てくるでもしない限りは、筆者ならRadeon RX 6800 XTを選ぶだろう。まずは実際の価格を見てからだろうが、想像通りならばなんとも悩ましいことになるだろう。