●3DMark / Basemark GPU / SuperPosition

NVIDIAがAmpereアーキテクチャベースの新世代GeForce GPUとして発表したGeForce RTX 30シリーズ。そのうち最初に市場投入されるのが「GeForce RTX 3080」である。先にPreviewをお届けしたが、発売日を明日に控えて、このGeForce RTX 3080の性能レビューが解禁となったので、ご紹介したいと思う。

今回入手したGeForce RTX 3080のFounders Edition


○ボード構成、GA102 GPUのサイズは?

先のPreviewの時は分解不可(まぁOKが出ても、この複雑なカードの分解はちょっと怖いが)ということでお見せ出来なかったボードの写真だが、幸いNVIDIAから提供されているので、まずはこれから見て行きたい。ボードそのものは極めて短く切り詰められた構成になっており、後端はファンにあわせて斜めに切り取られている(Photo01)。余談だが、このボードの構成はNVIDIA A100の発表の際に併せて発表された、MellanoxのConnectX-6DXまでのせたEGA A100(Photo02)を彷彿するものがある。ところでPhoto01に戻ると、本来12個搭載できるGDDR6Xのパターンがあり、うち10個が実装されているという事から、GeForce RTX 3090も同じ基板を用いて提供されるものと想像される。それでいて一回り大きいというのはどういうことか? というのはGeForce RTX 3090を試す機会を待つことになるだろう。

Photo01: よくこのスペースにVRMを詰め込んだものだという気もする。


Photo02: これは推論向けで、ネットワークから直接データを取り込んで、処理した結果を再びネットワークに送り出す(PCI Expressは制御用)用途向けのカード。


ヒートシンクの構造はこんな格好(Photo03)。Previewでご紹介した写真にでている4本のヒートシンクの構造が良くわかる。

Photo03: 後端にスナップがあるあたり、このスナップを外すとヒートシンクが分離できる構造とみた(実際には開けてないのであくまで推定だが)。


真上から基板を見たのがこちら(Photo04)。GA102チップとGDDR6X、それとVRMとコントローラの塊といった感じになっている。同様にヒートシンクも(Photo05)。ところでPhoto04から中心部を切り抜いたのがこちら(Photo06)。GDDR6Xの寸法が14mm×12mmと判っているので、ここから

GA102パッケージ:51mm×51mm

GA102ダイサイズ:23.6mm×27.2mmで641.9平方mm

と推定される。公開されているダイサイズはもう少し小さい様だが(628平方mmらしい)。

Photo04: VRMは18way。それはいいのだが、コントローラも18個というのが壮絶である。マザーボード用とかだと1つで6ch位まで制御できるVRMコントローラが存在するが、そうした専用品がなく、汎用品を流用したためだろうか?


Photo05: 左半分の細かいフィンはヒートパイプにきちんと接続されている模様。意匠と性能を両立させるためだろうが、コストが掛かっていそうな作りだ。


Photo06: TU102(Titan RTXとGeForce RTX 2080 Tiに採用)が754平方mmだからそれよりは小さいとはいえ、GeForce RTX 2080のTU104(545平方mm)を軽々とオーバーしている巨大ダイ。


GPU-Zでは問題なく認識された(Photo07)。それはいいのだが、ちょっとBIOSを覗いてみると、Power Limitが最大で370Wという表示が(Photo08)。これを見る限り、かなりの発熱を覚悟しなければならないことが予想される。

Photo07: ちなみにGPU-Z 2.33.0だと何も言わずに起動後即クラッシュしており、これへの対策版が2.34.0と思われる。


Photo08: GeForce RTX 3080でこれなのだから、GeForce RTX 3090だとどうなってしまうのだろう。


○ベンチマークテストの環境

では実際にベンチマーク結果をご紹介したい。今回は比較対象としてGeForce RTX 2080 Superと2080 Ti、それと一応AMDのRadeon RX 5700 XTも用意してみた。テスト環境は表1の通りである。

なお、以降のグラフでは

2080 Super:GeForce RTX 2080 Super Founder Edition

2080 Ti :GeForce RTX 2080 Ti Founder Edition

3080 :GeForce RTX 3080 Founder Edition

5700XT :Radeon RX 5700XT Reference

となる。また一部のテストではRT(Ray Tracing)On/Offの両方が混在している。ここでRTを有効にしたものは

2080 Super(RT):GeForce RTX 2080 Super Founder Edition RTX On

2080 Ti(RT) :GeForce RTX 2080 Ti Founder Edition RTX On

3080(RT) :GeForce RTX 3080 Founder Edition RTX On

となっている。また解像度表記は

2K :1920×1080pixel

2.5K:2560×1440pixel

3K :3200×1800pixel

4K :3840×2160pixel

とさせていただく。

○◆3DMark v2.12.6949(グラフ1〜10)

3DMark v2.12.6949

UL Benchmarks

https://benchmarks.ul.com/3dmark

9月3日に、GeForce RTX 3000シリーズへの対応やアップデートがアナウンスされた3DMarkであるが、今回はまだ対応版は間に合っておらず、Version 2.12.6949のままである。

グラフ1


まずグラフ1がOverallである。Port Royalに関してはRadeon RX 5700XTは未対応なので、GeForce RTXの3製品のみである。もう結果は見ての通りで、GeForce RTX 2080 SuperとGeForce RTX 2080 Ti、GeForce RTX 3080がほぼ一定のスコア差で並ぶという結果になっている。さすがにNightRaidに関してはCPUの方がボトルネックになっている感じで殆どスコア差が無いが、あとはきっちりと性能差がでている。

グラフ2


グラフ3


グラフ4


これはGraphics Test(グラフ2)でも顕著であり、実際一番負荷が高そうなTimeSpy Extremeにおいても、GeForce RTX 2080 Superが30fps台、GeForce RTX 2080 Tiでも40fps前後なのが、GeForce RTX 3080ではきっちり50fps以上をマークしている。グラフ3は確認の意味であるが、Physics/CPU Testの結果はどれも殆ど差が無く、CPU負荷が特に増えているといった事もない。それもあってCombined Test(グラフ4)では、SkyDiver/FireStrikeあたりでは(CPUの方がネックになって)大差ないが、GPUがネックになりやすいFireStrike Extreme/Ultraでは再びGeForce RTX 3080が最高速になっており、実に判りやすい。

グラフ5


グラフ5はDLSS Testで、ここは将来のバージョンではテスト内容が変わると思われるが、今はとりあえずDLSS On/OffでPort Royalの画面描画性能がどう変わるかの確認である。性能向上比は3製品ともほぼ同じく、DLSS Onにすることで40%ほどの改善がみられるが、DLSS Offにおける地の性能がやはりGeForce RTX 3080が圧倒的に高いのがそのまま結果に繋がっている格好だ。

グラフ6


グラフ6はPCI Express Testである。こちらのテストの場合、Bandwidthがそのままフレームレートに直結するタイプのものであり、ここではRadeon RX 5700XTもPCIe Gen4対応ということで健闘しており、ほぼGeForce RTX 3080並み。一方GeForce RTX 2080 Super/TiはPCIe Gen3対応ということで帯域がほぼ半減という、まぁセオリー通りの結果になっている。

○◆Basemark GPU 1.2(グラフ7〜9)

Basemark GPU 1.2

Basemark

https://www.basemark.com/products/basemark-gpu/

グラフ7


グラフ8


グラフ9


もう少しSynthesis Benchmarkを、ということで次はBasemark GPUを。今回はちょっと負荷を上げるためCustom Testを利用し

解像度:4K・フルスクリーン

Contents Quality:HIGH

Texture Compression:bc7

としたうえで、DirectX12(グラフ7)/OpenGL(グラフ8)/Vulkan(グラフ9)で測定を行い、その結果をまとめたものだ。とりあえず平均フレームレートで比較した場合、GeForce RTX 2080 Superを1とすると

となる。OpenGLはあまり力を入れてない(ここに注力するのはQuadro系のプロフェッショナルビデオカード用ドライバだけである)ためもあってか性能の伸びがいまいちだが、DirectX12/Vulkanでは50%以上のフレームレート向上が確認できた。

○◆SuperPosition v1.1(グラフ10〜16)

SuperPosition v1.1

Unigine

https://benchmark.unigine.com/superposition

もう一つSynthesisを、ということでこちら。今回は

Shaders Quality:High

Texture Quality:High

Depth of Field:On

Motion Blue:On

という環境で解像度を変化させながら測定すると同時に、OCAT V1.6を使ってフレームレート変動も取得してみた。

グラフ10


グラフ11


グラフ12


グラフ13


グラフ14


グラフ15


グラフ16


まずグラフ10〜12がそれぞれ平均/最大/最小フレームレートとなる。もう見ての通りで明確に性能差があり、GeForce RTX 3080の性能の高さが伺えるが、ちょっと面白かったのがフレームレート変動。2K(グラフ13)で75〜110秒あたり、GeForce RTX 3080とGeForce RTX 2080 Tiのグラフがきっちり重なっているのは、多分ここがCPUのボトルネックになっているものと思われる。逆に言えば、ここで更に性能が上がれば(例えばZen 3とか?)、もう少し2Kにおける平均フレームレートが引きあがると思われる。2K〜4Kまで通して、GeForce RTX 3080のフレームレートは、概ねGeForce RTX 2080 Superの5割増しといったところである。4Kの結果(グラフ16)で見ると、ちょっとだけQualityを下げれば十分4Kでの利用が可能な性能、と言えるだろう。

●ゲームその1:Borderlands 3 / F1 2020 / Horizon Zero Dawn

○◆Borderlands 3(グラフ17〜23)

Borderlands 3

2K Games

https://borderlands.com/ja-JP/

ここからはGame Benchmarkを。まずはBorderland 3。設定方法はこちらのBorderland 3の項目に準ずる。全体的な品質は「高」である。

グラフ17


グラフ18


グラフ19


まず平均フレームレート(グラフ17)で見ると、特に4Kでは2倍まではいかないものの、かなりそれに近い性能差が明確にあり、特に高解像度におけるGeForce RTX 3080の性能改善は顕著と言える。加えて言えば、GeForce RTX 2080 Tiとの性能差もかなり大きい。4Kにおける最小フレームレート(グラフ19)も53fpsとかなりのもので、4Kでも十分プレイできそうに思える。

グラフ20


グラフ21


グラフ22


グラフ23


実際フレームレート変動(グラフ20〜23)を見る限り、2Kとか2.5KではややOverkill気味。3Kでもゆとりたっぷりで、4Kでも割と現実的である。GeForce RTX 2080 Tiでも4Kはちょっと厳しい感じで、そういう意味でも差は小さくない。

○◆F1 2020(グラフ24〜30)

F1 2020

Codemasters

http://www.codemasters.com/game/f1-2020/

設定方法はこちらのF1 2020の項目に準じる。ちなみに設定は

Antialias:TAA(TAA Checkerboardにあらず)

Anisotropic Filter:16X

Detail Preset:UltraHigh

としている。

ちなみにこのテスト、なぜか当初GeForce RTX 3080のみベンチマークを開始するとクラッシュする、という謎の現象に悩まされた。ところが、なぜかF1 2019を追加でインストール→起動すると即座にクラッシュ→F1 2020を起動→問題なくベンチが動くようになる、という不思議な解決を見る事になった。問題がGeForce Driverの側にあるのか、F1 2020の方にあるのかは不明だが、まだ正式出荷前ということでこのあたりが不十分なのは良くある話で、逆にこのあたりをきちんと対応すると性能が変わってくる可能性もあるという事をご承知おき頂きたい(というか、F1 2019がクラッシュする理由が謎である)。

グラフ24


グラフ25


グラフ26


グラフ27


グラフ28


グラフ29


グラフ30


さて性能の方だが、Borderland 3ほどではないにせよ、平均フレームレート(グラフ24)は十分に高く、4Kですら120fpsだからもう充分すぎる。もっともGeForce RTX 2080 Superですら2Kで80fps弱、Radeon RX 5700XTで77.6fpsだから、どのカードでも4K Playableという言い方もできるが。最大/最小フレームレート(グラフ25・26)も順当な結果になっている。フレームレート変動(グラフ27〜30)を見ても、2K〜4Kまで綺麗に相似形を描きながら完全にグラフが分離しているあたり、GeForce RTX 3080の性能の高さは一目瞭然である。もっともややこれもOverkill気味な気もするが。

○◆Horizon Zero Dawn(グラフ31〜37)

Horizon Zero Dawn

SIE

https://www.jp.playstation.com/games/horizon-zero-dawn/

PS4向けタイトルのPCへの移植ということで色々話題のHorizon Zero Dawn。上のリンクからはPS4版しかアクセスできないが、PC版はSteamから入手できる。さて、入手は出来るのだが、色々とバグが多い事でも有名なこのタイトル、実際筆者もちょっと苦戦した。

ベンチマーク手順だが

オープニング画面からSETTINGを選択(Photo09)。

画面設定で解像度を設定。V-Syncはオフにする(Photo10)。

プリセットを選択して、確定後に"ベンチマークを実行する"を選ぶ(Photo11)。

ベンチが終わると、こんな風に結果が表示される(Photo12)。

という具合だ。あとはこれを繰り返すだけである。

ちなみにTipsとして

ベンチマーク結果は一切保存されない。筆者は諦めて画面キャプチャを取った(Photo13)。

最初のムービーはAlt+F4で中断し、すると「ゲームを終了しますか?」と聞いてくるので「いいえ」を選ぶとPhoto09の画面に飛ぶ。ただしここで注意であるが、一瞬でもいいからオープニングムービーを再生すること。ムービー再生前にショートカットしてしまうと、なぜかベンチマークがまともに動かない。

ゲームを立ち上げて1回目のベンチマークはまともに動かない。画面を見て頂くと判る(Photo14)が、まともに描画されていないし、フレームレートも煩雑に落ちる。これはスルーして2回目以降のデータを取る様にする。

時々、V-Sync Offにも関わらず、まるでV-Sync Onになってるような結果が出る事がある(Photo15)。こうなったらゲームを立ち上げなおさないと直らない。

Photo09: ここにたどり着くまでに、延々とオープニングムービーを鑑賞させられる羽目になる。ショートカット方法を発見するまで、無駄に時間を費やすことに。


Photo10: Adaptive performance FPSもオフのままにしておくこと。


Photo11: ちなみにプリセット、今回は「クオリティ優先」を選んだが、スコアを見る限り「最高画質」でも良かった気もしなくはない。


Photo12: 妙に最低フレームレートが低いのはベンチマーク結果の方で。


Photo13: いやログ出してくれよ....


Photo14: シュールとしか言いようがない。


Photo15: いや80fpsあたりでLimit、というあたりで明らかにV-Syncとは無関係なのだが。


といった事柄が挙げられる。今回はPatch 1.04を適用した状態で実施したが、今後Patchが上がるとまた挙動が変わるかもしれない。今回はベンチに使えるかという検証も兼ねて実施したのだが、今後はやらないかもしれない。ちなみにフレームレート変動はOCATで取得している。

グラフ31


グラフ32


グラフ33


ということで、まずはベンチマーク結果画面を集計したのがこちら(グラフ31〜33)。平均フレームレート(グラフ31)と最大フレームレート(グラフ32)を見ると、もうCPUがボトルネックというか、GPU性能的にはちょっとサチってる感じもある。最高画質にした方が良かったかも、というのはこの結果を受けての事だ。まぁ2Kはともかく4Kあたりになると性能差は明確で、やはりGeForce RTX 3080強しという傾向に違いはない。

グラフ34


グラフ35


グラフ36


グラフ37


ところで最小フレームレート(グラフ33)を見ると何が何だか、という感じになっている訳だが、これはフレームレート変動(グラフ34〜37)を見ると判りやすい。もうとにかく変動が非常に多いのだ。このグラフは0.5秒単位で集計しているから、ピークは多少なまっているが、実際のフレームレートで言えば本当に1〜2fpsまで落ちる事が珍しくない(実際何回かやったところ、最小フレームレートが0fps、という凄まじい結果が出た事すらあった)。もうこれは完全にゲームの出来栄えの問題であって、今後の改善が期待される部分ではあるのだが、逆に言うとこうした完成度(というか、この場合はPCへの移植度というか)が低いゲームであっても、GPUパワーで無理やり乗り切るという技は有効であり、その意味では変動こそ多いもののGeForce RTX 3080が一番快適なのは間違いない。

●ゲームその2:Metro Exodus / RDR2 / Tomb Raider / Division 2

○◆Metro Exodus(グラフ38〜44)

Metro Exodus

4A Games

https://www.metrothegame.com/

設定方法はこちらに準ずる。今回はUltraプリセットを利用した。ところでMetro ExodusはRay Tracing及びDLSSにも対応している(Photo16)。そこで今回はRay Tracing/DLSSなしと、両方ありの2パターンでデータを取った。実線が両方なし、破線が両方ありとなる。

Photo16: Ray TracingはOff/High/Ultraの3段階なので、今回はHighを選択。DLSSはOn/Offのみなので、Onとした。


グラフ38


グラフ39


グラフ40


ということでまずはOverall。平均フレームレート(グラフ38)を見ると、やはりGeForce RTX 3080の性能の高さは一目瞭然であるが、Ray Tracingを有効にすると丁度一段性能が落ちて、GeForce RTX 2080Ti相当といった感じになる。もっともこれは他も同じで、GeForce RTX 2080 TiはGeForce RTX 2080 Super相当に、GeForce RTX 2080 SuperはRadeon RX 5700XT相当になる感じだ。この傾向は最大/最小フレームレート(グラフ39・40)にも反映されている。

グラフ41


グラフ42


グラフ43


グラフ44


それはそれとして、フレームレート変動を見てみると、ちょっと面白い。もともとMetro Exodusの場合、80〜95秒あたりが一番GPU負荷が高いところで、例えば2K(グラフ41)であってもRadeon RX 5700XTとかGeForce RTX 2080 Superだと60fpsを切っているのだが、GeFore RTX 3080は70fps弱、Ray Tracing Onでも60fps強を確保しており、明確にここで性能差が見て取れる。逆に40秒前後のピークを見ると、GeForce RTX 2080 TiとGeForce RTX 3080のグラフがほぼ重なっており、ちょっとCPUがネックというか、GPU性能を使い切れていない感じだ。これが負荷が増える2.5K(グラフ42)〜4K(グラフ44)になると、もうグラフが完全に分離しており、実際4KあたりになるともうGeForce RTX 3080が唯一Playableという感じの結果になっている。

もう一つ面白いのは、2K〜3KあたりだとRay Tracing On/Offで結構明確にグラフが異なっているのに、4Kに関してはかなり重なっている事だ。変な話だが、この程度の性能差ならRay Tracing Onにしても良いと思える。ちょっと不思議ではあるが、そうした傾向が読み取れる結果となった。

○◆Red Dead Redemption 2(グラフ45〜51)

Red Dead Redemption 2

Rockstar Games

https://www.rockstargames.com/jp/games/info/reddeadredemption2

設定方法はこちらに準ずる。Quality Preset LevelはLevel 14の"Favor Quality"とした。こちらもフレームレート変動をOCATで取得している。

グラフ45


グラフ46


グラフ47


平均フレームレート(グラフ45)はまぁ妥当というか順当な結果であるし、最大フレームレート(グラフ46)も同じくである。最小フレームレート(グラフ47)があてにならないのは、やはりフレームレートが暴れているためである。

グラフ48


グラフ49


グラフ50


グラフ51


ということでフレームレート変動(グラフ48〜51)を見てみると、Horizon Zero Dawnほどではないにせよ、こちらも細かくフレームレート変動が発生しているのが判る。最小フレームレートがあてにならないのは、この細かなフレームレート変動のためである。それはそれとしてフレームレートを見てみると、2.5Kあたりまでは一応4製品とも60fpsをクリア(Radeon RX 5700XTはちょっと怪しいが)しているが、3KになるとそのRadeon RX 5700XTとGeForce RTX 2080 Superが脱落。4KになるとGeForce RTX 2080 Tiも脱落で、GeForce RTX 3080が4Kでもプレイ可能な唯一のカードになっているのは流石というべきだろう。

○◆Shadow of the Tomb Raider(グラフ52〜58)

Shadow of the Tomb Raider

SQUARE ENIX

https://tombraider.square-enix-games.com/en-us

設定方法はこちらに準じる。QualityはHighestとした。ちなみにShadow of the Tomb Raiderも、当初からRay Tracing対応としてアピールされていたゲームであり(DLSSには未対応)、なのでこちらもRay Racing On/Offの両方でデータを取っている。

グラフ52


グラフ53


グラフ54


さてまず平均フレームレート(グラフ52)や最大フレームレート(グラフ53)を見ると、先のMetro ExodusよりもRay Tracing Onにした場合のフレームレートの落ち方が激しい。GeForce RTX 2080 TiがRadeon RX 5700XT相当まで性能が落ちる訳で、このあたりはプログラム側の実装次第なのだろうとは思うが、なかなかインパクトがある。それでもGeForce RTX 3080だと4Kでも平均で53.5fpsを確保しているのは流石ではある。4K Playableか? と言われると厳しい所で、Ray Tracingを併用するなら3Kまで、という感じだろうか? 最小フレームレート(グラフ54)もRay TracingをOnにすると露骨に落ちるあたり、本当に負荷が高くなっているようだ。

グラフ55


グラフ56


グラフ57


グラフ58


実際にフレームレート変動(グラフ55〜58)を見てみると、非常に面白い。Ray Tracing Onにした場合、40〜60秒あたりで強烈にフレームレートが下がるからだ。シーン的に言えば酒場のあたりで、確かにRay Tracing映えはするものの、負荷も強烈なところである。0〜40秒もやはり負荷は多いが、40秒以降に比べるとまだマシ、という感じである。ここで3K(グラフ57)だと、この40秒前後のフレームレートがGeForce RTX 3080だとRay Tracing Onでもなんとか60fps弱が維持できており、ところが4K(グラフ58)だとここが40fpsあたりまで下落している。GeForce RTX 3080をもってしても、Ray Tracing Onではやはり4K Playableとは言えない、という結論になるだろう。とはいえ、2000シリーズからの性能の伸びは素晴らしいし、Ray Tracing Offだと4Kで80fps近くを確保できているから全く問題は無いのだが。

○◆Tom Clancy's The Division 2(グラフ59〜65)

Tom Clancy's The Division 2

Ubisoft

https://www.ubisoft.co.jp/division2/

設定方法はこちらの"Tom Clancy's The Division 2"に準ずる。QualityはUltraとした。

グラフ59


グラフ60


グラフ61


グラフ62


グラフ63


グラフ64


グラフ65


平均/最大/最小フレームレート(グラフ59〜61)を見ると、GeForce RTX 3080はGeForce RTX 2080 Superの倍とは言わないまでも5割増し以上のフレームレートを実現出来ており、もう素直に性能が出ている格好だ。フレームレート変動(グラフ62〜65)を見ると、細かく変動はあるにはあるが、最小フレームレートに大きな影響を与えるほどのものではなく、それもあって綺麗にグラフが分離している。特に4K(グラフ65)では、GeForce RTX 3080はほぼ70fpsを維持しており、立派に4K Playableとしていいだろう(GeForce RTX 2080 TiはQualityを下げれば60fpsは確保できそうだが)。

●PCMark 10 / CompuBench 2.0 / TMPGEnc Video Mastering Works 7

○◆PCMark 10 v2.1.2177(グラフ66〜71)

PCMark 10 v2.1.2177

UL Benchmarks

https://benchmarks.ul.com/pcmark10

グラフ66


グラフ67


グラフ68


グラフ69


グラフ70


グラフ71


3D性能は以上で終わりだが、一応PCの「普通の用途に使えるか」の確認のためにPCMark 10も実施してみた。もうOverall(グラフ66)の時点で明白だが、Gamingを除くとどれも大差ないという感じ(強いて言えばOpenCL周りの性能が低い関係でRadeon RX 5700XTがやや不利)程度で、あとは大差ない。このOpenCL周りというのは、グラフ69のSpreadsheetとかグラフ70のVideo Editingに関係しており、その分Radeon RX 5700XTのスコアが低めという形だ。逆に言えばGeForce RTX 3080を入れたからと言ってこのあたりが高速化される筈も無いが、まぁ普通に動く事は確認できた。

一番現実のシナリオに近いのは、Office 365を利用するApplication Test(グラフ71)で、ここではどの製品でも大差ないという、当然そうあるべき結果に終わっている。

○◆CompuBench 2.0(グラフ72〜74)

CompuBench 2.0

Kishonti Ltd.

https://compubench.com/

GPUとしての性能はここまで評価してきた通りだが、GPGPUとしての性能評価はまた別である。今までだとBasemark GPUとかLuxMarkなんかを使ってきたが、もうどちらも古すぎる。そこで今回はCompuBench 2.0を採用してみた。

起動すると(選択できる場合は)API及び利用するデバイスの選択がまずある(Photo17)。テストは4グループ、全部で13個からなる(Photo18)。ここで行いたいテストを選んで「開始」を押すとしばらくテストを行い、最後に結果を表示してて終了である(Photo19)。

Photo17: NVIDIAのカードの場合はCUDAとOpenCLが選べる(AMDは当然OpenCLのみ)。


Photo18: APIに応じて出来ないテストも出てくる。NVIDIAの場合、Advanced ComputeはOpenCLだと動かない。


Photo19: これもまた結果がファイルとかでは出ないので、画面を見ながら手で打ち込むあたりがちょっともどかしい。結果のExport機能が欲しい。


ということで結果をグループ別にグラフ72〜74にまとめてみた(Computer Visionはテスト1個なので、High Quality Computer Generated Imagery and Renderingにまとめた)。Photo19を見て頂くと判るが、結果の桁がテストに応じて3桁ほど変わるので、グラフ72〜74に関しては横軸を対数軸にしている。そんな訳で、グラフの高さというよりは数字で判断していただきたい。

グラフ72


グラフ73


グラフ74


さて、性能の方であるが、実はスペックで比較すると、GeForce RTX 3080が色々化け物である。ちょっと抜き出すと

となる(比率はGeForce RTX 2080 Superを1.00とした場合の数字)。結果を見ると、GeForce RTX 2080 Tiは確かにGeForce RTX 2080 Superの1.2倍前後に落ち着いているが、GeForce RTX 3080はGeForce RTX 2080 Superの2倍弱、といったあたりで2.67倍にはちょっと遠い。むしろメモリ帯域(それぞれ496GB/sec、616GB/sec、760GB/sec)の比に近い。その意味では、メモリ帯域が先にボトルネックになっている感じで、フルにシェーダーの性能を生かせる状況ではない、という事だろうか。まぁそうした使い方がしたければ、HBM2を搭載したA100を使え、ということなのかもしれない。まぁとりあえずはメモリ帯域に比例する程度のGPGPU性能が得られる、という事は確認できた。

○◆TMPGEnc Video Mastering Works 7 V7.0.15.17(グラフ75)

TMPGEnc Video Mastering Works 7 V7.0.15.17

ペガシス

http://tmpgenc.pegasys-inc.com/ja/product/tvmw7.html

次はこちら。要するに内蔵するメディアエンコーダ性能の比較である。最新バージョンはV7.0.16に上がったが、今回は一つ手前のV7.0.15.17で試用した。行っているのはVP9の4K映像をHEVC(H.265)の4Kへのトランスコードで、GeForce RTXはNVENCを、Radeon RX 5700XTはAMD Media SDKをそれぞれエンコーダとして指定している。エンコードは、4ストリームの映像を同時トランスコードといういつもの方法で行ったが、もともとAMDは同時4ストリームのエンコードが可能だが、NVENCは同時2ストリームまでとなっており、これはGeForce RTX 3080でも同じであった。

グラフ75


結果はグラフ75に示す通りで、初めて(そして唯一)Radeon RX 5700XTが他を圧倒する結果になった訳だが、それはともかくGeForce RTX 3080のエンコード速度は意外にもGeForce RTX 2080 Super/Tiよりもやや遅かった。とはいえ大きな差ではないし、そもそもメディアエンコードが目的でGeForce RTX 3080を購入するユーザーはそう多くないと思うので、これはこれで良いのかもしれない。

●消費電力 / 考察

○◆消費電力(グラフ76〜80)

最後は消費電力比較である。今回はFireStrike Demoの他、F1 2020とMetro Exodus、Shadow of the Tomb Raiderのそれぞれの2Kでのベンチマーク中の消費電力を測定した。なおMetro ExodusとShadow of the Tomb Raiderでは、Ray Tracing(Metro Exodusでは更にDLSS)を有効にした場合と無効の場合でどの程度の差が出るか、も同時に確認してみた。

グラフ76


グラフ77


グラフ78


グラフ79


まず消費電力変動がグラフ76〜79となる。GeForce RTX 3080は、GeForce RTX 2080 Tiと比較しても100W、GeForce RTX 2080 Superとだと150W弱、消費電力が増えている事が明白である。これはF1 2020(グラフ77)とかMetro Exodus(グラフ78)、Shadow of the Tomb Raider(グラフ79)などにも共通する話である。またRay Tracing、Metro Exodusだとあんまり増えていないというか、殆ど変わらない格好だが、Shadow of the Tomb Raiderでは明確にRay Tracing有効にすると消費電力も増えている。

グラフ80


それぞれの稼働中の平均値を取ったのがグラフ80となる。ちなみに「解像度が大きくなると消費電力も増える」と思われるかもしれないが、実際には解像度が大きくなっても小さくなっても、GPUはどうせ100%負荷なので変わらない。加えて言えば、解像度が小さいほどフレームレートが上がる分、CPUの負荷が増える=CPUの消費電力が増える、ということでむしろトータルの消費電力は上がる傾向にある。ラフに言えば、3Dゲームを遊ぶ場合、GeForce RTX 3080のシステムだと軽く500Wを超える。勿論これはCPUにRyzen 9 3900Xを組み合わせた場合の話なので、CPUのグレードを下げればもう少し下がるかもしれないが、400W前半台まで落ちるとは思えない。この消費電力の増加が、GeForce RTX 3080の最大のネックである。

実をいうと、今回のGeForce RTX 3080のベンチは、昼間はまともに実施できなかった。猛暑が続いたこともあり、エアコンがそれなりに稼働しているのだが、筆者宅は古いアパートで、おまけに電源容量(30A)ぎりぎり、ということもあって、エアコンの負荷変動が起きるとちょっと大きめの電圧降下があるためか、システムがリブートしてしまっていた。エアコンの負荷変動が小さい(=気温の下がった)深夜にはそうしたことが一切無かったあたり、GeForce RTX 3080を安定して使うためには、あくまで個別の事情だが、部屋の電源の安定供給度は確認しておくべきだった。多分筆者宅でこれを常用しようと思ったら、1000Wクラスの安定化機能付きUPSを噛まさないと難しいだろう。

さて、グラフ75〜79はwatts up? proで測定した実効消費電力だが、watts up? proは1秒毎の積算消費電力の平均値をレポートするだけで、ピーク値はロギング出来ないので、瞬間的にどの程度まで消費電力が増えるのかは分からない。ただ昼間のシステムの落ちっぷりを見るに、相当電源に負荷が掛かる様に思う(ちなみに1000W電源を利用していてこの状況だ)。消費電力が100W以上増える事を鑑みても、電源と排熱処理はシビアに考える事になると思う。

○考察

ということでGeForce RTX 3080の性能レポートをお届けした。何というか色々と化け物である。フレームレートがGeForce RTX 2080 Super比ですら5割以上も上がるから、そのフレームレートがどうしても欲しい、というユーザーには福音となる製品であろう。

NVIDIAは8K Playableと説明しているが、確かに軽めのゲームなら8K60fpsも十分に狙えるだろう。もっとも、ゲームプレイのためにそんなモニターを入れられる場所を確保しているユーザーが、現時点でどの程度「日本に」居るのかは良くわからないが。

この凄まじい性能の代償はコストと消費電力である。とくに電源にはかなり厳しい。筆者宅の電源事情だと安定運用は冬になるまで無理だろう(*1)。また消費電力が100W以上増えていれば、当然発熱も相応に増えるはずで、バラ組運用でテストを行っている筆者の環境はともかく、ケースに入れて常用するならケース内温度はかなり上がると思われる。ケースの排熱能力を一段高めないといけないだろう。というシーンも多そうだ。導入する前に、まずはこうした環境が整えられるかをよく確認したうえで、そこで目途が立ちそうな人だけ、資金調達に走るというのが良いかと思う。

とりあえず筆者的には、この後に控えるGeForce RTX 3070に期待したい。こちらは消費電力が100W下がるからだ。

(*1) ガスストーブが併用できるので、冬は消費電力的にかなり楽になる。