GeForce RTX 3080の性能を徹底検証する - 性能は化け物、電源と排熱に注意
●3DMark / Basemark GPU / SuperPosition
NVIDIAがAmpereアーキテクチャベースの新世代GeForce GPUとして発表したGeForce RTX 30シリーズ。そのうち最初に市場投入されるのが「GeForce RTX 3080」である。先にPreviewをお届けしたが、発売日を明日に控えて、このGeForce RTX 3080の性能レビューが解禁となったので、ご紹介したいと思う。
○ボード構成、GA102 GPUのサイズは?
先のPreviewの時は分解不可(まぁOKが出ても、この複雑なカードの分解はちょっと怖いが)ということでお見せ出来なかったボードの写真だが、幸いNVIDIAから提供されているので、まずはこれから見て行きたい。ボードそのものは極めて短く切り詰められた構成になっており、後端はファンにあわせて斜めに切り取られている(Photo01)。余談だが、このボードの構成はNVIDIA A100の発表の際に併せて発表された、MellanoxのConnectX-6DXまでのせたEGA A100(Photo02)を彷彿するものがある。ところでPhoto01に戻ると、本来12個搭載できるGDDR6Xのパターンがあり、うち10個が実装されているという事から、GeForce RTX 3090も同じ基板を用いて提供されるものと想像される。それでいて一回り大きいというのはどういうことか? というのはGeForce RTX 3090を試す機会を待つことになるだろう。
ヒートシンクの構造はこんな格好(Photo03)。Previewでご紹介した写真にでている4本のヒートシンクの構造が良くわかる。
真上から基板を見たのがこちら(Photo04)。GA102チップとGDDR6X、それとVRMとコントローラの塊といった感じになっている。同様にヒートシンクも(Photo05)。ところでPhoto04から中心部を切り抜いたのがこちら(Photo06)。GDDR6Xの寸法が14mm×12mmと判っているので、ここから
GA102パッケージ:51mm×51mm
GA102ダイサイズ:23.6mm×27.2mmで641.9平方mm
と推定される。公開されているダイサイズはもう少し小さい様だが(628平方mmらしい)。
GPU-Zでは問題なく認識された(Photo07)。それはいいのだが、ちょっとBIOSを覗いてみると、Power Limitが最大で370Wという表示が(Photo08)。これを見る限り、かなりの発熱を覚悟しなければならないことが予想される。
○ベンチマークテストの環境
では実際にベンチマーク結果をご紹介したい。今回は比較対象としてGeForce RTX 2080 Superと2080 Ti、それと一応AMDのRadeon RX 5700 XTも用意してみた。テスト環境は表1の通りである。
なお、以降のグラフでは
2080 Super:GeForce RTX 2080 Super Founder Edition
2080 Ti :GeForce RTX 2080 Ti Founder Edition
3080 :GeForce RTX 3080 Founder Edition
5700XT :Radeon RX 5700XT Reference
となる。また一部のテストではRT(Ray Tracing)On/Offの両方が混在している。ここでRTを有効にしたものは
2080 Super(RT):GeForce RTX 2080 Super Founder Edition RTX On
2080 Ti(RT) :GeForce RTX 2080 Ti Founder Edition RTX On
3080(RT) :GeForce RTX 3080 Founder Edition RTX On
となっている。また解像度表記は
2K :1920×1080pixel
2.5K:2560×1440pixel
3K :3200×1800pixel
4K :3840×2160pixel
とさせていただく。
○◆3DMark v2.12.6949(グラフ1〜10)
3DMark v2.12.6949
UL Benchmarks
https://benchmarks.ul.com/3dmark
9月3日に、GeForce RTX 3000シリーズへの対応やアップデートがアナウンスされた3DMarkであるが、今回はまだ対応版は間に合っておらず、Version 2.12.6949のままである。
まずグラフ1がOverallである。Port Royalに関してはRadeon RX 5700XTは未対応なので、GeForce RTXの3製品のみである。もう結果は見ての通りで、GeForce RTX 2080 SuperとGeForce RTX 2080 Ti、GeForce RTX 3080がほぼ一定のスコア差で並ぶという結果になっている。さすがにNightRaidに関してはCPUの方がボトルネックになっている感じで殆どスコア差が無いが、あとはきっちりと性能差がでている。
これはGraphics Test(グラフ2)でも顕著であり、実際一番負荷が高そうなTimeSpy Extremeにおいても、GeForce RTX 2080 Superが30fps台、GeForce RTX 2080 Tiでも40fps前後なのが、GeForce RTX 3080ではきっちり50fps以上をマークしている。グラフ3は確認の意味であるが、Physics/CPU Testの結果はどれも殆ど差が無く、CPU負荷が特に増えているといった事もない。それもあってCombined Test(グラフ4)では、SkyDiver/FireStrikeあたりでは(CPUの方がネックになって)大差ないが、GPUがネックになりやすいFireStrike Extreme/Ultraでは再びGeForce RTX 3080が最高速になっており、実に判りやすい。
グラフ5はDLSS Testで、ここは将来のバージョンではテスト内容が変わると思われるが、今はとりあえずDLSS On/OffでPort Royalの画面描画性能がどう変わるかの確認である。性能向上比は3製品ともほぼ同じく、DLSS Onにすることで40%ほどの改善がみられるが、DLSS Offにおける地の性能がやはりGeForce RTX 3080が圧倒的に高いのがそのまま結果に繋がっている格好だ。
グラフ6はPCI Express Testである。こちらのテストの場合、Bandwidthがそのままフレームレートに直結するタイプのものであり、ここではRadeon RX 5700XTもPCIe Gen4対応ということで健闘しており、ほぼGeForce RTX 3080並み。一方GeForce RTX 2080 Super/TiはPCIe Gen3対応ということで帯域がほぼ半減という、まぁセオリー通りの結果になっている。
○◆Basemark GPU 1.2(グラフ7〜9)
Basemark GPU 1.2
Basemark
https://www.basemark.com/products/basemark-gpu/
もう少しSynthesis Benchmarkを、ということで次はBasemark GPUを。今回はちょっと負荷を上げるためCustom Testを利用し
解像度:4K・フルスクリーン
Contents Quality:HIGH
Texture Compression:bc7
としたうえで、DirectX12(グラフ7)/OpenGL(グラフ8)/Vulkan(グラフ9)で測定を行い、その結果をまとめたものだ。とりあえず平均フレームレートで比較した場合、GeForce RTX 2080 Superを1とすると
となる。OpenGLはあまり力を入れてない(ここに注力するのはQuadro系のプロフェッショナルビデオカード用ドライバだけである)ためもあってか性能の伸びがいまいちだが、DirectX12/Vulkanでは50%以上のフレームレート向上が確認できた。
○◆SuperPosition v1.1(グラフ10〜16)
SuperPosition v1.1
Unigine
https://benchmark.unigine.com/superposition
もう一つSynthesisを、ということでこちら。今回は
Shaders Quality:High
Texture Quality:High
Depth of Field:On
Motion Blue:On
という環境で解像度を変化させながら測定すると同時に、OCAT V1.6を使ってフレームレート変動も取得してみた。
まずグラフ10〜12がそれぞれ平均/最大/最小フレームレートとなる。もう見ての通りで明確に性能差があり、GeForce RTX 3080の性能の高さが伺えるが、ちょっと面白かったのがフレームレート変動。2K(グラフ13)で75〜110秒あたり、GeForce RTX 3080とGeForce RTX 2080 Tiのグラフがきっちり重なっているのは、多分ここがCPUのボトルネックになっているものと思われる。逆に言えば、ここで更に性能が上がれば(例えばZen 3とか?)、もう少し2Kにおける平均フレームレートが引きあがると思われる。2K〜4Kまで通して、GeForce RTX 3080のフレームレートは、概ねGeForce RTX 2080 Superの5割増しといったところである。4Kの結果(グラフ16)で見ると、ちょっとだけQualityを下げれば十分4Kでの利用が可能な性能、と言えるだろう。
●ゲームその1:Borderlands 3 / F1 2020 / Horizon Zero Dawn
○◆Borderlands 3(グラフ17〜23)
Borderlands 3
2K Games
https://borderlands.com/ja-JP/
ここからはGame Benchmarkを。まずはBorderland 3。設定方法はこちらのBorderland 3の項目に準ずる。全体的な品質は「高」である。
まず平均フレームレート(グラフ17)で見ると、特に4Kでは2倍まではいかないものの、かなりそれに近い性能差が明確にあり、特に高解像度におけるGeForce RTX 3080の性能改善は顕著と言える。加えて言えば、GeForce RTX 2080 Tiとの性能差もかなり大きい。4Kにおける最小フレームレート(グラフ19)も53fpsとかなりのもので、4Kでも十分プレイできそうに思える。
実際フレームレート変動(グラフ20〜23)を見る限り、2Kとか2.5KではややOverkill気味。3Kでもゆとりたっぷりで、4Kでも割と現実的である。GeForce RTX 2080 Tiでも4Kはちょっと厳しい感じで、そういう意味でも差は小さくない。
○◆F1 2020(グラフ24〜30)
F1 2020
Codemasters
http://www.codemasters.com/game/f1-2020/
設定方法はこちらのF1 2020の項目に準じる。ちなみに設定は
Antialias:TAA(TAA Checkerboardにあらず)
Anisotropic Filter:16X
Detail Preset:UltraHigh
としている。
ちなみにこのテスト、なぜか当初GeForce RTX 3080のみベンチマークを開始するとクラッシュする、という謎の現象に悩まされた。ところが、なぜかF1 2019を追加でインストール→起動すると即座にクラッシュ→F1 2020を起動→問題なくベンチが動くようになる、という不思議な解決を見る事になった。問題がGeForce Driverの側にあるのか、F1 2020の方にあるのかは不明だが、まだ正式出荷前ということでこのあたりが不十分なのは良くある話で、逆にこのあたりをきちんと対応すると性能が変わってくる可能性もあるという事をご承知おき頂きたい(というか、F1 2019がクラッシュする理由が謎である)。
さて性能の方だが、Borderland 3ほどではないにせよ、平均フレームレート(グラフ24)は十分に高く、4Kですら120fpsだからもう充分すぎる。もっともGeForce RTX 2080 Superですら2Kで80fps弱、Radeon RX 5700XTで77.6fpsだから、どのカードでも4K Playableという言い方もできるが。最大/最小フレームレート(グラフ25・26)も順当な結果になっている。フレームレート変動(グラフ27〜30)を見ても、2K〜4Kまで綺麗に相似形を描きながら完全にグラフが分離しているあたり、GeForce RTX 3080の性能の高さは一目瞭然である。もっともややこれもOverkill気味な気もするが。
○◆Horizon Zero Dawn(グラフ31〜37)
Horizon Zero Dawn
SIE
https://www.jp.playstation.com/games/horizon-zero-dawn/
PS4向けタイトルのPCへの移植ということで色々話題のHorizon Zero Dawn。上のリンクからはPS4版しかアクセスできないが、PC版はSteamから入手できる。さて、入手は出来るのだが、色々とバグが多い事でも有名なこのタイトル、実際筆者もちょっと苦戦した。
ベンチマーク手順だが
オープニング画面からSETTINGを選択(Photo09)。
画面設定で解像度を設定。V-Syncはオフにする(Photo10)。
プリセットを選択して、確定後に"ベンチマークを実行する"を選ぶ(Photo11)。
ベンチが終わると、こんな風に結果が表示される(Photo12)。
という具合だ。あとはこれを繰り返すだけである。
ちなみにTipsとして
ベンチマーク結果は一切保存されない。筆者は諦めて画面キャプチャを取った(Photo13)。
最初のムービーはAlt+F4で中断し、すると「ゲームを終了しますか?」と聞いてくるので「いいえ」を選ぶとPhoto09の画面に飛ぶ。ただしここで注意であるが、一瞬でもいいからオープニングムービーを再生すること。ムービー再生前にショートカットしてしまうと、なぜかベンチマークがまともに動かない。
ゲームを立ち上げて1回目のベンチマークはまともに動かない。画面を見て頂くと判る(Photo14)が、まともに描画されていないし、フレームレートも煩雑に落ちる。これはスルーして2回目以降のデータを取る様にする。
時々、V-Sync Offにも関わらず、まるでV-Sync Onになってるような結果が出る事がある(Photo15)。こうなったらゲームを立ち上げなおさないと直らない。
といった事柄が挙げられる。今回はPatch 1.04を適用した状態で実施したが、今後Patchが上がるとまた挙動が変わるかもしれない。今回はベンチに使えるかという検証も兼ねて実施したのだが、今後はやらないかもしれない。ちなみにフレームレート変動はOCATで取得している。
ということで、まずはベンチマーク結果画面を集計したのがこちら(グラフ31〜33)。平均フレームレート(グラフ31)と最大フレームレート(グラフ32)を見ると、もうCPUがボトルネックというか、GPU性能的にはちょっとサチってる感じもある。最高画質にした方が良かったかも、というのはこの結果を受けての事だ。まぁ2Kはともかく4Kあたりになると性能差は明確で、やはりGeForce RTX 3080強しという傾向に違いはない。
ところで最小フレームレート(グラフ33)を見ると何が何だか、という感じになっている訳だが、これはフレームレート変動(グラフ34〜37)を見ると判りやすい。もうとにかく変動が非常に多いのだ。このグラフは0.5秒単位で集計しているから、ピークは多少なまっているが、実際のフレームレートで言えば本当に1〜2fpsまで落ちる事が珍しくない(実際何回かやったところ、最小フレームレートが0fps、という凄まじい結果が出た事すらあった)。もうこれは完全にゲームの出来栄えの問題であって、今後の改善が期待される部分ではあるのだが、逆に言うとこうした完成度(というか、この場合はPCへの移植度というか)が低いゲームであっても、GPUパワーで無理やり乗り切るという技は有効であり、その意味では変動こそ多いもののGeForce RTX 3080が一番快適なのは間違いない。
●ゲームその2:Metro Exodus / RDR2 / Tomb Raider / Division 2
○◆Metro Exodus(グラフ38〜44)
Metro Exodus
4A Games
https://www.metrothegame.com/
設定方法はこちらに準ずる。今回はUltraプリセットを利用した。ところでMetro ExodusはRay Tracing及びDLSSにも対応している(Photo16)。そこで今回はRay Tracing/DLSSなしと、両方ありの2パターンでデータを取った。実線が両方なし、破線が両方ありとなる。
ということでまずはOverall。平均フレームレート(グラフ38)を見ると、やはりGeForce RTX 3080の性能の高さは一目瞭然であるが、Ray Tracingを有効にすると丁度一段性能が落ちて、GeForce RTX 2080Ti相当といった感じになる。もっともこれは他も同じで、GeForce RTX 2080 TiはGeForce RTX 2080 Super相当に、GeForce RTX 2080 SuperはRadeon RX 5700XT相当になる感じだ。この傾向は最大/最小フレームレート(グラフ39・40)にも反映されている。
それはそれとして、フレームレート変動を見てみると、ちょっと面白い。もともとMetro Exodusの場合、80〜95秒あたりが一番GPU負荷が高いところで、例えば2K(グラフ41)であってもRadeon RX 5700XTとかGeForce RTX 2080 Superだと60fpsを切っているのだが、GeFore RTX 3080は70fps弱、Ray Tracing Onでも60fps強を確保しており、明確にここで性能差が見て取れる。逆に40秒前後のピークを見ると、GeForce RTX 2080 TiとGeForce RTX 3080のグラフがほぼ重なっており、ちょっとCPUがネックというか、GPU性能を使い切れていない感じだ。これが負荷が増える2.5K(グラフ42)〜4K(グラフ44)になると、もうグラフが完全に分離しており、実際4KあたりになるともうGeForce RTX 3080が唯一Playableという感じの結果になっている。
もう一つ面白いのは、2K〜3KあたりだとRay Tracing On/Offで結構明確にグラフが異なっているのに、4Kに関してはかなり重なっている事だ。変な話だが、この程度の性能差ならRay Tracing Onにしても良いと思える。ちょっと不思議ではあるが、そうした傾向が読み取れる結果となった。
○◆Red Dead Redemption 2(グラフ45〜51)
Red Dead Redemption 2
Rockstar Games
https://www.rockstargames.com/jp/games/info/reddeadredemption2
設定方法はこちらに準ずる。Quality Preset LevelはLevel 14の"Favor Quality"とした。こちらもフレームレート変動をOCATで取得している。
平均フレームレート(グラフ45)はまぁ妥当というか順当な結果であるし、最大フレームレート(グラフ46)も同じくである。最小フレームレート(グラフ47)があてにならないのは、やはりフレームレートが暴れているためである。
ということでフレームレート変動(グラフ48〜51)を見てみると、Horizon Zero Dawnほどではないにせよ、こちらも細かくフレームレート変動が発生しているのが判る。最小フレームレートがあてにならないのは、この細かなフレームレート変動のためである。それはそれとしてフレームレートを見てみると、2.5Kあたりまでは一応4製品とも60fpsをクリア(Radeon RX 5700XTはちょっと怪しいが)しているが、3KになるとそのRadeon RX 5700XTとGeForce RTX 2080 Superが脱落。4KになるとGeForce RTX 2080 Tiも脱落で、GeForce RTX 3080が4Kでもプレイ可能な唯一のカードになっているのは流石というべきだろう。
○◆Shadow of the Tomb Raider(グラフ52〜58)
Shadow of the Tomb Raider
SQUARE ENIX
https://tombraider.square-enix-games.com/en-us
設定方法はこちらに準じる。QualityはHighestとした。ちなみにShadow of the Tomb Raiderも、当初からRay Tracing対応としてアピールされていたゲームであり(DLSSには未対応)、なのでこちらもRay Racing On/Offの両方でデータを取っている。
さてまず平均フレームレート(グラフ52)や最大フレームレート(グラフ53)を見ると、先のMetro ExodusよりもRay Tracing Onにした場合のフレームレートの落ち方が激しい。GeForce RTX 2080 TiがRadeon RX 5700XT相当まで性能が落ちる訳で、このあたりはプログラム側の実装次第なのだろうとは思うが、なかなかインパクトがある。それでもGeForce RTX 3080だと4Kでも平均で53.5fpsを確保しているのは流石ではある。4K Playableか? と言われると厳しい所で、Ray Tracingを併用するなら3Kまで、という感じだろうか? 最小フレームレート(グラフ54)もRay TracingをOnにすると露骨に落ちるあたり、本当に負荷が高くなっているようだ。
実際にフレームレート変動(グラフ55〜58)を見てみると、非常に面白い。Ray Tracing Onにした場合、40〜60秒あたりで強烈にフレームレートが下がるからだ。シーン的に言えば酒場のあたりで、確かにRay Tracing映えはするものの、負荷も強烈なところである。0〜40秒もやはり負荷は多いが、40秒以降に比べるとまだマシ、という感じである。ここで3K(グラフ57)だと、この40秒前後のフレームレートがGeForce RTX 3080だとRay Tracing Onでもなんとか60fps弱が維持できており、ところが4K(グラフ58)だとここが40fpsあたりまで下落している。GeForce RTX 3080をもってしても、Ray Tracing Onではやはり4K Playableとは言えない、という結論になるだろう。とはいえ、2000シリーズからの性能の伸びは素晴らしいし、Ray Tracing Offだと4Kで80fps近くを確保できているから全く問題は無いのだが。
○◆Tom Clancy's The Division 2(グラフ59〜65)
Tom Clancy's The Division 2
Ubisoft
https://www.ubisoft.co.jp/division2/
設定方法はこちらの"Tom Clancy's The Division 2"に準ずる。QualityはUltraとした。
平均/最大/最小フレームレート(グラフ59〜61)を見ると、GeForce RTX 3080はGeForce RTX 2080 Superの倍とは言わないまでも5割増し以上のフレームレートを実現出来ており、もう素直に性能が出ている格好だ。フレームレート変動(グラフ62〜65)を見ると、細かく変動はあるにはあるが、最小フレームレートに大きな影響を与えるほどのものではなく、それもあって綺麗にグラフが分離している。特に4K(グラフ65)では、GeForce RTX 3080はほぼ70fpsを維持しており、立派に4K Playableとしていいだろう(GeForce RTX 2080 TiはQualityを下げれば60fpsは確保できそうだが)。
●PCMark 10 / CompuBench 2.0 / TMPGEnc Video Mastering Works 7
○◆PCMark 10 v2.1.2177(グラフ66〜71)
PCMark 10 v2.1.2177
UL Benchmarks
https://benchmarks.ul.com/pcmark10
3D性能は以上で終わりだが、一応PCの「普通の用途に使えるか」の確認のためにPCMark 10も実施してみた。もうOverall(グラフ66)の時点で明白だが、Gamingを除くとどれも大差ないという感じ(強いて言えばOpenCL周りの性能が低い関係でRadeon RX 5700XTがやや不利)程度で、あとは大差ない。このOpenCL周りというのは、グラフ69のSpreadsheetとかグラフ70のVideo Editingに関係しており、その分Radeon RX 5700XTのスコアが低めという形だ。逆に言えばGeForce RTX 3080を入れたからと言ってこのあたりが高速化される筈も無いが、まぁ普通に動く事は確認できた。
一番現実のシナリオに近いのは、Office 365を利用するApplication Test(グラフ71)で、ここではどの製品でも大差ないという、当然そうあるべき結果に終わっている。
○◆CompuBench 2.0(グラフ72〜74)
CompuBench 2.0
Kishonti Ltd.
https://compubench.com/
GPUとしての性能はここまで評価してきた通りだが、GPGPUとしての性能評価はまた別である。今までだとBasemark GPUとかLuxMarkなんかを使ってきたが、もうどちらも古すぎる。そこで今回はCompuBench 2.0を採用してみた。
起動すると(選択できる場合は)API及び利用するデバイスの選択がまずある(Photo17)。テストは4グループ、全部で13個からなる(Photo18)。ここで行いたいテストを選んで「開始」を押すとしばらくテストを行い、最後に結果を表示してて終了である(Photo19)。
ということで結果をグループ別にグラフ72〜74にまとめてみた(Computer Visionはテスト1個なので、High Quality Computer Generated Imagery and Renderingにまとめた)。Photo19を見て頂くと判るが、結果の桁がテストに応じて3桁ほど変わるので、グラフ72〜74に関しては横軸を対数軸にしている。そんな訳で、グラフの高さというよりは数字で判断していただきたい。
さて、性能の方であるが、実はスペックで比較すると、GeForce RTX 3080が色々化け物である。ちょっと抜き出すと
となる(比率はGeForce RTX 2080 Superを1.00とした場合の数字)。結果を見ると、GeForce RTX 2080 Tiは確かにGeForce RTX 2080 Superの1.2倍前後に落ち着いているが、GeForce RTX 3080はGeForce RTX 2080 Superの2倍弱、といったあたりで2.67倍にはちょっと遠い。むしろメモリ帯域(それぞれ496GB/sec、616GB/sec、760GB/sec)の比に近い。その意味では、メモリ帯域が先にボトルネックになっている感じで、フルにシェーダーの性能を生かせる状況ではない、という事だろうか。まぁそうした使い方がしたければ、HBM2を搭載したA100を使え、ということなのかもしれない。まぁとりあえずはメモリ帯域に比例する程度のGPGPU性能が得られる、という事は確認できた。
○◆TMPGEnc Video Mastering Works 7 V7.0.15.17(グラフ75)
TMPGEnc Video Mastering Works 7 V7.0.15.17
ペガシス
http://tmpgenc.pegasys-inc.com/ja/product/tvmw7.html
次はこちら。要するに内蔵するメディアエンコーダ性能の比較である。最新バージョンはV7.0.16に上がったが、今回は一つ手前のV7.0.15.17で試用した。行っているのはVP9の4K映像をHEVC(H.265)の4Kへのトランスコードで、GeForce RTXはNVENCを、Radeon RX 5700XTはAMD Media SDKをそれぞれエンコーダとして指定している。エンコードは、4ストリームの映像を同時トランスコードといういつもの方法で行ったが、もともとAMDは同時4ストリームのエンコードが可能だが、NVENCは同時2ストリームまでとなっており、これはGeForce RTX 3080でも同じであった。
結果はグラフ75に示す通りで、初めて(そして唯一)Radeon RX 5700XTが他を圧倒する結果になった訳だが、それはともかくGeForce RTX 3080のエンコード速度は意外にもGeForce RTX 2080 Super/Tiよりもやや遅かった。とはいえ大きな差ではないし、そもそもメディアエンコードが目的でGeForce RTX 3080を購入するユーザーはそう多くないと思うので、これはこれで良いのかもしれない。
●消費電力 / 考察
○◆消費電力(グラフ76〜80)
最後は消費電力比較である。今回はFireStrike Demoの他、F1 2020とMetro Exodus、Shadow of the Tomb Raiderのそれぞれの2Kでのベンチマーク中の消費電力を測定した。なおMetro ExodusとShadow of the Tomb Raiderでは、Ray Tracing(Metro Exodusでは更にDLSS)を有効にした場合と無効の場合でどの程度の差が出るか、も同時に確認してみた。
まず消費電力変動がグラフ76〜79となる。GeForce RTX 3080は、GeForce RTX 2080 Tiと比較しても100W、GeForce RTX 2080 Superとだと150W弱、消費電力が増えている事が明白である。これはF1 2020(グラフ77)とかMetro Exodus(グラフ78)、Shadow of the Tomb Raider(グラフ79)などにも共通する話である。またRay Tracing、Metro Exodusだとあんまり増えていないというか、殆ど変わらない格好だが、Shadow of the Tomb Raiderでは明確にRay Tracing有効にすると消費電力も増えている。
それぞれの稼働中の平均値を取ったのがグラフ80となる。ちなみに「解像度が大きくなると消費電力も増える」と思われるかもしれないが、実際には解像度が大きくなっても小さくなっても、GPUはどうせ100%負荷なので変わらない。加えて言えば、解像度が小さいほどフレームレートが上がる分、CPUの負荷が増える=CPUの消費電力が増える、ということでむしろトータルの消費電力は上がる傾向にある。ラフに言えば、3Dゲームを遊ぶ場合、GeForce RTX 3080のシステムだと軽く500Wを超える。勿論これはCPUにRyzen 9 3900Xを組み合わせた場合の話なので、CPUのグレードを下げればもう少し下がるかもしれないが、400W前半台まで落ちるとは思えない。この消費電力の増加が、GeForce RTX 3080の最大のネックである。
実をいうと、今回のGeForce RTX 3080のベンチは、昼間はまともに実施できなかった。猛暑が続いたこともあり、エアコンがそれなりに稼働しているのだが、筆者宅は古いアパートで、おまけに電源容量(30A)ぎりぎり、ということもあって、エアコンの負荷変動が起きるとちょっと大きめの電圧降下があるためか、システムがリブートしてしまっていた。エアコンの負荷変動が小さい(=気温の下がった)深夜にはそうしたことが一切無かったあたり、GeForce RTX 3080を安定して使うためには、あくまで個別の事情だが、部屋の電源の安定供給度は確認しておくべきだった。多分筆者宅でこれを常用しようと思ったら、1000Wクラスの安定化機能付きUPSを噛まさないと難しいだろう。
さて、グラフ75〜79はwatts up? proで測定した実効消費電力だが、watts up? proは1秒毎の積算消費電力の平均値をレポートするだけで、ピーク値はロギング出来ないので、瞬間的にどの程度まで消費電力が増えるのかは分からない。ただ昼間のシステムの落ちっぷりを見るに、相当電源に負荷が掛かる様に思う(ちなみに1000W電源を利用していてこの状況だ)。消費電力が100W以上増える事を鑑みても、電源と排熱処理はシビアに考える事になると思う。
○考察
ということでGeForce RTX 3080の性能レポートをお届けした。何というか色々と化け物である。フレームレートがGeForce RTX 2080 Super比ですら5割以上も上がるから、そのフレームレートがどうしても欲しい、というユーザーには福音となる製品であろう。
NVIDIAは8K Playableと説明しているが、確かに軽めのゲームなら8K60fpsも十分に狙えるだろう。もっとも、ゲームプレイのためにそんなモニターを入れられる場所を確保しているユーザーが、現時点でどの程度「日本に」居るのかは良くわからないが。
この凄まじい性能の代償はコストと消費電力である。とくに電源にはかなり厳しい。筆者宅の電源事情だと安定運用は冬になるまで無理だろう(*1)。また消費電力が100W以上増えていれば、当然発熱も相応に増えるはずで、バラ組運用でテストを行っている筆者の環境はともかく、ケースに入れて常用するならケース内温度はかなり上がると思われる。ケースの排熱能力を一段高めないといけないだろう。というシーンも多そうだ。導入する前に、まずはこうした環境が整えられるかをよく確認したうえで、そこで目途が立ちそうな人だけ、資金調達に走るというのが良いかと思う。
とりあえず筆者的には、この後に控えるGeForce RTX 3070に期待したい。こちらは消費電力が100W下がるからだ。
(*1) ガスストーブが併用できるので、冬は消費電力的にかなり楽になる。
NVIDIAがAmpereアーキテクチャベースの新世代GeForce GPUとして発表したGeForce RTX 30シリーズ。そのうち最初に市場投入されるのが「GeForce RTX 3080」である。先にPreviewをお届けしたが、発売日を明日に控えて、このGeForce RTX 3080の性能レビューが解禁となったので、ご紹介したいと思う。
○ボード構成、GA102 GPUのサイズは?
先のPreviewの時は分解不可(まぁOKが出ても、この複雑なカードの分解はちょっと怖いが)ということでお見せ出来なかったボードの写真だが、幸いNVIDIAから提供されているので、まずはこれから見て行きたい。ボードそのものは極めて短く切り詰められた構成になっており、後端はファンにあわせて斜めに切り取られている(Photo01)。余談だが、このボードの構成はNVIDIA A100の発表の際に併せて発表された、MellanoxのConnectX-6DXまでのせたEGA A100(Photo02)を彷彿するものがある。ところでPhoto01に戻ると、本来12個搭載できるGDDR6Xのパターンがあり、うち10個が実装されているという事から、GeForce RTX 3090も同じ基板を用いて提供されるものと想像される。それでいて一回り大きいというのはどういうことか? というのはGeForce RTX 3090を試す機会を待つことになるだろう。
ヒートシンクの構造はこんな格好(Photo03)。Previewでご紹介した写真にでている4本のヒートシンクの構造が良くわかる。
真上から基板を見たのがこちら(Photo04)。GA102チップとGDDR6X、それとVRMとコントローラの塊といった感じになっている。同様にヒートシンクも(Photo05)。ところでPhoto04から中心部を切り抜いたのがこちら(Photo06)。GDDR6Xの寸法が14mm×12mmと判っているので、ここから
GA102パッケージ:51mm×51mm
GA102ダイサイズ:23.6mm×27.2mmで641.9平方mm
と推定される。公開されているダイサイズはもう少し小さい様だが(628平方mmらしい)。
GPU-Zでは問題なく認識された(Photo07)。それはいいのだが、ちょっとBIOSを覗いてみると、Power Limitが最大で370Wという表示が(Photo08)。これを見る限り、かなりの発熱を覚悟しなければならないことが予想される。
○ベンチマークテストの環境
では実際にベンチマーク結果をご紹介したい。今回は比較対象としてGeForce RTX 2080 Superと2080 Ti、それと一応AMDのRadeon RX 5700 XTも用意してみた。テスト環境は表1の通りである。
なお、以降のグラフでは
2080 Super:GeForce RTX 2080 Super Founder Edition
2080 Ti :GeForce RTX 2080 Ti Founder Edition
3080 :GeForce RTX 3080 Founder Edition
5700XT :Radeon RX 5700XT Reference
となる。また一部のテストではRT(Ray Tracing)On/Offの両方が混在している。ここでRTを有効にしたものは
2080 Super(RT):GeForce RTX 2080 Super Founder Edition RTX On
2080 Ti(RT) :GeForce RTX 2080 Ti Founder Edition RTX On
3080(RT) :GeForce RTX 3080 Founder Edition RTX On
となっている。また解像度表記は
2K :1920×1080pixel
2.5K:2560×1440pixel
3K :3200×1800pixel
4K :3840×2160pixel
とさせていただく。
○◆3DMark v2.12.6949(グラフ1〜10)
3DMark v2.12.6949
UL Benchmarks
https://benchmarks.ul.com/3dmark
9月3日に、GeForce RTX 3000シリーズへの対応やアップデートがアナウンスされた3DMarkであるが、今回はまだ対応版は間に合っておらず、Version 2.12.6949のままである。
まずグラフ1がOverallである。Port Royalに関してはRadeon RX 5700XTは未対応なので、GeForce RTXの3製品のみである。もう結果は見ての通りで、GeForce RTX 2080 SuperとGeForce RTX 2080 Ti、GeForce RTX 3080がほぼ一定のスコア差で並ぶという結果になっている。さすがにNightRaidに関してはCPUの方がボトルネックになっている感じで殆どスコア差が無いが、あとはきっちりと性能差がでている。
これはGraphics Test(グラフ2)でも顕著であり、実際一番負荷が高そうなTimeSpy Extremeにおいても、GeForce RTX 2080 Superが30fps台、GeForce RTX 2080 Tiでも40fps前後なのが、GeForce RTX 3080ではきっちり50fps以上をマークしている。グラフ3は確認の意味であるが、Physics/CPU Testの結果はどれも殆ど差が無く、CPU負荷が特に増えているといった事もない。それもあってCombined Test(グラフ4)では、SkyDiver/FireStrikeあたりでは(CPUの方がネックになって)大差ないが、GPUがネックになりやすいFireStrike Extreme/Ultraでは再びGeForce RTX 3080が最高速になっており、実に判りやすい。
グラフ5はDLSS Testで、ここは将来のバージョンではテスト内容が変わると思われるが、今はとりあえずDLSS On/OffでPort Royalの画面描画性能がどう変わるかの確認である。性能向上比は3製品ともほぼ同じく、DLSS Onにすることで40%ほどの改善がみられるが、DLSS Offにおける地の性能がやはりGeForce RTX 3080が圧倒的に高いのがそのまま結果に繋がっている格好だ。
グラフ6はPCI Express Testである。こちらのテストの場合、Bandwidthがそのままフレームレートに直結するタイプのものであり、ここではRadeon RX 5700XTもPCIe Gen4対応ということで健闘しており、ほぼGeForce RTX 3080並み。一方GeForce RTX 2080 Super/TiはPCIe Gen3対応ということで帯域がほぼ半減という、まぁセオリー通りの結果になっている。
○◆Basemark GPU 1.2(グラフ7〜9)
Basemark GPU 1.2
Basemark
https://www.basemark.com/products/basemark-gpu/
もう少しSynthesis Benchmarkを、ということで次はBasemark GPUを。今回はちょっと負荷を上げるためCustom Testを利用し
解像度:4K・フルスクリーン
Contents Quality:HIGH
Texture Compression:bc7
としたうえで、DirectX12(グラフ7)/OpenGL(グラフ8)/Vulkan(グラフ9)で測定を行い、その結果をまとめたものだ。とりあえず平均フレームレートで比較した場合、GeForce RTX 2080 Superを1とすると
となる。OpenGLはあまり力を入れてない(ここに注力するのはQuadro系のプロフェッショナルビデオカード用ドライバだけである)ためもあってか性能の伸びがいまいちだが、DirectX12/Vulkanでは50%以上のフレームレート向上が確認できた。
○◆SuperPosition v1.1(グラフ10〜16)
SuperPosition v1.1
Unigine
https://benchmark.unigine.com/superposition
もう一つSynthesisを、ということでこちら。今回は
Shaders Quality:High
Texture Quality:High
Depth of Field:On
Motion Blue:On
という環境で解像度を変化させながら測定すると同時に、OCAT V1.6を使ってフレームレート変動も取得してみた。
まずグラフ10〜12がそれぞれ平均/最大/最小フレームレートとなる。もう見ての通りで明確に性能差があり、GeForce RTX 3080の性能の高さが伺えるが、ちょっと面白かったのがフレームレート変動。2K(グラフ13)で75〜110秒あたり、GeForce RTX 3080とGeForce RTX 2080 Tiのグラフがきっちり重なっているのは、多分ここがCPUのボトルネックになっているものと思われる。逆に言えば、ここで更に性能が上がれば(例えばZen 3とか?)、もう少し2Kにおける平均フレームレートが引きあがると思われる。2K〜4Kまで通して、GeForce RTX 3080のフレームレートは、概ねGeForce RTX 2080 Superの5割増しといったところである。4Kの結果(グラフ16)で見ると、ちょっとだけQualityを下げれば十分4Kでの利用が可能な性能、と言えるだろう。
●ゲームその1:Borderlands 3 / F1 2020 / Horizon Zero Dawn
○◆Borderlands 3(グラフ17〜23)
Borderlands 3
2K Games
https://borderlands.com/ja-JP/
ここからはGame Benchmarkを。まずはBorderland 3。設定方法はこちらのBorderland 3の項目に準ずる。全体的な品質は「高」である。
まず平均フレームレート(グラフ17)で見ると、特に4Kでは2倍まではいかないものの、かなりそれに近い性能差が明確にあり、特に高解像度におけるGeForce RTX 3080の性能改善は顕著と言える。加えて言えば、GeForce RTX 2080 Tiとの性能差もかなり大きい。4Kにおける最小フレームレート(グラフ19)も53fpsとかなりのもので、4Kでも十分プレイできそうに思える。
実際フレームレート変動(グラフ20〜23)を見る限り、2Kとか2.5KではややOverkill気味。3Kでもゆとりたっぷりで、4Kでも割と現実的である。GeForce RTX 2080 Tiでも4Kはちょっと厳しい感じで、そういう意味でも差は小さくない。
○◆F1 2020(グラフ24〜30)
F1 2020
Codemasters
http://www.codemasters.com/game/f1-2020/
設定方法はこちらのF1 2020の項目に準じる。ちなみに設定は
Antialias:TAA(TAA Checkerboardにあらず)
Anisotropic Filter:16X
Detail Preset:UltraHigh
としている。
ちなみにこのテスト、なぜか当初GeForce RTX 3080のみベンチマークを開始するとクラッシュする、という謎の現象に悩まされた。ところが、なぜかF1 2019を追加でインストール→起動すると即座にクラッシュ→F1 2020を起動→問題なくベンチが動くようになる、という不思議な解決を見る事になった。問題がGeForce Driverの側にあるのか、F1 2020の方にあるのかは不明だが、まだ正式出荷前ということでこのあたりが不十分なのは良くある話で、逆にこのあたりをきちんと対応すると性能が変わってくる可能性もあるという事をご承知おき頂きたい(というか、F1 2019がクラッシュする理由が謎である)。
さて性能の方だが、Borderland 3ほどではないにせよ、平均フレームレート(グラフ24)は十分に高く、4Kですら120fpsだからもう充分すぎる。もっともGeForce RTX 2080 Superですら2Kで80fps弱、Radeon RX 5700XTで77.6fpsだから、どのカードでも4K Playableという言い方もできるが。最大/最小フレームレート(グラフ25・26)も順当な結果になっている。フレームレート変動(グラフ27〜30)を見ても、2K〜4Kまで綺麗に相似形を描きながら完全にグラフが分離しているあたり、GeForce RTX 3080の性能の高さは一目瞭然である。もっともややこれもOverkill気味な気もするが。
○◆Horizon Zero Dawn(グラフ31〜37)
Horizon Zero Dawn
SIE
https://www.jp.playstation.com/games/horizon-zero-dawn/
PS4向けタイトルのPCへの移植ということで色々話題のHorizon Zero Dawn。上のリンクからはPS4版しかアクセスできないが、PC版はSteamから入手できる。さて、入手は出来るのだが、色々とバグが多い事でも有名なこのタイトル、実際筆者もちょっと苦戦した。
ベンチマーク手順だが
オープニング画面からSETTINGを選択(Photo09)。
画面設定で解像度を設定。V-Syncはオフにする(Photo10)。
プリセットを選択して、確定後に"ベンチマークを実行する"を選ぶ(Photo11)。
ベンチが終わると、こんな風に結果が表示される(Photo12)。
という具合だ。あとはこれを繰り返すだけである。
ちなみにTipsとして
ベンチマーク結果は一切保存されない。筆者は諦めて画面キャプチャを取った(Photo13)。
最初のムービーはAlt+F4で中断し、すると「ゲームを終了しますか?」と聞いてくるので「いいえ」を選ぶとPhoto09の画面に飛ぶ。ただしここで注意であるが、一瞬でもいいからオープニングムービーを再生すること。ムービー再生前にショートカットしてしまうと、なぜかベンチマークがまともに動かない。
ゲームを立ち上げて1回目のベンチマークはまともに動かない。画面を見て頂くと判る(Photo14)が、まともに描画されていないし、フレームレートも煩雑に落ちる。これはスルーして2回目以降のデータを取る様にする。
時々、V-Sync Offにも関わらず、まるでV-Sync Onになってるような結果が出る事がある(Photo15)。こうなったらゲームを立ち上げなおさないと直らない。
といった事柄が挙げられる。今回はPatch 1.04を適用した状態で実施したが、今後Patchが上がるとまた挙動が変わるかもしれない。今回はベンチに使えるかという検証も兼ねて実施したのだが、今後はやらないかもしれない。ちなみにフレームレート変動はOCATで取得している。
ということで、まずはベンチマーク結果画面を集計したのがこちら(グラフ31〜33)。平均フレームレート(グラフ31)と最大フレームレート(グラフ32)を見ると、もうCPUがボトルネックというか、GPU性能的にはちょっとサチってる感じもある。最高画質にした方が良かったかも、というのはこの結果を受けての事だ。まぁ2Kはともかく4Kあたりになると性能差は明確で、やはりGeForce RTX 3080強しという傾向に違いはない。
ところで最小フレームレート(グラフ33)を見ると何が何だか、という感じになっている訳だが、これはフレームレート変動(グラフ34〜37)を見ると判りやすい。もうとにかく変動が非常に多いのだ。このグラフは0.5秒単位で集計しているから、ピークは多少なまっているが、実際のフレームレートで言えば本当に1〜2fpsまで落ちる事が珍しくない(実際何回かやったところ、最小フレームレートが0fps、という凄まじい結果が出た事すらあった)。もうこれは完全にゲームの出来栄えの問題であって、今後の改善が期待される部分ではあるのだが、逆に言うとこうした完成度(というか、この場合はPCへの移植度というか)が低いゲームであっても、GPUパワーで無理やり乗り切るという技は有効であり、その意味では変動こそ多いもののGeForce RTX 3080が一番快適なのは間違いない。
●ゲームその2:Metro Exodus / RDR2 / Tomb Raider / Division 2
○◆Metro Exodus(グラフ38〜44)
Metro Exodus
4A Games
https://www.metrothegame.com/
設定方法はこちらに準ずる。今回はUltraプリセットを利用した。ところでMetro ExodusはRay Tracing及びDLSSにも対応している(Photo16)。そこで今回はRay Tracing/DLSSなしと、両方ありの2パターンでデータを取った。実線が両方なし、破線が両方ありとなる。
ということでまずはOverall。平均フレームレート(グラフ38)を見ると、やはりGeForce RTX 3080の性能の高さは一目瞭然であるが、Ray Tracingを有効にすると丁度一段性能が落ちて、GeForce RTX 2080Ti相当といった感じになる。もっともこれは他も同じで、GeForce RTX 2080 TiはGeForce RTX 2080 Super相当に、GeForce RTX 2080 SuperはRadeon RX 5700XT相当になる感じだ。この傾向は最大/最小フレームレート(グラフ39・40)にも反映されている。
それはそれとして、フレームレート変動を見てみると、ちょっと面白い。もともとMetro Exodusの場合、80〜95秒あたりが一番GPU負荷が高いところで、例えば2K(グラフ41)であってもRadeon RX 5700XTとかGeForce RTX 2080 Superだと60fpsを切っているのだが、GeFore RTX 3080は70fps弱、Ray Tracing Onでも60fps強を確保しており、明確にここで性能差が見て取れる。逆に40秒前後のピークを見ると、GeForce RTX 2080 TiとGeForce RTX 3080のグラフがほぼ重なっており、ちょっとCPUがネックというか、GPU性能を使い切れていない感じだ。これが負荷が増える2.5K(グラフ42)〜4K(グラフ44)になると、もうグラフが完全に分離しており、実際4KあたりになるともうGeForce RTX 3080が唯一Playableという感じの結果になっている。
もう一つ面白いのは、2K〜3KあたりだとRay Tracing On/Offで結構明確にグラフが異なっているのに、4Kに関してはかなり重なっている事だ。変な話だが、この程度の性能差ならRay Tracing Onにしても良いと思える。ちょっと不思議ではあるが、そうした傾向が読み取れる結果となった。
○◆Red Dead Redemption 2(グラフ45〜51)
Red Dead Redemption 2
Rockstar Games
https://www.rockstargames.com/jp/games/info/reddeadredemption2
設定方法はこちらに準ずる。Quality Preset LevelはLevel 14の"Favor Quality"とした。こちらもフレームレート変動をOCATで取得している。
平均フレームレート(グラフ45)はまぁ妥当というか順当な結果であるし、最大フレームレート(グラフ46)も同じくである。最小フレームレート(グラフ47)があてにならないのは、やはりフレームレートが暴れているためである。
ということでフレームレート変動(グラフ48〜51)を見てみると、Horizon Zero Dawnほどではないにせよ、こちらも細かくフレームレート変動が発生しているのが判る。最小フレームレートがあてにならないのは、この細かなフレームレート変動のためである。それはそれとしてフレームレートを見てみると、2.5Kあたりまでは一応4製品とも60fpsをクリア(Radeon RX 5700XTはちょっと怪しいが)しているが、3KになるとそのRadeon RX 5700XTとGeForce RTX 2080 Superが脱落。4KになるとGeForce RTX 2080 Tiも脱落で、GeForce RTX 3080が4Kでもプレイ可能な唯一のカードになっているのは流石というべきだろう。
○◆Shadow of the Tomb Raider(グラフ52〜58)
Shadow of the Tomb Raider
SQUARE ENIX
https://tombraider.square-enix-games.com/en-us
設定方法はこちらに準じる。QualityはHighestとした。ちなみにShadow of the Tomb Raiderも、当初からRay Tracing対応としてアピールされていたゲームであり(DLSSには未対応)、なのでこちらもRay Racing On/Offの両方でデータを取っている。
さてまず平均フレームレート(グラフ52)や最大フレームレート(グラフ53)を見ると、先のMetro ExodusよりもRay Tracing Onにした場合のフレームレートの落ち方が激しい。GeForce RTX 2080 TiがRadeon RX 5700XT相当まで性能が落ちる訳で、このあたりはプログラム側の実装次第なのだろうとは思うが、なかなかインパクトがある。それでもGeForce RTX 3080だと4Kでも平均で53.5fpsを確保しているのは流石ではある。4K Playableか? と言われると厳しい所で、Ray Tracingを併用するなら3Kまで、という感じだろうか? 最小フレームレート(グラフ54)もRay TracingをOnにすると露骨に落ちるあたり、本当に負荷が高くなっているようだ。
実際にフレームレート変動(グラフ55〜58)を見てみると、非常に面白い。Ray Tracing Onにした場合、40〜60秒あたりで強烈にフレームレートが下がるからだ。シーン的に言えば酒場のあたりで、確かにRay Tracing映えはするものの、負荷も強烈なところである。0〜40秒もやはり負荷は多いが、40秒以降に比べるとまだマシ、という感じである。ここで3K(グラフ57)だと、この40秒前後のフレームレートがGeForce RTX 3080だとRay Tracing Onでもなんとか60fps弱が維持できており、ところが4K(グラフ58)だとここが40fpsあたりまで下落している。GeForce RTX 3080をもってしても、Ray Tracing Onではやはり4K Playableとは言えない、という結論になるだろう。とはいえ、2000シリーズからの性能の伸びは素晴らしいし、Ray Tracing Offだと4Kで80fps近くを確保できているから全く問題は無いのだが。
○◆Tom Clancy's The Division 2(グラフ59〜65)
Tom Clancy's The Division 2
Ubisoft
https://www.ubisoft.co.jp/division2/
設定方法はこちらの"Tom Clancy's The Division 2"に準ずる。QualityはUltraとした。
平均/最大/最小フレームレート(グラフ59〜61)を見ると、GeForce RTX 3080はGeForce RTX 2080 Superの倍とは言わないまでも5割増し以上のフレームレートを実現出来ており、もう素直に性能が出ている格好だ。フレームレート変動(グラフ62〜65)を見ると、細かく変動はあるにはあるが、最小フレームレートに大きな影響を与えるほどのものではなく、それもあって綺麗にグラフが分離している。特に4K(グラフ65)では、GeForce RTX 3080はほぼ70fpsを維持しており、立派に4K Playableとしていいだろう(GeForce RTX 2080 TiはQualityを下げれば60fpsは確保できそうだが)。
●PCMark 10 / CompuBench 2.0 / TMPGEnc Video Mastering Works 7
○◆PCMark 10 v2.1.2177(グラフ66〜71)
PCMark 10 v2.1.2177
UL Benchmarks
https://benchmarks.ul.com/pcmark10
3D性能は以上で終わりだが、一応PCの「普通の用途に使えるか」の確認のためにPCMark 10も実施してみた。もうOverall(グラフ66)の時点で明白だが、Gamingを除くとどれも大差ないという感じ(強いて言えばOpenCL周りの性能が低い関係でRadeon RX 5700XTがやや不利)程度で、あとは大差ない。このOpenCL周りというのは、グラフ69のSpreadsheetとかグラフ70のVideo Editingに関係しており、その分Radeon RX 5700XTのスコアが低めという形だ。逆に言えばGeForce RTX 3080を入れたからと言ってこのあたりが高速化される筈も無いが、まぁ普通に動く事は確認できた。
一番現実のシナリオに近いのは、Office 365を利用するApplication Test(グラフ71)で、ここではどの製品でも大差ないという、当然そうあるべき結果に終わっている。
○◆CompuBench 2.0(グラフ72〜74)
CompuBench 2.0
Kishonti Ltd.
https://compubench.com/
GPUとしての性能はここまで評価してきた通りだが、GPGPUとしての性能評価はまた別である。今までだとBasemark GPUとかLuxMarkなんかを使ってきたが、もうどちらも古すぎる。そこで今回はCompuBench 2.0を採用してみた。
起動すると(選択できる場合は)API及び利用するデバイスの選択がまずある(Photo17)。テストは4グループ、全部で13個からなる(Photo18)。ここで行いたいテストを選んで「開始」を押すとしばらくテストを行い、最後に結果を表示してて終了である(Photo19)。
ということで結果をグループ別にグラフ72〜74にまとめてみた(Computer Visionはテスト1個なので、High Quality Computer Generated Imagery and Renderingにまとめた)。Photo19を見て頂くと判るが、結果の桁がテストに応じて3桁ほど変わるので、グラフ72〜74に関しては横軸を対数軸にしている。そんな訳で、グラフの高さというよりは数字で判断していただきたい。
さて、性能の方であるが、実はスペックで比較すると、GeForce RTX 3080が色々化け物である。ちょっと抜き出すと
となる(比率はGeForce RTX 2080 Superを1.00とした場合の数字)。結果を見ると、GeForce RTX 2080 Tiは確かにGeForce RTX 2080 Superの1.2倍前後に落ち着いているが、GeForce RTX 3080はGeForce RTX 2080 Superの2倍弱、といったあたりで2.67倍にはちょっと遠い。むしろメモリ帯域(それぞれ496GB/sec、616GB/sec、760GB/sec)の比に近い。その意味では、メモリ帯域が先にボトルネックになっている感じで、フルにシェーダーの性能を生かせる状況ではない、という事だろうか。まぁそうした使い方がしたければ、HBM2を搭載したA100を使え、ということなのかもしれない。まぁとりあえずはメモリ帯域に比例する程度のGPGPU性能が得られる、という事は確認できた。
○◆TMPGEnc Video Mastering Works 7 V7.0.15.17(グラフ75)
TMPGEnc Video Mastering Works 7 V7.0.15.17
ペガシス
http://tmpgenc.pegasys-inc.com/ja/product/tvmw7.html
次はこちら。要するに内蔵するメディアエンコーダ性能の比較である。最新バージョンはV7.0.16に上がったが、今回は一つ手前のV7.0.15.17で試用した。行っているのはVP9の4K映像をHEVC(H.265)の4Kへのトランスコードで、GeForce RTXはNVENCを、Radeon RX 5700XTはAMD Media SDKをそれぞれエンコーダとして指定している。エンコードは、4ストリームの映像を同時トランスコードといういつもの方法で行ったが、もともとAMDは同時4ストリームのエンコードが可能だが、NVENCは同時2ストリームまでとなっており、これはGeForce RTX 3080でも同じであった。
結果はグラフ75に示す通りで、初めて(そして唯一)Radeon RX 5700XTが他を圧倒する結果になった訳だが、それはともかくGeForce RTX 3080のエンコード速度は意外にもGeForce RTX 2080 Super/Tiよりもやや遅かった。とはいえ大きな差ではないし、そもそもメディアエンコードが目的でGeForce RTX 3080を購入するユーザーはそう多くないと思うので、これはこれで良いのかもしれない。
●消費電力 / 考察
○◆消費電力(グラフ76〜80)
最後は消費電力比較である。今回はFireStrike Demoの他、F1 2020とMetro Exodus、Shadow of the Tomb Raiderのそれぞれの2Kでのベンチマーク中の消費電力を測定した。なおMetro ExodusとShadow of the Tomb Raiderでは、Ray Tracing(Metro Exodusでは更にDLSS)を有効にした場合と無効の場合でどの程度の差が出るか、も同時に確認してみた。
まず消費電力変動がグラフ76〜79となる。GeForce RTX 3080は、GeForce RTX 2080 Tiと比較しても100W、GeForce RTX 2080 Superとだと150W弱、消費電力が増えている事が明白である。これはF1 2020(グラフ77)とかMetro Exodus(グラフ78)、Shadow of the Tomb Raider(グラフ79)などにも共通する話である。またRay Tracing、Metro Exodusだとあんまり増えていないというか、殆ど変わらない格好だが、Shadow of the Tomb Raiderでは明確にRay Tracing有効にすると消費電力も増えている。
それぞれの稼働中の平均値を取ったのがグラフ80となる。ちなみに「解像度が大きくなると消費電力も増える」と思われるかもしれないが、実際には解像度が大きくなっても小さくなっても、GPUはどうせ100%負荷なので変わらない。加えて言えば、解像度が小さいほどフレームレートが上がる分、CPUの負荷が増える=CPUの消費電力が増える、ということでむしろトータルの消費電力は上がる傾向にある。ラフに言えば、3Dゲームを遊ぶ場合、GeForce RTX 3080のシステムだと軽く500Wを超える。勿論これはCPUにRyzen 9 3900Xを組み合わせた場合の話なので、CPUのグレードを下げればもう少し下がるかもしれないが、400W前半台まで落ちるとは思えない。この消費電力の増加が、GeForce RTX 3080の最大のネックである。
実をいうと、今回のGeForce RTX 3080のベンチは、昼間はまともに実施できなかった。猛暑が続いたこともあり、エアコンがそれなりに稼働しているのだが、筆者宅は古いアパートで、おまけに電源容量(30A)ぎりぎり、ということもあって、エアコンの負荷変動が起きるとちょっと大きめの電圧降下があるためか、システムがリブートしてしまっていた。エアコンの負荷変動が小さい(=気温の下がった)深夜にはそうしたことが一切無かったあたり、GeForce RTX 3080を安定して使うためには、あくまで個別の事情だが、部屋の電源の安定供給度は確認しておくべきだった。多分筆者宅でこれを常用しようと思ったら、1000Wクラスの安定化機能付きUPSを噛まさないと難しいだろう。
さて、グラフ75〜79はwatts up? proで測定した実効消費電力だが、watts up? proは1秒毎の積算消費電力の平均値をレポートするだけで、ピーク値はロギング出来ないので、瞬間的にどの程度まで消費電力が増えるのかは分からない。ただ昼間のシステムの落ちっぷりを見るに、相当電源に負荷が掛かる様に思う(ちなみに1000W電源を利用していてこの状況だ)。消費電力が100W以上増える事を鑑みても、電源と排熱処理はシビアに考える事になると思う。
○考察
ということでGeForce RTX 3080の性能レポートをお届けした。何というか色々と化け物である。フレームレートがGeForce RTX 2080 Super比ですら5割以上も上がるから、そのフレームレートがどうしても欲しい、というユーザーには福音となる製品であろう。
NVIDIAは8K Playableと説明しているが、確かに軽めのゲームなら8K60fpsも十分に狙えるだろう。もっとも、ゲームプレイのためにそんなモニターを入れられる場所を確保しているユーザーが、現時点でどの程度「日本に」居るのかは良くわからないが。
この凄まじい性能の代償はコストと消費電力である。とくに電源にはかなり厳しい。筆者宅の電源事情だと安定運用は冬になるまで無理だろう(*1)。また消費電力が100W以上増えていれば、当然発熱も相応に増えるはずで、バラ組運用でテストを行っている筆者の環境はともかく、ケースに入れて常用するならケース内温度はかなり上がると思われる。ケースの排熱能力を一段高めないといけないだろう。というシーンも多そうだ。導入する前に、まずはこうした環境が整えられるかをよく確認したうえで、そこで目途が立ちそうな人だけ、資金調達に走るというのが良いかと思う。
とりあえず筆者的には、この後に控えるGeForce RTX 3070に期待したい。こちらは消費電力が100W下がるからだ。
(*1) ガスストーブが併用できるので、冬は消費電力的にかなり楽になる。