2024年1月9日、CES 2024で発表されたNVIDIAの最新GPU「GeForce RTX 40 SUPER」シリーズ。1月23日の23時にその中の1つ、「GeForce RTX 4070 Ti SUPER」のパフォーマンス情報が解禁となった。

今回は、Palit製の「GeForce RTX 4070 Ti SUPER JetStream OC」を試用する機会を得たので、さっそくレビューをお届けしたい。RTX 4080 / 4070 Ti / 4070 SUPER / RTX 4070と比較し、ゲーム時のパフォーマンスや消費電力、AI性能の違いをチェックしていく。

NVIDIAから貸与された評価機材はPalitの「GeForce RTX 4070 Ti SUPER JetStream OC」。GeForce RTX 4070 Ti SUPERのメーカー想定価格は127,380円からとなる

「GeForce RTX 40 SUPER」シリーズは、RTX 4080 SUPER / RTX 4070 Ti SUPER / RTX 4070 SUPERが発表されている。1月17日にはRTX 4070 SUPERの発売が開始。今回レビューするRTX 4070 Ti SUPERは1月24日に発売がスタートする。そしてRTX 4080 SUPERは1月31日発売を予定しており、3週連続のリリースとなる。

RTX 4070 Ti SUPERは、既に展開されているRTX 4070 Tiの強化版という位置付けだ。カード電力が285WとRTX 4070 Tiから据え置きながら、CUDAコア数は7,680基から8,448基に、ビデオメモリの容量はGDDR6Xが12GBから16GBにそれぞれ増加している点が大きなトピック。メモリバス幅も192bitから256bitになっており、スペック上は上位のRTX 4080にかなり近づいたと言える。そのほか、主な仕様は下の表にまとめた。

table {

border-collapse: collapse;

}

th {

border: solid 1px #666666;

color: #000000;

background-color: #ff9999;

}

td {

border: solid 1px #666666;

color: #000000;

background-color: #ffffff;

}

なお、ワットパフォーマンスに影響しやすい2次キャッシュ容量は48MBとRTX 4070 Tiと同じ。RTX 4080は64MB搭載しているので、この点は異なる。NVENCに関してはRTX 4070 TiやRTX 4080と同様に第8世代のものを2基搭載しており、同時使用してのデュアルエンコードが可能。もちろん、ほかのRTX 40シリーズと同様にAV1のハードウェアエンコードにも対応しており、動画編集や配信用としても有用だ。

RTX 4070 Ti SUPERの価格については、NVIDIAの参考価格は127,380円から。RTX 4070 SUPERは初出時86,800円からと発表されていたが、これは発売後に税別価格だったことが判明。そのため、実際には税込み95,480円からとなっている。そしてRTX 4070 Ti SUPERにおける大半の製品は、RTX 4070 TiとRTX 4080の間の価格となる15万円前後に設定されるのではと筆者は見ている。

そのほか、Ada Lovelaceアーキテクチャの採用など基本的な特徴はこれまでのRTX 40シリーズと同じだ。特徴についてはRTX 4090のレビュー『「GeForce RTX 4090」の恐るべき性能をテストする - 4K+レイトレで高fpsも余裕のモンスターGPU』で確認してほしい。

性能テスト前に、評価機材のGeForce RTX 4070 Ti SUPER JetStream OCを紹介しておこう。カード電力は285Wと定格だが、ブーストクロックは2,610MHzから2,640MHzに向上させたファクトリーOCモデルとなっている。カード長は328.9mmで、3.1スロット厚というかなりの大型カードだ。導入を考えるなら、PCケース側が対応しているか確認しておいたほうがよいだろう。

GPU-Zによる情報。ブーストクロックは2,640MHzと定格の2,610MHzから若干OCされている

カード電力は定格の285Wに設定されていた

3連ファンは空気を引き込む力と静音性を両立する独自の「GALE HUNTER FAN」を採用

背面側にはバックプレートを搭載。後部は空気を逃がすため大胆にカットされている

3.1スロット厚。取り付けには実質4スロット分のスペースが必要になる

映像出力はDisplayPort 1.4a×3、HDMI 2.1a×1という構成

カードの中央付近に補助電源用の12VHPWRコネクタ搭載。4ピンが短いので改良版の12V-2x6コネクタとみられる

12VHPWRを従来の8ピン×2基に変換するケーブルも付属する

RTX 4070 Tiより10%以上のスコア上昇が見られる確かな性能向上

さて、性能チェックに移ろう。テスト環境は以下の通りだ。Resizable BARは有効にした状態でテストしている。比較対象としてGeForce RTX 4080、GeForce RTX 4070 Ti、GeForce RTX 4070 SUPER、GeForce RTX 4070。CPUのパワーリミットは無制限に設定。ドライバに関しては、RTX 4080/RTX 4070 Ti SUPERが「Game Ready 551.15」、RTX 4070 SUPERが「Game Ready 546.52」、それ以外は「Game Ready 546.33」を使用している。

CPU:Intel Core i9-13900K(24コア32スレッド)

マザーボード:MSI MPG Z790 CARBON WIFI(Intel Z690)

メモリ:Micron Crucial DDR5 Pro CP2K16G56C46U5(PC5-44800 DDR5 SDRAM 16GB×2)

システムSSD:Western Digital WD_BLACK SN850 NVMe WDS200T1X0E-00AFY0(PCI Express 4.0 x4、2TB)

CPUクーラー:Corsair iCUE H150i RGB PRO XT(簡易水冷、36cmクラス)

電源:Super Flower LEADEX V G130X 1000W(1,000W、80PLUS Gold)

OS:Windows 11 Pro(22H2)

今回はビデオカードの消費電力を実測できるNVIDIAの専用キット「PCAT」を使用し、ゲーム系のベンチマークではカード単体の消費電力も合わせて掲載する。

ビデオカード単体の消費電力を正確に測定できるNVIDIA「PCAT」。この基板のほか、PCI Express x16スロットに装着するライザーカードと組み合わせて使用する

まずは、3D性能を測定する定番ベンチマークの「3DMark」から見ていこう。

『3DMark』性能

RTX 4070 Tiから4〜10%程度の性能向上が確認できた。一方で、RTX 4080のほうがさらに15〜20%上回っており、3DMarkを見る限りではRTX 4070 Ti寄りの性能と言える。

次は、実際のゲームを試そう。まずは、軽めのFPSとして「レインボーシックス シージ」と「Apex Legends」を実行する。アップスケーラーは使用せず“素”の性能をチェックしてみたい。レインボーシックス シージはゲーム内のベンチマーク機能を実行、Apex Legendsはトレーニングモードの一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。

『レインボーシックス シージ』性能

『レインボーシックス シージ』実行時の電力消費

レインボーシックス シージのフルHDは、GPUに負荷がかかりきらないので参考程度に見て欲しい。RTX 4070 Tiに対してWQHDで約8%、4Kで約10%のフレームレート向上を確認できた。消費電力を見ると、4Kで277.2Wとカード電力の285Wに迫っている。GPUの性能を十分引き出せている証拠と言えるが、カード電力にもう少し余裕があれば、さらにフレームレートが伸びたのではと思わせる部分でもある。

『Apex Legends』性能

『Apex Legends』実行時の電力消費

Apex Legendsはフレームレート制限を解除するコマンドを使っても最大300fpsまでしか出ない。そのため、フルHDだとRTX 4070以外はほぼ上限に到達。RTX 4070 Ti SUPERとRTX 4080はWQHDでもほぼ上限に達している。このゲームに関しては、RTX 4070でも4Kで平均160.5fpsと高いフレームレートが出ており、これ以上のGPUはオーバースペックといってもよいだろう。

続いて、アップスケーラーのないタイトルとして「ストリートファイター6」と「ARMORED CORE VI FIRES OF RUBICON」を試したい。ストリートファイター6はCPU同士の対戦を実行した際のフレームレート、ARMORED CORE VI FIRES OF RUBICONはミッション「武装採掘艦破壊」で一定コースを移動した際のフレームレートをそれぞれ「FrameView」で測定している。

ExcelのSF6参照『ストリートファイター6』性能

ExcelのSF6電力参照『ストリートファイター6』実行時の電力消費

ストリートファイター6は120fpsまで設定できるが対戦時は60fpsまでになる。今回使用したGPUならば、最高画質設定でも4Kまで快適にプレイが可能だ。最大フレームレートが低ければ、消費電力もそれに合わせてかなり下がるのがポイントと言える。

『ARMORED CORE VI FIRES OF RUBICON』性能

『ARMORED CORE VI FIRES OF RUBICON』実行時の電力消費

ARMORED CORE VI FIRES OF RUBICONは、最大120fpsだ。RTX 4070 Ti / RTX 4070 Ti SUPER/RTX 4080はWQHDまでほぼ上限に到達。4Kで見るとRTX 4070 Ti SUPERは、RTX 4070 Tiより約12%フレームレートが上回っている。高負荷な状況ほど性能差が出やすい傾向だ。ただ、カード電力は同じでも、4K時はRTX 4070 Ti SUPERのほうが消費電力は大きくなりやすい。

DLSS 3対応ゲームでテスト! フルレイトレーシングを4Kで楽しめる

次は、DLSS 3(アップスケール&フレーム生成)に対応したゲームでフレームレートを測定していく。DLSS 3はRTX 40シリーズだけで利用できる描画負荷軽減技術だけに、重量級ゲームがどこまで快適にプレイできるのか注目したい。

まずは、人気レースゲームの「Forza Horizon 5」を実行する。どちらも画質はプリセットの最上位を設定し、DLSSはパフォーマンスとし、フレーム生成を有効化している。ゲーム内蔵のベンチマーク機能を実行した際のフレームレートを「FrameView」で測定している。

『Forza Horizon 5』性能

『Forza Horizon 5』実行時の電力消費

RTX 4070 Tiから約2〜5%のフレームレート向上を確認できる。4Kで平均146.9fpsと4K/144Hzのゲーミングモニターの性能を活かしきれるフレームレートが出ている点に注目したい。消費電力を見ると、RTX 4070 Tiに対して、向上したフレームレートの分だけキッチリ大きくなっている印象だ。

次は、重量級タイトルとして「Starfield」と「サイバーパンク2077」を試そう。同じく画質のプリセットは最上位にし、DLSSはパフォーマンス、フレーム生成を有効化した。サイバーパンク2077については、レイトレーシングの画質を向上させるDLSS 3.5の機能「Ray Reconstruction」も有効化した。Starfieldはジェミソンのロッジ周辺の一定コースを移動した際のフレームレート、サイバーパンク2077はゲーム内のベンチマーク機能を実行した際のフレームレートをそれぞれ「FrameView」で測定している。

『Starfield』性能

『Starfield』実行時の電力消費

『サイバーパンク2077』性能

『サイバーパンク2077』実行時の電力消費

Starfieldは165fps近辺で頭打ちになるようだ。描画負荷が重いと言われてきたゲームだが、DLSS 3に対応したことでRTX 40シリーズではかなり快適にプレイが可能となった。4Kでもかなり高いフレームレートが出ている。RTX 4070 Ti SUPERはRTX 4070 Tiに対して、4Kでは約6%フレームレートが上回った。

サイバーパンク2077は、すべての光をシミュレートする“フルレイトレーシング”とも呼ばれる「レイトレーシング:オーバードライブ」に設定している。これが生み出す光源処理は非常に美しく、一見の価値ありだ。RTX 4070 Ti SUPERなら、4Kでも平均71.9fpsと快適にプレイが可能だ。

CGレンダリングやStable Diffusionでも性能比較

ここからはCGレンダリングやAI処理を試していく。まずは、3DCGアプリの「Blender」を使ってGPUによるレンダリング性能を測定する「Blender Open Data Benchmark」を実行する。

『Blender Open Data Benchmark』性能

一定時間内にどれほどレンダリングできるのかをスコアとして出すベンチマークだ。RTX 4070 Tiに対して約10〜15%スコアを伸ばしており、確かな性能向上を確認できた。ただ、RTX 4080のほうがさらに約17〜20%スコアが上回っており、上位モデルとの差を感じる部分でもある。

次は「Procyon AI Inference Benchmark for Windows」を実行する。MobileNet V3、Inception V4、YOLO V3、DeepLab V3、Real-ESRGAN、ResNet 50と複数の推論エンジンを使ってAIの総合的なパフォーマンスを測定するベンチマークだ。Windows MLとNVIDIA TensorRTでテストした。

『Procyon AI Inference Benchmark for Windows』性能

RTX 4070 Tiとは誤差レベルのスコア差となった。AI処理といっても、CUDAコアやビデオメモリの増加が必ず効くわけではないようだ。

続いて、画像生成AIとしてStable Diffusionを実行してみたい。AUTOMATIC 1111版Stable Diffusion web UIにTensorRT拡張を導入し、Stable Diffusion XLで1,024×1,024ドット、Stable Diffusion 1.5で512×512ドットの画像サイズで1分間に何枚の画像を生成できるかテストを行った。Sampling Methodは「Euler a」、Sampling Stepsは「50」、CFG Scaleは「7」、Batch Sizeは「1」、Batch Countは「10」に設定、シード値も固定している。

『Stable Diffusion XL』実行速度

性能差が順当に出たと言ってよいだろう。ビデオメモリが16GBのRTX 4070 TiとRTX 4080が劇的に高速になる、というわけでもなく、RTX 4070 Ti / RTX 4070 SUPER / RTX 4070も12GB搭載しており、TensorRT拡張で画像生成するなら12GB以上あれば問題なく動作すると言ってよいだろう。機会があれば、ビデオメモリ8GBのモデルも含めて試してみたい。

NVENCによるハードウェアエンコードの速度もチェックしよう。動画編集アプリの「DaVinci Resolve Studio 18.6」を使って、Apple ProResの4K素材を使ったプロジェクト(約2分)をH.265とAV1にNVENCを使って変換する速度を測定した。品質:80Mbps/Rate Control:固定ビットレート/Preset:速度優先の設定でエンコードを実行している。

『DaVinci Resolve Studio 18.6』実行速度

RTX 4070 Ti/RTX 4070 Ti SUPER/RTX 4080はNVENCを2基搭載しており、DaVinci Resolve STUDIO 18.6はそれを同時使用するデュアルエンコードが可能なので処理時間は非常に短い。RTX 4070 SuperとRTX 4070は同じNVENCが1基搭載なので処理速度はほぼ同じとなった。

DaVinci Resolve Studio 18.6によるエンコードでは2基のNVENC(画像ではVideo Encode)が同時に動くのが確認できる

強烈に冷える大型クーラー

最後に温度とクロックの推移をチェックしよう。サイバーパンク2077を10分間プレイした際の温度と動作クロックの推移を「HWiNFO Pro」で測定している。GPU温度は「GPU Temperature」、クロックは「GPU Clock」の値だ。室温は22度。バラック状態で動作させている。

温度とクロック

ブーストクロックは2,700MHz前後で推移。仕様上のブーストクロック2,640MHzなので、ゲーム中はそれよりも高クロックで動作しているのが分かる。そして注目は温度だ。さすが3連ファンで3.1スロット厚の大型クーラーを搭載しているだけに、最大64.5度、平均61.4度と強烈に冷えている。このクラスのGPUが70度以下で動き続けるのは、クーラーがかなり強力な証拠と言ってよい。

まとめると、RTX 4070 Ti SUPERは、RTX 4070 Tiに対して実ゲームで概ね5〜10%のフレームレート向上が確認でき、順当な強化を果たしたと言ってよいだろう。カード電力は同じなので、RTX 4070 Tiと同じカードサイズで設計できるのもよいところ。RTX 4080 / RTX 4090搭載カードよりも取り回しやすい製品が多くなるハズだ。その一方で、RTX 4080に対してはまだ10〜15%の性能差がある。価格面で、どこまでRTX 4070 Ti寄りにできるかが人気の決め手になってくるだろう。

問題は価格だ。GeForce RTX 4070 Tiを継承してどこまで上位モデルとの差別化が図れるかにかかっている