2024年1月17日に発売した「GeForce RTX 4070 SUPER」はVRAMを12GB搭載しており、画像生成AIなどの生成系AIも快適に動作させられます。GeForce RTX 4070 SUPERのリファレンス実装である「GeForce RTX 4070 SUPER Founders Edition」を借りられたので、実際に画像生成AIを動作させて編集部にある「GeForce RTX 3060」や「GeForce RTX 3090」と処理性能を比較してみました。

GeForce RTX 4070 ファミリ グラフィックスカード | NVIDIA

https://www.nvidia.com/ja-jp/geforce/graphics-cards/40-series/rtx-4070-family/

GeForce RTX 4070 SUPERはGeForce RTX 4070の性能強化版グラフィックボードで、前世代の上位機種であるGeForce RTX 3090よりも低消費電力かつ同等以上の処理性能を備えています。GeForce RTX 4070 SUPERとGeForce RTX 3090の性能比較や、高負荷時の熱や騒音は以下の記事で詳しくまとめています。

「GeForce RTX 4070 SUPER」と「GeForce RTX 3090」の処理性能を様々なベンチマークで徹底比較&熱の分布・ファンの騒音・消費電力も全部チェックしてみたよてんこ盛りレビュー - GIGAZINE



今回は「GeForce RTX 4070 SUPER Founders Edition(以下、RTX 4070 SUPER)」「ASUS Dual GeForce RTX 3060 V2 OC Edition 12GB GDDR6(以下、RTX 3060 12GB)」「GeForce RTX 3090 GD3090-24GEBST(以下、RTX 3090)」で画像生成AIを実行した際の生成速度を比較してみます。なお、VRAM容量はRTX 4070 SUPERが12GB、RTX 3060 12GBが12GB、RTX 3090が24GBです。



グラフィックボード以外のPC構成は以下の通り。GPUドライバーはプレス版のバージョン511.15を使っています。

CPUAMD Ryzen 5 7600X BOXマザーボードX670E Taichi CarraraメモリCrucial CT16G48C40U5 PC5-38400 (DDR5-4800)288pin DDR5 UDIMM 16GBストレージWD_BLACK SN750 NVMeOSWindows 11 Pro 64bit

◆Stable Diffusionでの画像生成速度をチェック

Stable Diffusion web UI(AUTOMATIC1111版)にNVIDIA公式の高速化拡張機能「TensorRT Extension for Stable Diffusion」を導入し、3種のグラフィックボードで画像を100枚生成した際の生成速度を測定してみました。

まず、モデルは「Stable Diffusion 1.5」、ステップ数は20、解像度は512×512ピクセルに設定し、画像を100枚生成してみました。



Stable Diffusionではコンソールから処理にかかった時間を確認できるので、この時間を比べてみます。



RTX 4070 SUPER、RTX 3060 12GB、RTX 3090の画像生成時間を表にまとめると以下の通り。RTX 4070 SUPERはRTX 3060 12GBの半分の時間で生成を終えました。前世代上位モデルのRTX 3090よりも短い時間で画像を生成できているのも特筆すべきポイントです。

GPU生成時間RTX 4070 SUPER1分28秒RTX 3060 12GB2分57秒RTX 30901分31秒

続いて、モデルを「Stable Diffusion 2.1」に変更し、ステップ数は20、解像度は512×512ピクセルに設定して画像を100枚生成してみました。



RTX 4070 SUPER、RTX 3060 12GB、RTX 3090の画像生成時間を表にまとめると以下の通り。モデルを変更しても、RTX 4070 SUPERが最も高速に画像を生成できました。

GPU生成時間RTX 4070 SUPER1分32秒RTX 3060 12GB3分25秒RTX 30901分47秒

◆StreamDiffusionでの秒間生成速度を測定

超高速な画像生成が可能として話題になった「StreamDiffusion」を使って、秒間何枚の画像を生成できるのか確かめてみました。RTX 4070 SUPER搭載PCでStreamDiffusionの「optimal-performance/single.py」を実行して画像を生成する様子が以下。かなり高速に画像を生成できていることが分かります。

爆速画像生成AI「StreamDiffusion」をRTX 4070 SUPERで実行してみた - YouTube

画像が表示されている画面の下部には、秒間生成枚数(fps)が表示されています。RTX 4070 SUPERの場合は40fps前後でした。



また、画像生成終了後にコンソールに平均fpsが表示されます。RTX 4070 SUPERの平均fpsは40.57132355074917でした。



RTX 4070 SUPER、RTX 3060 12GB、RTX 3090の平均fpsを表にまとめると以下の通り。RTX 4070 SUPERはRTX 3060 12GBよりは高速に画像を生成できたものの、3種のグラフィックボードの中で最も高速なのはRTX 3090でした。

GPU平均fpsRTX 4070 SUPER40.57132355074917RTX 3060 12GB19.826912350032618RTX 309045.25673838451412

続いて、 RTX 4090に最適化されたバッチ処理を行う「optimal-performance/multi.py」を実行してみました。実行時の様子は以下のムービーで確認できます。

爆速画像生成AI「StreamDiffusion」をRTX 4070 SUPERで実行して毎秒60枚以上の画像を生成しまくる様子 - YouTube

RTX 4070 SUPER、RTX 3060 12GB、RTX 3090の平均fpsをまとめた表が以下。RTX 4070 SUPERはRTX 3090には及ばなかったものの、毎秒66枚以上という驚異的な速度で画像を生成できました。

GPU平均fpsRTX 4070 SUPER66.84877768893824RTX 3060 12GB16.57194484320879RTX 309073.78827724014783

◆「GeForce RTX 4070 SUPER」でレビューして欲しい点を教えて!

「こうするとどうなるかやってみて!」「こういうことできる?」「こんな時どうなる?」など実際に使うからこそ試して欲しいポイントを以下のリンク先から教えてください〜。他の誰かと内容が重なってもOK、むしろ多ければ多いほど「やはりこういう点が気になるのだな〜」というのがわかるので助かるのです。そして次のレビュー記事作成に反映されてお役立ち!

• Discord | "「GeForce RTX 4070 SUPER」についてレビューして欲しい点を教えて!" | GIGAZINE(ギガジン)