「stable diffusion web ui で好きな画像が生成できるようになったけど、もうすこし速くならないかな?」とか、「今後どんどん画像を量産したいけど、どのグラボを買ったらいいのかな?」とお悩みのあなた!
そりゃあお金を出せば良いものは購入できますが、現実的にそうはいきませんよね。
ということで、いろんなサイトで推奨されている RTX-3060 と、最近値下がりでコスパが良くなってきた NVIDIA RTX-4070 の2種類について実際に比較してみましたので、その結果をご報告します。
これからグラボを購入しようとしている方は、必見です。
NVIDIA RTX-3060 と RTX-4070 の比較
最初に実物の写真を公開しておきます。上がRTX-3060 で、昨年9月に約45,000円で購入しました。下はRTX-4070 で、今年の6月に 約9,000円で購入しました。
RTX-3060を買った時、結構デカイと思ったのですが、RTX-4070はさらにその上を行きましたね。
比較項目 | RTX-4070 | RTX-3060 |
---|---|---|
リリース日 | 2023年4月 | 2022年10月 |
世代 | 第4世代 | 第3世代 |
バスインターフェース | PCIe 4.0 x16 | PCIe 4.0 x16 |
ベースクロック | 1920 MHz | 1320 MHz |
ブーストクロック | 2475 MHz | 1777 MHz |
メモリクロック | 1313 MHz | 1875 MHz |
メモリ | 12GB | 12GB |
メモリタイプ | GDDR6X | GDDR6 |
メモリバス | 192bit | 128bit |
帯域幅 | 504.2 GB/s | 240.0 GB/s |
シェーディングユニット | 5888 | 3584 |
TMU | 64 | 48 |
SM数 | 46 | 28 |
テンソルコア | 184 | 112 |
RTコア | 46 | 28 |
L1キャッシュ | 128 KB (per SM) | 128 KB (per SM) |
L2キャッシュ | 36 MB | 3 MB |
ピクセルレート | 158.4 GPixel/s | 85.30 GPixel/s |
テクスチャレート | 455.4 GTexel/s | 199.0 GTexel/s |
FP16 (半精度) | 29.15 TFLOPS | 12.74 TFLOPS |
FP32 (単精度) | 29.15 TFLOPS | 12.74 TFLOPS |
FP64 (倍精度) | 455.4 GFLOPS | 199.0 GFLOPS |
TDP | 200W | 170W |
推奨電源 | 550 W | 450 W |
RTX-3060に比べて各種ユニット、コア数は RTX-4070 の方が約1.5倍程度上になっていますが、世代が変わったことによる性能差が、これに加算されます。
GPUのベンチマークについては、いつも私が参考にさせて頂いている 「PC自由帳」のサイトから引用させて頂きました。
ベンチマーク的には、RTX-4070 は RTX3060の倍の性能があるようです。値段も倍なので、まあ順当なところでしょうか。
実測値による比較
下記のグラフは、条件ごとに10枚の画像を生成させてみた結果で、単位は秒です。
ユニット数・コア数と世代による性能向上により、RTX4070は RTX3060のおおよそ2倍強の性能になりました。
これは、まさにベンチマーク通りの結果ですね。
今回の検証に使ったパソコンのスペックは次の通りです。
CPU | Intel(R) Core(TM) i5-13400 2.50 GHz |
---|---|
メモリ | 48.0 GB |
OS | Windows11 Professional 22H2 |
GPU選定のポイントと、おすすめのGPU
ベンチマーク通りの結果が出たということは、 「PC自由帳」のサイトから自分がどれくらいの投資をすれば、どれくらいの性能が得られるかが分かるということです。
あと注意点としてはGPUに搭載されているメモリで、これは生成する画像サイズやLoRA学習に関係してきます。
stable diffusion は最低でも8GBメモリ、欲を言えば12GBのメモリが必要ということですが、2048×2048の画像を生成する場合、12GBでも不足します。
かといって、24GB搭載のGPUは価格が高く、かつ消費電力も300W越えとかなりPC環境にヘビーです。GPUに合わせて電源も交換するとなると、さらに1~2万円の追加投資が必要となります。
RTX-4060 Ti の16GB版は魅力的ではありますが、RTX-4070と価格差があまり無いにも関わらず性能が劣るため、それほどコスパが良いとは言えません。
性能、メモリ容量、価格、消費電力を考慮すると、やはり今回紹介した RTX-3060 か RTX-4070が一番おすすめです。
あとは予算に応じて、お好きな方をお選び下さい。
コスパは多少目をつぶるなら、性能重視でいくなら RTX-4070 Super 、メモリ搭載量を重視するなら RTX-4060 Ti 16GB も良い選択肢になります。
検証内容
<各種パラメータ>
モデル | bra_v5.safetensors [ac68270450] |
プロンプト | 1girl,Best quality, masterpiece, ultra high res, (photorealistic:1.4), raw photo |
ネガティブ プロンプト | badhandv4 (worst quality:2), (low quality:2), (normal quality:2), lowres, bad anatomy, bad hands, normal quality, ((monochrome)), ((grayscale)) |
サンプリング メソッド | Euler a、DPM++ SDE Karras |
解像度 | 512×512、1024×1024 |
<実行中画面キャプチャ(RTX-4070)>
<実行中画面キャプチャ(RTX-3060)>
まとめ
今回は stable diffusion web ui をつかった画像生成に最適なGPU(グラボ)について、RTX-3060 と RTX-4070 について処理速度を計測し、結果をご報告しました。
ウェブ上で公開されているベンチマークテストの結果と、今回私が実験した計測結果が一致しましたので、どれを購入すればどれくらいの性能が出るかは、推測しやすくなったのではないかと思います。
選定のポイントとして、メモリ容量、消費電力、性能、価格を考慮する必要があり、これらのことを総合的に考えると、RTX-3060と RTX-4070以外に選択肢はありませんでした。
あとは、ご自身の予算に応じて、どちらかを選んでいただければと思います。
コメント