【実験】stable diffusion でおすすめのGPU(グラボ)は?(RTX-3060 vs RTX-4070)

当ページのリンクには広告が含まれています。

「stable diffusion web ui で好きな画像が生成できるようになったけど、もうすこし速くならないかな?」とか、「今後どんどん画像を量産したいけど、どのグラボを買ったらいいのかな?」とお悩みのあなた!

そりゃあお金を出せば良いものは購入できますが、現実的にそうはいきませんよね。

ということで、いろんなサイトで推奨されている RTX-3060 と、最近値下がりでコスパが良くなってきた NVIDIA RTX-4070 の2種類について実際に比較してみましたので、その結果をご報告します。

これからグラボを購入しようとしている方は、必見です。

目次

NVIDIA RTX-3060 と RTX-4070 の比較

最初に実物の写真を公開しておきます。上がRTX-3060 で、昨年9月に約45,000円で購入しました。下はRTX-4070 で、今年の6月に 約9,000円で購入しました。

RTX-3060を買った時、結構デカイと思ったのですが、RTX-4070はさらにその上を行きましたね。

比較項目RTX-4070RTX-3060
リリース日2023年4月2022年10月
世代第4世代第3世代
バスインターフェースPCIe 4.0 x16PCIe 4.0 x16
ベースクロック1920 MHz1320 MHz
ブーストクロック2475 MHz1777 MHz
メモリクロック1313 MHz1875 MHz
メモリ12GB12GB
メモリタイプGDDR6XGDDR6
メモリバス192bit128bit
帯域幅504.2 GB/s240.0 GB/s
シェーディングユニット58883584
TMU6448
SM数4628
テンソルコア184112
RTコア4628
L1キャッシュ128 KB (per SM)128 KB (per SM)
L2キャッシュ36 MB3 MB
ピクセルレート158.4 GPixel/s85.30 GPixel/s
テクスチャレート455.4 GTexel/s199.0 GTexel/s
FP16 (半精度)29.15 TFLOPS12.74 TFLOPS
FP32 (単精度)29.15 TFLOPS12.74 TFLOPS
FP64 (倍精度)455.4 GFLOPS199.0 GFLOPS
TDP200W170W
推奨電源550 W450 W

RTX-3060に比べて各種ユニット、コア数は RTX-4070 の方が約1.5倍程度上になっていますが、世代が変わったことによる性能差が、これに加算されます。

GPUスペックをグラフにした図

GPUのベンチマークについては、いつも私が参考にさせて頂いている 「PC自由帳」のサイトから引用させて頂きました。

ベンチマーク的には、RTX-4070 は RTX3060の倍の性能があるようです。値段も倍なので、まあ順当なところでしょうか。

GPUベンチマークのスクリーンショット(2024年3月時点)

実測値による比較

下記のグラフは、条件ごとに10枚の画像を生成させてみた結果で、単位は秒です。

ユニット数・コア数と世代による性能向上により、RTX4070は RTX3060のおおよそ2倍強の性能になりました。

これは、まさにベンチマーク通りの結果ですね。

実験結果のグラフ

今回の検証に使ったパソコンのスペックは次の通りです。

CPUIntel(R) Core(TM) i5-13400 2.50 GHz
メモリ48.0 GB
OSWindows11 Professional 22H2

GPU選定のポイントと、おすすめのGPU

ベンチマーク通りの結果が出たということは、 「PC自由帳」のサイトから自分がどれくらいの投資をすれば、どれくらいの性能が得られるかが分かるということです。

あと注意点としてはGPUに搭載されているメモリで、これは生成する画像サイズやLoRA学習に関係してきます。

stable diffusion は最低でも8GBメモリ、欲を言えば12GBのメモリが必要ということですが、2048×2048の画像を生成する場合、12GBでも不足します。

かといって、24GB搭載のGPUは価格が高く、かつ消費電力も300W越えとかなりPC環境にヘビーです。GPUに合わせて電源も交換するとなると、さらに1~2万円の追加投資が必要となります。

RTX-4060 Ti の16GB版は魅力的ではありますが、RTX-4070と価格差があまり無いにも関わらず性能が劣るため、それほどコスパが良いとは言えません。

性能、メモリ容量、価格、消費電力を考慮すると、やはり今回紹介した RTX-3060 か RTX-4070が一番おすすめです。

あとは予算に応じて、お好きな方をお選び下さい。

コスパは多少目をつぶるなら、性能重視でいくなら RTX-4070 Super 、メモリ搭載量を重視するなら RTX-4060 Ti 16GB も良い選択肢になります。

検証内容

<各種パラメータ>

モデルbra_v5.safetensors [ac68270450]
プロンプト1girl,Best quality, masterpiece, ultra high res, (photorealistic:1.4), raw photo
ネガティブ
プロンプト
badhandv4 (worst quality:2), (low quality:2), (normal quality:2),
lowres, bad anatomy, bad hands, normal quality, ((monochrome)), ((grayscale))
サンプリング
メソッド
Euler a、DPM++ SDE Karras
解像度512×512、1024×1024

<実行中画面キャプチャ(RTX-4070

画面キャプチャ

<実行中画面キャプチャ(RTX-3060)

画面キャプチャ

まとめ

今回は stable diffusion web ui をつかった画像生成に最適なGPU(グラボ)について、RTX-3060 と RTX-4070 について処理速度を計測し、結果をご報告しました。

ウェブ上で公開されているベンチマークテストの結果と、今回私が実験した計測結果が一致しましたので、どれを購入すればどれくらいの性能が出るかは、推測しやすくなったのではないかと思います。

選定のポイントとして、メモリ容量、消費電力、性能、価格を考慮する必要があり、これらのことを総合的に考えると、RTX-3060と RTX-4070以外に選択肢はありませんでした。

あとは、ご自身の予算に応じて、どちらかを選んでいただければと思います。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次