【徹底解説】Stable Diffusionの必要スペック。おすすめPCは?ノートパソコンについても解説!

私は半年前にStable Diffusion用に15万円ほどするPCを購入したことを後悔しています。なぜかというと半年足らずでPCを書い直す羽目になってしまったからです。

当初はあまりStable Diffusionに関する知識がないこともあり、よくわからずにPCに詳しそうな人の意見を参考に買ってしまったのが原因でした。私が初心者の頃、PCに詳しい人ではなく画像生成AIに詳しい人がPC購入について解説した記事があれば、購入の失敗を防げただろうと思ったので本記事を書いてみました。

実際に私はStable Diffusionで画像を生成するだけではなく、モデルを訓練させてモデルを公開しているほど、かなりの画像生成マニアです。

本記事ではStable Diffusionの今後の動向将なども考慮しつつStable Diffusion用にPCおよびノートPCを購入する人に向けて解説をしていきます。推奨スペックを掲載し、コストパフォーマンスに優れたメーカーとモデルも紹介します。

※本記事の商品リンクにはプロモーションを含みます。

早速ですが推奨スペックを最初にまとめておきます。

画像生成のみを行う場合の必要スペック:

項目説明
CPU標準的なAMDまたはIntel CPU(GPUチップ内蔵のCPU推奨)
メモリ最低8GB DDR4/DDR5 RAM(16GB以上推奨)
SSD最低20GB(1TB推奨)
GPUNVIDIAグラフィックスカード(最低4GB VRAM、12GB以上推奨)
価格範囲最低限:12~14万円、推奨スペック: 18~22万円
おすすめノートPCNVIDIA® GeForce RTX™ 4050(6GB)搭載ノートPC
おすすめデスクトップAMD Ryzen 5とGeForce RTX 3060Ti 搭載ミニタワーゲーミングPC

ファインチューニング※1やSDXL※2で画像生成を行う場合の必要スペック:

項目説明
CPU高性能なAMDまたはIntel CPU(GPUチップ内蔵のCPU推奨)
メモリ最低16GB DDR4/DDR5 RAM
SSD最低256GB(1TB以上推奨)
GPUNVIDIAグラフィックスカード(最低12GB VRAM、16GB以上推奨)
価格範囲30~45万円
おすすめノートPCNVIDIA® GeForce RTX™ 4090(16GB)搭載ノートPC※3
おすすめデスクトップNVIDIA® GeForce RTX 4070 Ti Super (16GB)搭載デスクトップ

※1: ファインチューニングとは自身で収集した画像データを元にStable Diffusionを学習させることです。

※2: SDXLはStable Diffusion Extra Largeの略で2023/7に発表された新モデルです。従来のStable Diffusionに比べて高解像度な画像が生成できますがかなり高いPCスペックが求められます。

※3: VRAM16GBのノートパソコンについて

最高スペックを追求する方はこちら

最高スペックを追求するならこちらのRTX 4090搭載PCがおすすめです。ファインチューニングを最速で行いたい場合はこのPCです。

NVIDIA® GeForce RTX™ 4090(24GB)搭載デスクトップ

どういった目的でPCを購入するか?

Stable Diffusionは「画像生成だけを行いたい場合」と「自作データでStable DiffusionモデルやLoRAを作成する場合」の2つの用途に応じて、それぞれ異なるPCのスペックを要求します。

具体的な利用シーンは以下の2つを想定しています:

  1. 画像生成用: Stable Diffusion WEB UIなどのブラウザ上で機能するツールを利用して、新たな画像を生成したり、既存の画像の一部を補完するインペイントといった一通りの機能を活用することを想定しています。ちなみにブラウザ上といってもネットワーク上のクラウドにつないで画像生成を行うという意味ではなく、ローカルでStable Diffusionの画像生成処理を行うという意味です。
  2. LoRAの作成などファインチューニング用: 独自の画像データをもとにStable Diffusionを再学習させ、オリジナルの画像生成モデルを構築する環境を想定しています。具体的には、服装の細部を学習させてたり、自分で描いたキャラクターをAIに学習させて、オリジナルキャラクターで画像生成させたりすることができます。また、私的利用の範囲に限りますが、有名キャラクターや有名人の画像を生成したりすることもできます。

この記事では、上記のそれぞれのシーンにおけるStable Diffusionの推論とファインチューニングのために必要なPCスペックを詳しく解説します。

Stable Diffusion用のPC選び。本当に購入すべき?

PCを購入すべきかどうかはあなたの目的やニーズによって異なります。以下に、PCの購入した方がお得な人とそうでない人についてまとめました。

PCの購入がおすすめの人(以下のいずれかに当てはまる):
  1. 多くの機能を試したい人:Stable Diffusionの基本的な機能に満足せず、より多機能を駆使して自由な画像生成を楽しみたい場合、自分のPCにソフトウェアをインストールして使用することが適しています。クラウドサービスでは提供されていないカスタマイズや拡張機能を利用することができます。
  2. 頻繁に画像生成やLoRAやモデルの作成をする人:頻繁にStable Diffusionで画像生成したり、モデルやLoRAを作成するとクラウドの使用料が高くつきます。Google Colabも昔はお得でしたが最近は従量課金になったので高いです。頻繁に利用する場合、長期的には購入した方がお得です。
  3. 人に見られると恥ずかしい画像を生成する人: クラウド上で画像生成をすると、様々なプライバシーの問題が起こることがあります。操作ミスなどで他人に見られたくないデータが流出したり、Googleなどは規約に違反すると判定されるとアカウントが凍結されることがあります。そのようなストレスを回避したい場合はPCの購入をすることをおすすめします。
PCの購入が不要な人
  1. これからStable Diffusionを使い始める人:ディープラーニングを学び始める初心者や基本的な学習を行いたい場合、クラウドを利用することで十分な結果を得ることができます。
  2. 期間限定の利用者:一度きりのプロジェクトを手がける、学習時間が短い、あるいは稀にしかデータセットでの画像生成を行わない場合。クラウドサービスは柔軟性があり、必要なときに必要なリソースを利用するのをおすすめします。

重要なのは、自分の目的や予算、個々の使用状況に応じて最適な選択をすることです。PCの購入を検討する場合は、必要なスペックや予算を考慮し、将来の成長やニーズの変化にも対応できるように検討しましょう。

PCを購入してクラウド環境からローカル環境にすることのメリット

PC購入の利点は以下の通りです。

  1. 使いたい放題: クラウドサービスでは従量課金が行われたり、リソースが枯渇した時点で作業がストップします。これにより、利用料を常に気にしながらの作業となりますが、PCを所有すればそのようなストレスから解放されます。
  2. 機能利用の自由度: 多くの機能はクラウドやColabでも利用可能ですが、新しいプロジェクトなどはしばしばローカル環境で利用を想定して作られており、クラウドでは制限を受けることがあります。PC所有により、そのような制約から解放されることは大きなメリットとなります。
  3. プライバシーの保護: 種々の画像を生成する際、特定の画像が他人に知られることを避けたい場合や、操作ミスやハッキングによる情報漏洩のリスクを考慮すると、ローカル環境が安全性を保つ上で優れています。クラウドでは、規約違反の可能性を孕んだ画像の生成など、より慎重な操作が求められます。
  4. 時間の節約: クラウドでは大規模なファイルのアップロードに時間がかかることがありますが、PCを購入することで時間の節約に繋がります。

画像生成のみを行う場合の推奨スペック/必要スペック

画像を生成したり、既存の画像の一部を補完(inpaint)したりするための推論を実行する環境になります。基本的なハードウェア要件は以下の通りです。

CPU

AI画像生成では、GPUでの処理が大半のため、CPUの性能はそれほど重要ではありませんがいくつかポイントがあります。画像生成用PCも訓練用に購入する場合でもCPU選びについてはほとんど変わらないです。

CPU選びのポイント

  • 標準的なIntelまたはAMDのCPUを選択することをおすすめします。
  • CPUはAMDでも大丈夫なのでコスパを考えるのであればAMDをおすすめします。
  • こだわりたいならGPUチップ内蔵のCPUがおすすめ: GPUチップ内蔵のCPUだとグラフィック表示に利用されるGPUメモリが節約できて良いので

メモリ選び

Stable DiffusionのデータはGPUで処理しますが、メモリもとても重要な要素です。モデルやデータを読み込むときに一時的にメモリを消費するからです。

メモリ選びのポイント

  • 推論用PCの場合: 推論用のメモリですが8GBのRAMのDDR4またはDDR5 RAMが必要です。しかし、よりスムーズな動作や複数のタスクを同時に行うためには、16GB以上のメモリを推奨します。
  • 訓練用PCの場合: 訓練用に購入する場合は学習データを大量に読み込むこともあるので、フリーズする可能性が高いです。なので16GB以上をおすすめします。

ストレージはSSDがおすすめ

ストレージですがHDDとSSDという選択肢がありますが、HDDはあまりおすすめしません。理由としてはファイルアクセスが大量に行われるのでHDDにしてしまうとかなりストレスを感じます。そのためSSDにしましょう。

ストレージ選びのポイント

  • 推論用PCの場合: Stable Diffusionを動かすには最低でも20GBのディスクスペースが必要です。ただし推論用であってもモデルを色々ダウンロードしたり画像を保存していたらあっという間にディスクスペースを消費してしまいます。そのため500GB~を推奨します。
  • 訓練用PCの場合: 推論に加えて画像データを収集したりすると500GBぐらいはすぐに到達していしまいます。そのため1TBを推奨します。

GPU

AI画像生成には大量の並列計算能力が必要で、そのためにGPUが肝となるパーツです。NVIDIAのグラフィックスカードをおすすめします。そしてVRAMというグラフィックボードで扱えるデータ容量の値がとても重要です。VRAMの選択を間違うと機能を利用すること自体ができなくなるのでよく確認しあましょう。

  • 推論用PC: Stable Diffusionモデルを実行するためには、ただし低メモリ用のオプションを使うことになるのでかなり時間がかかります。そのため標準的な機能を使うには6GBが推奨スペックです。
  • 推論用PC(動画生成やSDXLを使う場合): 2023年にStable Diffusionの新モデルSDXLが登場しました。SDXLを利用するには推論用PCでもハイスペックな性能が求められます。VRAMですが6GBだと動かなかったです。VRAMについては12GBが推奨スペックです。
  • 訓練用PC: LoRAなどの訓練用としては最低12GBが必要です。16GB以上のVRAMを搭載したGPUが推奨です。

NVDIA以外のグラフィックボードは?

M1またはM2 Mac、AMDグラフィックスカードも使用可能ではありますが、NVIDIAに比べてトラブルシューティングに時間がかかる可能性があります。したがって、トラブルを避けるためには、NVIDIA製のGPUを選択することを強く推奨します。

GPUの名称とVRAMは一致しないので注意!

GPU名称が同じでもVRAMの容量が異なるケースもあるので、その点についてはよく確認の上、購入してください。GeForce RTX 3060は6GB、8GB、12GBとたくさんあるので、ちゃんと購入前にGPUメモリの容量を確認しておきましょう。

自作するより組み立て済みをおすすめします。

PCを自作する場合は以上のスペックに加えて適切なマザーボードや冷却ファン、電源の選び方が重要となります。動いたとしても電源の選び方を間違うと高負荷な状態でPCが落ちたします。また冷却が不純分だとGPUが火を噴くこともあり危険です。冷却については組み立てて計測しない限りは、はっきりとはわからないので経験が必要です。

自作した方が安く済むイメージがありますが、パーツ選びの際にお得なものを上手く買わない限りは変わらないです。むしろ在庫状況によっては高くつきます。また電力を計算する労力やPCを組み立てる手間を考慮すると組み立て済みのPCを購入するのがおすすめです。

PCのスペックを加味した上でオンラインで購入できるものでおすすめのPCは次の通りです。コストパフォーマンスを意識していえるのですべて直販サイトからの購入になります。

動画生成やSDXLを使う場合のおすすめ

最小スペックで選ぶと最小限の機能しか使えないので注意

GPUメモリの容量が重要となっていきます。最小スペックで選んでしまうと、最小限の機能しか使えないので余裕をもったGPUを選ぶのをおすすめします。最近だとControlNetなども併用することで、生成できる画像の幅が増えるので、最小スペックで選ぶことはおすすめしません。少なくとも6GBは見ておきましょう。

SDXL 1.0の登場でさらなるスペックが求められる

SDXL 1.0 をリリースしました — Stability AI Japan — Stability AI Japan
Stability AIは、SDXL 1.0をオープンモデルとしてリリースしました。SDXL 0.9の研究専用リリースに続き、SDXLのフルバージョンは世界最高のオープン画像生成モデルとして改良されています。

2023年7月28日にStable Diffusionを開発しているStability AIがSDXL 1.0がリリースされました。SDXL 1.0は今までのStable Diffusionモデルの大幅なバージョンアップです。特に背景や正確な構図で画像を生成する能力は既存のStable Diffusionモデルを圧倒しています。

このモデルの解像度は1024✕1024以上でポテンシャルが発揮されるため、今後、高い解像度での画像生成が流行る可能性が高いです。今はまだSDXLでファインチューニングされたモデルが多くないため、主流なのはSD 1.5系ですが、今後BRAやAnythingに匹敵するような派生モデルが公開されることで、SDXLによる画像生成が流行ることが容易に予測できます。

そのため、SDXL 1.0対応を見据えて、推論用であっても、それなりに高いスペックのPCを用意したほうが良いでしょう。私が試した感想だとVRAM 6GBでもギリギリ動くけど、VRAMは12GBは欲しいです。ギリギリのスペックだとまとめて画像が生成できないので、何度も実行するためかなり時間がかかってしまいます。

NVIDIA® GeForce RTX™ 3060(12GB)搭載デスクトップ

アニメーション生成ではGPUメモリ12GB以上が必須に!

最近はStable Diffusionでアニメーション生成ができます。ただし、アニメーション生成をするためには、求められるPCのスペックが高いです。アニメーション作成ツールAnimateDiffは12GBが推奨スペックです。推論用の推奨スペックである6GBだとアニメーションの生成ができません。このように、どんどん求められるスペックが上がっていってるのが現状です。

NVIDIA® GeForce RTX™ 3060(12GB)搭載デスクトップ

価格の目安

価格ドットコム、Amazonなどで2023年10月時点で調査を行いました。基本的には、問題なく動く環境で、安い、コストパフォーマンスを重視したPCの調査になっております。CPUは標準的なもの、メモリは16GB、ストレージは500GB〜100TBの範囲で調査を行いました。

推論用PC(コスパ重視)

今後、様々な機能が増えるとなると6GBだと少し心もとないところはありますが、以下のスペックで探してみることをおすすめします。8GBあると推論のみでSDXLなどを使わないのであればちょうど良いです。画像生成は6GBでも実際に画像生成してみて確認済です。

推論用PC(SDXL 1.0対応や高解像度の画像生成する場合)

先述したとおり、SDXL 1.0を使うためにはGPUメモリが12GB必要です。中には8GBで動かす方法もありますが1枚の画像生成に40秒程度かかりバッチ数も増やせないので、あまり実用的とは言えません。また12GBでも十分にSDXL 1.0の性能を引き出せないのも事実です。もし十分に性能を発揮したいのであれば次に紹介するメモリを16GB以上搭載しているPCを購入するのをおすすめします。

動画生成やSDXLを使う場合のおすすめ

ファインチューニング用PC or SDXL 1.0を十分に動かす場合

ローカル環境でLoRAを作成したり、SDXL1.0を実行したりする場合はこちらがおすすめのPCとなっています。またAnmateDiffなど動画生成などもできます。私はGeForce RTX 3080(16GB)搭載のPCを使っていますがかなり快適です。

最高スペックを追求する方はこちら

最高スペックを追求するならこちらのRTX 4090搭載PCになります。

NVIDIA® GeForce RTX™ 4090搭載デスクトップ: 45万円~

FAQ

どこで買うのがおすすめなの?

価格ドットコムで検索する際の注意点

価格ドットコムで比較して買うのも手ですが、価格ドットコムだとGPUの名称でしか検索できずGPUメモリまでは見ることができません。そのため探しづらく、安いと思って購入するとGPUメモリが値が意図したものとことなって誤った購入の可能性も高くなります。その点を注意しましょう。

おすすめの直販サイトの一覧

  • ASUS: ASUSは小売店にも卸をしていて直販のイメージはあまりないかもしれないですが、PCの直販をしています。直販サイトのほうが安いことが多いです。GPUも名称だけでなくメモリ容量をちゃんと表示しているのでわかりやすいです。同スペック最安値が多いです。デスクトップは取扱が少なくノートパソコンが多いです。
  • パソコン工房: GPUごとの検索がVRAMメモリごとに分かれていて検索しやすいです。GeForce RTX 3060で6GB、8GB、12GBがあるようにGPU名が一緒でもメモリが全然違うから検索しづらい問題が解消されます。また価格も他のメーカーと比べても最安値が多いです。デスクトップ、ノートPCともに取扱が多いのでおすすめです。

コメント