Stable Diffusionのモデルは様々なバリエーションが生まれていて、どれを選んで良いかわからないというのが現状です。比較しようにもいちいち試すのが面倒で、civitaiのサンプルを見て良さそうと思って実に使ってみると見本通りに画像が生成できないといったことが日常茶飯事です。
Stable Diffusionモデル比較の難しいところは、モデルによって呪文(プロンプト)にコツがあるので、同じ呪文(プロンプト)で比較しても、それぞれのモデルの強みが活きないところです。そこで、「日本人美女に適したモデルを求めて」と題して人気モデルを1つずつ掘り下げてみて、日本人美女を作るのに適したモデルを決めることにしてみました。
今回は「日本人美女に適したモデルを求めて」の3回目はBeautiful Realistic Asiansを紹介していきます。
Beautiful Realistic Asiansとは
Beautiful Realistic Asiansは、実写アジア人の画像を作るのに特化したAIモデルです。更新頻度が高く頻繁にアップデートが行われています。私の中では、最も日本人を生成するのに向いているモデルとなっております。
モデルのダウンロードとインストール
モデルのダウンロードとインストールについては次の記事で解説しているので参考にしてください。
Beautiful Realistic Asiansはどのバージョンを使うか?
Beautiful Realistic Asiansは頻繁にアップデートが行われています。そのためバージョンが多く品質にも若干のばらつきがあります。現在はv1、V3、v4.0、v5、v6.0の5バージョンが公開されています。
v1、V3、v4.0、v5、v6.0の5バージョンを比較していきます。
呪文(プロンプト)を切り替えて比較
次の画像は5つバージョンを縦軸に並べております。順番はv1、V3、v4.0、v5、v6.0と並んでおります。横軸は呪文(プロンプト)を変更しております。
- Photo of a beautiful 20 years old woman.school uniform
- Photo of a beautiful 20 years old woman.bikini
- Photo of a beautiful 20 years old woman.Japanese idol
- Photo of a beautiful 20 years old woman.Korean idol
- ネガティブ呪文(プロンプト)はEasyNegativeで共通
上からv1、V3、v4.0、v5、v6.0の順
シード値を買えて比較
制服を着た女子校生の比較をしてみます。
Prompt: Photo of a beautiful 20 years old woman.school uniform
Negative Prompt: EasyNegative
バージョン比較の結果
正直どのバージョンもそれなりに高い品質で画像を生成できますが、v6.0で若干、安定感が下がった気がしたのでv5を私は使っております。さらにv5とv6.0に対する比較は次の記事で行っているので参考にしてみてください。
準備
本記事ではStable Diffusion Web UIを通して検証していきます。Stable Diffusion Web UIをインストールしてない場合は次の記事を参考にしてください。
Beautiful Realistic Asiansをインストール
それでは、Beautiful Realistic Asiansを使っていきます。まずは、Beautiful Realistic Asians本体をダウンロードします。本記事執筆時点での最新バージョンはV6.0ですが、先述した通りv5のほうが安定しているので今回はv5を使っていきます。
ダウンロードしたファイルは”stable-diffusion-webui/models/Stable-diffusion”に配置することで使えます。
加えて相性の良いembeddingsであるEasy Negativeを使います。以下のembeddingsもダウンロードして、Stable Diffusion WEB UIのルートのembeddings配下にダウンロードしたファイルをダウンロードします。
Beautiful Realistic Asians v5を試す
Beautiful Realistic Asians同士の比較はしましたが、本シリーズの目的である他モデルとの比較を行っていきたいと思います。「日本人美女に適したモデルを求めて」は以下の3つのテーマで画像生成を行います。呪文(プロンプト)の設定はモデルごとに異なるため、何度か調整しながらベストな写真を作って比較しております。
- ステージの上で踊る日本のアイドルと声援をおくる観客
- 教室で、放課後に椅子に座る18歳の制服姿の日本の女子学生
- 渋谷の中で写真を撮る20歳のK-POPアイドル
ステージの上で踊る日本のアイドルと声援をおくる観客
prompt:
Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of audience.idol uniform,
Negative Prompt:
Easy Negative,
いままでのモデルと比べると、圧倒的にクオリティの高い画像が生成されていますね。服装についても、現代のアイドルでありそうな服装をしています。ほぼ完成に近いですが、以下の点が少し気になるので調整していきます。
- 少し子供っぽい
- 観客がいない
prompt:
Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of crowd audience.idol uniform,
Negative Prompt:
Easy Negative,child,
これで良い感じになりましたね。次は縦長の画像生成の精度も検証してみます。
顔が崩れにくくなったり背景のデティールが良くなったりと、品質が少し向上した気がします。ただし、観客がいなくなってしまいました。
教室で、放課後に椅子に座る18歳の制服姿の日本の女子学生
prompt:
Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,
Negative Prompt:
Easy Negative,
そこそこ良い感じにはなっていますね。気になる点としては顔が崩れるケースもあります。ネガティブ呪文(プロンプト)を以下のようにしてみました。
Negative Prompt:
Easy Negative,ugly face,
ちょっと微妙になってしまいましたね。ここからの調整は難航しそうなので、一旦、ここで切り上げます。縦長の解像度でも検証してみます。
渋谷の中で写真を撮る20歳のK-POPアイドル
Prompt:
Photo of a beautiful 20 years old k-pop idol woman in Shibuya.
Negative Prompt:
Easy Negative,
少し化粧が濃い気もしますが、K-POPぽいですね。Koreanにした場合についても試しました。
Prompt:
Photo of a beautiful 20 years old Korean idol woman in Shibuya.
Negative Prompt:
Easy Negative,
Korean idolのほうがメイクも薄まって理想に近づきました。縦長の解像度でも検証してみます。
まとめ
Beautiful Realistic Asians v5の良い点
- 実写画像を生成しやすい。
- 日本人と韓国人の特徴をとらえらえている。
- 様々な構図でも高いクオリティを保てている
Beautiful Realistic Asians v5の苦労した点
- 強いて上げるとすれば、若干、クオリティにムラがあり、顔が崩れやすい
結論
Beautiful Realistic Asians v5は、高いクオリティでアジア人女性を生成できました。今までの本シリーズで紹介してモデルと比べると様々な構図で生成しても顔が崩れにくく、扱いやすいモデルだと思いました。次はChilloutMixを試してみます。
コメント