epiCRealismを徹底検証!意外な落とし穴と画像生成のコツ。日本人美女に適したモデルを求めてその2

前回に引き続き日本人の画像を作るのに適したモデルを調査していきます。今回調査するのは実写系モデルで世界的に人気のepiCRealismです。

epiCRealismとは

epiCRealismは、実写画像を作るのに特化したAIモデルです。

準備

それでは、epiCRealismを使っていきます。まずは、epiCRealism本体をダウンロードします。本記事執筆時点でのバージョンはV3です。

加えて併用されることの多い、以下のembeddingsもダウンロードして、Stable Diffusion WEB UIのルートのembeddings配下にダウンロードしたファイルをダウンロードします。

embeddingsファイルは次の2つがあるのでダウンロードしてください。

epiCRealismを試す

ステージの上で踊る日本のアイドルと声援をおくる観客

Prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform,epiCRealism

NegativePrompt: epicNegative

生成された画像を見ると、画像はかなり高品質で日本人女性になっていることがわかります。ただし、以下の点が気になるので修正してみたいと思います。

  • 下着姿に近い衣装
  • 全身画像を生成したい

これらを踏まえて呪文(プロンプト)を次のように修正して実行してみます。

Prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform,fullbody,epiCRealism

NegativePrompt: epicNegative, underwear

fullbodyを指定しているのにも関わらず全身画像が生成されないです。そのため、呪文(プロンプト)に膝(knee)を追加して全身画像を生成できるか試してみます。

Prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform,fullbody,knee,epiCRealism

NegativePrompt: epicNegative, underwear

次に解像度を変更してみます。

縦長に変更することで、全身画像が生成されることができました。epiCRealismで全身画像を生成するには縦長画像にする必要がありそうです。

embeddingsのepiCRealismを消去して検証

横長画像での全身画像の生成が難しいので、原因を調査したところepiCRealismが原因であることがわりました。epiCRealismを使うと背景と構図が固定されがちになることがわかりました。なのでepiCRealismのembeddingsを呪文(プロンプト)から削除して試してみます。

prompt: Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform

Negative Prompt: epicNegative

epiCRealismを削除すると大きく画像の品質が下がってしまうことがわかりました。ひとまず全身画像は生成されるようになったので問題点を解消していきます。生成した画像を見てみると、次のような問題点となります。

  • 20歳と指定したのに子供っぽい
  • 実写というより3Dやアニメ
  • 顔が崩れている

子供っぽいのとアニメっぽくなってしまうのは、DreamShaper7と同様ですね。Stable DiffusionのベースモデルがJapaneseと指定すると、子供っぽくなってしまうのかもしれないですね。それでは、この問題を解決するために次のような呪文(プロンプト)に調整してみます。

prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform

Negative Prompt:epicNegative,3d,anime,illust,child,ugly face

一旦、呪文(プロンプト)の改善はここまでにして、次は縦長画像で検証していきます。

縦長だと顔の解像度が高くなったたそれなりの品質になっていることがわかります。

教室で、放課後に椅子に座る18歳の制服姿の日本の女子学生

prompt: Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,

Negative Prompt: epicnegative,3d,anime,illust,child,ugly face

そこそこ良い感じにはなっていますね。気になる点としては

  • 少し老けている
  • 若干、日本人ぽくない

Prompt: Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,Asian,Japanese,epiCRealism

NegativePrompt: epicnegative,3d,anime,illust,ugly face

まだ少し日本人ぽくない印象を受けました。こちらを調査していくと、epiCRealismが原因になっていることがわかりました。そこでepiCRealismを呪文(プロンプト)から取り除きます。

Prompt: Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,Asian,Japanese

NegativePrompt: epicnegative,3d,anime,illust,ugly face

微妙な画像はあるものの、良い感じになりました。

以下は、DreamShaper7のときの生成画像です。

これと比較すると、epiCRealismのほうが多様な顔が表現されていて、一応、日本人のような顔立ちになっています。

渋谷の中で写真を撮る20歳のK-POPアイドル

Prompt: Photo of a beautiful 20 years old k-pop idol woman in Shibuya.epiCRealism

Negative Prompt:epicnegative,3d,anime,illust,ugly face,child,

品質は高いですが画角が固定されてしまいっているのでepiCRealismを取り除きます。

Prompt:Photo of a beautiful 20 years old k-pop idol woman in Shibuya.

Negative Prompt: epicnegative,3d,anime,illust,ugly face,child,

かなり良いできな気がします。k-popかKoreanどっちか迷ったので、Koreanにした場合についても試しました。

Prompt:Photo of a beautiful 20 years old Korean idol woman in Shibuya.

Negative Prompt:epicnegative,3d,anime,illust,ugly face,child,

どちらの似たような画像が生成されます。

epiCRealismのコツと落とし穴

epiCRealismのコツをまとめてみます。

  • epiCrealismのembeddingsは使うと画角が固定されてしまうので、使わないほうが自由度が高い。使わなくても精度はそれなりに高いので、embeddingsはepicNegativeだけにするのが良い。
  • 顔の解像度が低い状況だと顔が崩れがちなので、全身画像を生成する際は縦長にするか解像度をあげるなどの工夫が必要となります。

まとめ

epiCrealismの良い点

  • 実写画像を生成しやすい。
  • 日本人と韓国人の特徴をとらえらえている。

epiCrealismの苦労したポイント

  • 薄着が生成されやすい。
  • 構図によっては日本人を生成しづらい。

結論

epiCRealismは、高いクオリティでアジア人女性を生成できるが、たまに微妙なクオリティになることがわかりました。

コメント