前回に引き続き日本人の画像を作るのに適したモデルを調査していきます。今回調査するのは実写系モデルで世界的に人気のepiCRealismです。
epiCRealismとは
epiCRealismは、実写画像を作るのに特化したAIモデルです。
準備
それでは、epiCRealismを使っていきます。まずは、epiCRealism本体をダウンロードします。本記事執筆時点でのバージョンはV3です。
加えて併用されることの多い、以下のembeddingsもダウンロードして、Stable Diffusion WEB UIのルートのembeddings配下にダウンロードしたファイルをダウンロードします。
embeddingsファイルは次の2つがあるのでダウンロードしてください。
- epiCNegative(https://civitai.com/models/89484?modelVersionId=95263)
- epiCRealism(https://civitai.com/models/89484?modelVersionId=95256)
epiCRealismを試す
ステージの上で踊る日本のアイドルと声援をおくる観客
Prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform,epiCRealism
NegativePrompt: epicNegative
生成された画像を見ると、画像はかなり高品質で日本人女性になっていることがわかります。ただし、以下の点が気になるので修正してみたいと思います。
- 下着姿に近い衣装
- 全身画像を生成したい
これらを踏まえて呪文(プロンプト)を次のように修正して実行してみます。
Prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform,fullbody,epiCRealism
NegativePrompt: epicNegative, underwear
fullbody
を指定しているのにも関わらず全身画像が生成されないです。そのため、呪文(プロンプト)に膝(knee
)を追加して全身画像を生成できるか試してみます。
Prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform,fullbody,knee,epiCRealism
NegativePrompt: epicNegative, underwear
次に解像度を変更してみます。
縦長に変更することで、全身画像が生成されることができました。epiCRealism
で全身画像を生成するには縦長画像にする必要がありそうです。
embeddingsのepiCRealismを消去して検証
横長画像での全身画像の生成が難しいので、原因を調査したところepiCRealismが原因であることがわりました。epiCRealismを使うと背景と構図が固定されがちになることがわかりました。なのでepiCRealismのembeddingsを呪文(プロンプト)から削除して試してみます。
prompt: Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform
Negative Prompt: epicNegative
epiCRealismを削除すると大きく画像の品質が下がってしまうことがわかりました。ひとまず全身画像は生成されるようになったので問題点を解消していきます。生成した画像を見てみると、次のような問題点となります。
- 20歳と指定したのに子供っぽい
- 実写というより3Dやアニメ
- 顔が崩れている
子供っぽいのとアニメっぽくなってしまうのは、DreamShaper7と同様ですね。Stable DiffusionのベースモデルがJapaneseと指定すると、子供っぽくなってしまうのかもしれないですね。それでは、この問題を解決するために次のような呪文(プロンプト)に調整してみます。
prompt:Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of a audience,idol uniform
Negative Prompt:epicNegative,3d,anime,illust,child,ugly face
一旦、呪文(プロンプト)の改善はここまでにして、次は縦長画像で検証していきます。
縦長だと顔の解像度が高くなったたそれなりの品質になっていることがわかります。
教室で、放課後に椅子に座る18歳の制服姿の日本の女子学生
prompt: Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,
Negative Prompt: epicnegative,3d,anime,illust,child,ugly face
そこそこ良い感じにはなっていますね。気になる点としては
- 少し老けている
- 若干、日本人ぽくない
Prompt: Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,Asian,Japanese,epiCRealism
NegativePrompt: epicnegative,3d,anime,illust,ugly face
まだ少し日本人ぽくない印象を受けました。こちらを調査していくと、epiCRealism
が原因になっていることがわかりました。そこでepiCRealism
を呪文(プロンプト)から取り除きます。
Prompt: Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,Asian,Japanese
NegativePrompt: epicnegative,3d,anime,illust,ugly face
微妙な画像はあるものの、良い感じになりました。
以下は、DreamShaper7のときの生成画像です。
これと比較すると、epiCRealismのほうが多様な顔が表現されていて、一応、日本人のような顔立ちになっています。
渋谷の中で写真を撮る20歳のK-POPアイドル
Prompt: Photo of a beautiful 20 years old k-pop idol woman in Shibuya.epiCRealism
Negative Prompt:epicnegative,3d,anime,illust,ugly face,child,
品質は高いですが画角が固定されてしまいっているのでepiCRealismを取り除きます。
Prompt:Photo of a beautiful 20 years old k-pop idol woman in Shibuya.
Negative Prompt: epicnegative,3d,anime,illust,ugly face,child,
かなり良いできな気がします。k-popかKoreanどっちか迷ったので、Koreanにした場合についても試しました。
Prompt:Photo of a beautiful 20 years old Korean idol woman in Shibuya.
Negative Prompt:epicnegative,3d,anime,illust,ugly face,child,
どちらの似たような画像が生成されます。
epiCRealismのコツと落とし穴
epiCRealismのコツをまとめてみます。
- epiCrealismのembeddingsは使うと画角が固定されてしまうので、使わないほうが自由度が高い。使わなくても精度はそれなりに高いので、embeddingsはepicNegativeだけにするのが良い。
- 顔の解像度が低い状況だと顔が崩れがちなので、全身画像を生成する際は縦長にするか解像度をあげるなどの工夫が必要となります。
まとめ
epiCrealismの良い点
- 実写画像を生成しやすい。
- 日本人と韓国人の特徴をとらえらえている。
epiCrealismの苦労したポイント
- 薄着が生成されやすい。
- 構図によっては日本人を生成しづらい。
結論
epiCRealismは、高いクオリティでアジア人女性を生成できるが、たまに微妙なクオリティになることがわかりました。
コメント