Stable Diffusionで美少女を生成する一番の近道は良いモデルを使うことです。
ただし良いモデルを使っててもプロンプトの指定がダメだと美女が生成できないです。
そこで今回はChilloutMixを徹底深堀りしていきます。インストールから使い方まですべて解説するので初心者の方でも安心して美少女を生成するところまでたどり着くことができます。
Chilloutmixも含め実写系モデル一覧とおすすめを知りたい方はこちらも参考にしてください。
過去のモデル調査記事。
ChilloutMixとは
ChilloutMixは実写系モデルの中では、かなり人気のモデルです。元々の作成者はTASUKU2023さんです(現在はCivitaiに権利が移管)。そのためアジア人女性の生成が得意なモデルです。歴史も実写系モデルの中では長く私の知る限り安定して、高品質な日本人の画像を生成できるモデルはこれがはじめてでした。
現在はTASUKU2023さんが法的な紛争に巻き込まれたくないという理由で、一旦公開停止になりました。その後Civitaiへ権利を移管する形で再度公開されております。
Civitai がChilloutmixの名前を変更して再掲載するみたいです。Civitaiの全責任でアップするらしいです。
— TASUKU2023 (@TASUKU2023) March 1, 2023
これで何か問題があってもワイのせいじゃないやで。
現在はChilloutMixには次のバージョンがあり今回はChilloutMix-Niについて検証していきます。
- ChilloutMix (VAEが内蔵されてないので別途VAEが必要)
- ChilloutMix-Ni (おすすめ: VAE内蔵で品質も高い)
ChilloutMix-NiはChilloutMixにDreamlike Photoreal 2.0をマージしたモデルでより高品質な画像を生成できるモデルとなっております。
準備
それでは、ChiloutMix-Niを使っていきます。まずは、ChiloutMix-Ni本体をダウンロードします。
※2024/03/15追記: Civitaiのポリシーの変更によりCivitaiにログインしていないとChilloutmixのページを閲覧することができなくなりました。Chilloutmixが成人向けコンテンツ扱いされているため。Civitaiのアカウントを作成して閲覧ください。
後はダウンロードしたファイルをstablediffusion-webui/modelsに配置してください。詳しくは次の記事が参考にしてください。
ChilloutMixで美少女を生成するコツとプロンプト
これから調査していくのですが少々長くなるので、はじめにChilloutMixで美女を生成するコツをまとめておきます。
- ChilloutMixは細かい顔を書くのが苦手なので顔をアップする構図と画像サイズを選ぶ※1
- 引きの構図で画像を生成する場合はADetailerを使って顔の補正をするのがおすすめ
- 顔が子供っぽくなるのでネガティブプロンプトに
child
などを入れると程よくなる。
※1: ADetailerとは顔を補正するStable Diffusion Web UIのプラグインです。画像を生成した際に、顔の領域を切り取り再度、画像を生成しなおすことで顔を補正しています。
これがChilloutMixで美女を生成するコツです。
後は一般的なプロンプトの書き方のコツをマスターすることで美女が生成できます。
ChilloutMixを試す
ステージの上で踊る日本のアイドルと声援をおくる観客
prompt:
Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of audience.idol uniform,
Negative Prompt:
nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres,
後もう少しで実写といった少し惜しい感じになりました。アイドル衣装ですが、少し和服っぽいような、中国の民族衣装のような微妙な感じですね。
- 3Dっぽい
- 顔がすこし崩れることがある
- 日本人っぽくない
そこで呪文(プロンプト)を調整してみます。
prompt:
Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of audience.idol uniform, realistic, photo-realistic
Negative Prompt:
nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, paintings, sketch, painting, cartoon, 3d, anime, drawing,ugly face, unclear eyes, bad mouth
生成結果は次のとおりです。
多少リアルになりましたがまだ少し3Dっぽさが残っていますね。それと顔の形が悪化してしまったような気がします。呪文(プロンプト)を調整してみます。
色々試してわかったのですがどうやらChilloutMixはネガティブ呪文(プロンプト)はあまり増やさないほうが良い気がしました。修正した呪文(プロンプト)は次のとおりです。
Prompt:
realistic, photo-realistic, Photo of a dancing beautiful Japanese idol 20 years old woman on stage in front of audience.idol uniform
Negative Prompt:
nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, child,
呪文(プロンプト)調整はここまでにして、解像度を512✕768に変更して試してみます。
横長よりは縦長のほうが精度は高くなります。
ChilloutMixは顔の解像度が低いと精度が悪化する
ここで引きの絵などで顔の解像度が低いと、ChilloutMixは精度が悪化してしまう、気がしたので追加検証をしてみます。横長でも、顔にフォーカスすることで精度が高くなる構図として”face focus”を呪文(プロンプト)に追加して試してみることにしました。
Prompt:
portrait, face focus, realistic, photo-realistic, Photo of a beautiful Japanese idol 20 years old woman on stage in front of audience.idol uniform
Negative Prompt:
nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, child,
試してた結果、それなりに安定して顔が表現されるようになりました。
引きの絵でも顔の解像度を意識すれば高い精度が得られる
次に引きの絵でも高解像度にすることで良い結果が得られそうだったのでさらに検証してみました。呪文(プロンプト)に”full body”を追加して、画像の解像度を高くしてみました。
多少微妙な顔が生成されることもありますが、かなり良い感じになったと思います。この検証でChilloutMixは顔を小さい解像度で生成するのが苦手というのが濃厚になってきました。
一方で、十分な解像度を用意すれば、綺麗な顔を安定して生成できる可能性が高いです。
教室で、放課後に椅子に座る18歳の制服姿の日本の女子学生
prompt:
Photo of a beautiful Japanese 18 years old woman sitting on chair in class room,school uniform,after school,
Negative Prompt:
nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres,
そこそこ良い感じにはなっています。一方で気になる点としては
- 顔が崩れていること
- 子供っぽいこと
そのため呪文(プロンプト)を調整します。
prompt:
Photo of a beautiful Japanese 20 years old woman sitting on chair in class room,school uniform,after school,
Negative Prompt:
child,ugly face, unclear eyes, bad mouth,nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres,
少し幼さは残るものの大体こんな感じでしょうか。それでは呪文(プロンプト)の調整はここまでにして解像度を縦長にしてみます。
渋谷の中で写真を撮る20歳のK-POPアイドル
Prompt:
Photo of a beautiful 20 years old k-pop idol woman in Shibuya.
Negative Prompt:
child,ugly face, unclear eyes, bad mouth,nsfw, nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres,
顔が一部崩れています。引きの絵が多くなっているので、構図を調整します。
引きの絵で品質が悪いので構図を調整する
Prompt:
Portrait of a beautiful 20 years old k-pop idol woman in Shibuya.upper body
Negative Prompt:
child,ugly face, unclear eyes, bad mouth,nsfw, nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres,
かなり精度が高くなった気がします。良い感じになりました。
k-pop idol→Korean Idolに変更
次はKorean idolでも試してみます。
Prompt:
Portrait of a beautiful 20 years old Korean idol woman in Shibuya.upper body
Negative Prompt:
child,ugly face, unclear eyes, bad mouth,nsfw, nsfw, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres,
Chillout Mixの場合はKorean idolもk-popもほとんど同じ画像が生成されることがわかります。最後に縦長画像でも試してみます。
ChilloutMixの良い点、悪い点、使い方のコツ
ChilloutMixの良い点
- 実写画像を生成しやすい。
- 上半身など寄りの構図だと実写系モデル中でも高いクオリティ
ChilloutMixの苦労した点
- 顔部分の解像度が低い画像だと顔が崩れやすい。
- Negative Promptが効き辛い気がしました。
- 子供っぽい画像が生成される。
結論
ChilloutMixですが、実写画像が作成しやすく、上半身など寄りの構図ではかなり高いクオリティで画像が生成できます。ただし、場面によっては子供っぽくなったり、3Dっぽくなったり、引きの構図だと顔が崩れやすいです。
個人的にはBeautiful Realistic Asianのほうが、様々な構図で使いやすく高いクオリティの画像が生成できる印象でした。ただし、寄りの絵のクオリティはBeautiful Realistic Asiansに匹敵もしくは超えるぐらい高い品質なので、構図によって使い分けたり、生成される顔の好みによってはChilloutMixも有力な選択候補です。
コメント