9/16に正式バージョンが公開されたXXMix_9realisticSDXLについてレビューしてみます。XXMix_9realisticSDXLはSDXL(Stable Diffusion XL)でアジア系美女を生成することを目的にしたモデルです。
SDXL(Stable Diffusion XL)をStable Diffusion Web UI(AUTO1111)で使うには最新版である必要があります。また、従来のStable Diffusionよりも多くのリソースを使うため高いスペックの環境が求められます。詳しくは次の記事を参考にしてください。
XXMix_9realisticSDXLのダウンロード
XXMix_9realisticSDXLはCivitaiで公開されています。以下のリンクからモデルをダウンロードしましょう。
XXMix_9realisticSDXLで画像を生成
共通の設定としては以下の通りです。
Sampling Method: DPM++ 2M Karras
Sampling Step: 20
解像度: 1152×832
解像度については公式SDXLの推奨値を参考にしています。詳しくは以下の記事を参考にしてください。
渋谷で20歳のショートカットの女性
- プロンプト:
(8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), 20 years old Japanese woman in Shibuya.short hair, upper body
- ネガティブプロンプト:
paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))
- モデル: xxmix9realisticsdxl_v10.safetensors [a94255c529]
日本人美女になっていることがわかると思います。これがSDXLに比べてどのぐらい向上しているかを確認してみます。モデルをsdXL_v10.safetensors [31e35c80fc]に変えて同じ設定、同じシードで生成してみます。
sdXL_v10.safetensors [31e35c80fc]の生成結果
比較してみるとXXMix_9realisticSDXLの強みがよりはっきりしますね。
- XXMix_9realisticSDXLの方が日本人に近い顔になっている。
- XXMix_9realisticSDXLの方がよりリアルな写真に近い。
- XXMix_9realisticSDXLの方が顔のバリエーションが増えている。
制服姿の女子校生
次に制服姿の女子校生の画像を生成してみます。
Prompt: (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), 15 years old Japanese woman in classroom.long hair, school uniform, upper body
ネガティブプロンプト: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))
XXMix_9realisticSDXLでの生成結果
日本人の女子校生画像が生成されていることがわかります。制服などもちゃんと再現されています。背景の人などの描写がちゃんとしていますね。これはSD v1.5などの従来のStable Diffusionに比べて大きく向上した点です。
sdXL_v10の生成結果
標準のSDXLモデルだとイラストっぽい画像もまぎれて生成されました。。制服が変だったりとXXMix_9realisticSDXLのほうが安定感があります。
韓国人女性も再現
次に韓国人女性の画像を生成してみます。
プロンプト: (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), 18 years old Korean woman in street.upper body
ネガティブプロンプト: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))
XXMix_9realisticSDXLでの生成結果
日本人とは違った特徴の女性が生成されています。韓国人っぽい感じは出ていると思います。
sdXL_v10の生成結果
韓国人女性に関しては公式のSDXLのほうが完成度は高い気もします。
水着美女を生成
次に水着美女を生成してみます。
プロンプト: (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), sharp focus, depth of field, blur background, bokeh, cinematic lighting, soft light, upper body, 20 years old cute woman on the beach.short hair, (white plain bikini: 1.5), smile
ネガティブプロンプト: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))
XXMix_9realisticSDXLでの生成結果
sdXL_v10の生成結果
Refinerの導入でさらに高品質に
若干ですがぼんやりする感じもあるのでRefinerを適用してみました。肌の質感やラインがより滑らかになった印象を受けます。
まとめ
このようにXXMix_9realisticSDXLは品質の高いアジア系美女の実写系モデルとなっております。XXMix_9realisticSDXLの良い点をまとめると次の通りです。
- XXMix_9realisticSDXLの方が日本人に近い顔になっている。
- XXMix_9realisticSDXLの方がよりリアルな写真に近い。
- XXMix_9realisticSDXLの方が顔のバリエーションが増えている。
- 生成される画像の安定度が公式SDXLモデルに比べて高い。
一方で若干ですが、ぼやける部分は課題としてあります。
以上、XXMix_9realisticSDXLの解説でした。今後も注目のStable Diffusionモデルを見つけたら紹介していきます。特にSDXLモデルは日夜、新モデルが登場しているので注力していきます。次回はXXMix_9realisticSDXLに匹敵するアジア系実写系モデルfuduki_mixを解説する予定です。
コメント