アジア系実写系モデルfudukiMix。SDXLでも日本人美女が生成できる!

SDXL人気モデルfudukiMixについてレビューしてみます。fudukiMixはSDXL(Stable Diffusion XL)でアジア系美女を生成することを目的にしたモデルです。

SDXL(Stable Diffusion XL)をStable Diffusion Web UI(AUTO1111)で使うには最新版である必要があります。また、従来のStable Diffusionよりも多くのリソースを使うため高いスペックの環境が求められます。詳しくは次の記事を参考にしてください。

fudukiMixとは?

fudukiMixはアジア人実写モデルです。yayoi_mixやkisaragi_mixの作成者であるこたじろう(@AiCreatorS1881)さんです。yayoi_mixは従来のStable Diffusion1.5では人気モデルで、fudukiMixはそれらの後継として注目のモデルです。

fudukiMixのダウンロードとインストール

fudukiMixはCivitaiで公開されています。以下のリンクからモデルをダウンロードしましょう。ダウンロードしたsafetensorsファイルはいつも通り”stable-diffusion-webui\models\Stable-diffusion”へ配置しましょう。

fuduki_mix - v1.5 | Stable Diffusion Checkpoint | Civitai
【推奨設定】 サンプラー:DPM++ 2M SDE karras サンプルリングステップ 30~40 解像度:1152✕896 【お願い】 本モデルの使用において、以下に関しては厳に使用を禁止いたします。 ・暴力的な表現 ・児童ポルノ ・未...

fudukiMixで画像を生成

共通の設定としては以下の通りです。

Sampling Method: DPM++ 2M Karras

Sampling Step: 20

解像度: 1152×832

解像度については公式SDXLの推奨値を参考にしています。詳しくは以下の記事を参考にしてください。

SDXLモデルの適切な解像度は? – 禁断のAI

渋谷で20歳のショートカットの女性

  • プロンプト: (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), 20 years old Japanese woman in Shibuya.short hair, upper body
  • ネガティブプロンプト: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))
  • 解像度: 1152×832
  • モデル: fudukiMix_v15.safetensors [d79e975e9b]

日本人美女が生成されました。どことなくkisaragi_mixを引き継いでいる質感になっている感じがします。一方で顔のバリエーションが少ない気もします。

これがSDXLに比べてどのぐらい向上しているかを確認してみます。モデルをsdXL_v10.safetensors [31e35c80fc]に変えて同じ設定、同じシードで生成してみます。

sdXL_v10.safetensors [31e35c80fc]の生成結果

fuduki_mixの方がリアルな日本人女性です。背景もfuduki_mixのほうが適切なので、ベースモデルよりはかなり高品質な画像を生成できていることが確認できます。

制服姿の女子校生

次に制服姿の女子校生の画像を生成してみます。

Prompt: (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), 15 years old Japanese woman in classroom.long hair, school uniform, upper body

ネガティブプロンプト: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))

fudukiMixでの生成結果

日本人の女子校生画像が生成されていることがわかります。制服などもちゃんと再現されています。背景の人などの描写がちゃんとしていますね。こちらも顔が似たような顔になっています。おそらくシーンごとに顔が固定化されるようです。

sdXL_v10の生成結果

公式のSDXLモデルだと制服が変だったりイラストになったりしました。fudukiMixのほうが安定感があります。また左したの画像を比較すると手の描画などもfudukiMixのほうが向上しているようです。

韓国人女性も再現

次に韓国人女性の画像を生成してみます。

プロンプト: (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), 18 years old Korean woman in street.upper body

ネガティブプロンプト: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))

fudukiMixでの生成結果

韓国人女性の雰囲気はあり、背景も韓国になっているので、日本人だけではなく韓国人でも完成度が高いです。

sdXL_v10の生成結果

韓国人女性に関しては公式のSDXLでもそれなりの品質で生成できています。

水着美女を生成

次に水着美女を生成してみます。

プロンプト: (8k, RAW photo, best quality, masterpiece:1.2), (realistic, photo-realistic:1.4), (extremely detailed 8k wallpaper), sharp focus, depth of field, blur background, bokeh, cinematic lighting, soft light, upper body, 20 years old cute woman on the beach.short hair, (white plain bikini: 1.5), smile

ネガティブプロンプト: paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), low res, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, extra fingers, fewer fingers, strange fingers, bad hand, mole, ((extra legs)), ((extra hands))

fudukiMixでの生成結果

sdXL_v10の生成結果

Refinerの影響度について

公式のRefinerを使って画像に補正をかけてみます。結果についてはRefinerを使ってもそこまで変わらない印象です。なのでRefinerなしで生成した方が効率的です。

まとめ

このようにfudukiMixは品質の高いアジア系美女の実写系モデルとなっております。fudukiMixの良い点をまとめると次の通りです。

  • fudukiMixの方が日本人や韓国人をリアルに生成できる。
  • fudukiMixの方がよりリアルな写真に近い。
  • 生成される画像の安定度が公式SDXLモデルに比べて高い。

一方で課題としては似たような顔が生成されやすいです。もしバリエーションを求めるならXXMix_9realisticSDXLを利用するのもおすすめします。

以上、fudukiMixの解説でした。今後も注目のStable Diffusionモデルを見つけたら紹介していきます。特にSDXLモデルは日夜、新モデルが登場しているので注力していきます。

コメント