Beautiful Realistic Asians v6.0 (BRA 6.0)を徹底調査。v5より改悪された?構図、背景、ポーズごとに比較

Beautiful Realistic Asians v6.0が公開されて、約1ヶ月になります。使ってみた当初は大きな変化を感じず、むしろ改悪されたような気もしていました。ただし、Beautiful Realistic Asians 6.0を使っていくうちに、v5とv6.0はどっちも良い気がしてきました。

いずれにせよほぼ同じ質感のモデルのためこの際、どっちを使うべきかを決めるためにv5とv6.0の徹底比較を行いました。比較方法は構図、背景、ポーズを切り替えて様々なパターンを試してみました。

ちなみにBeautiful Realistic Asians作者は現在、SDXL向けのモデルを開発されていることを踏まえるとStable Diffusion v1.5の最終バージョンになる可能性が高いです。

Im currently preparing and collecting dataset for SDXL, Its gonna be huge and a monumental task. I wanna thank everyone for supporting me so far, and for those that support the creation of SDXL BRA model. Thank you thank you thank you

https://civitai.com/models/25494

モデルのダウンロード

以下のリンクからダウンロードできます。

Beautiful Realistic Asians v6.0

Beautiful Realistic Asians - v6.0 | Stable Diffusion Checkpoint | Civitai
Im currently preparing and collecting dataset for SDXL, Its gonna be huge and a monumental task. I wanna thank everyone ...

Beautiful Realistic Asians v5

Beautiful Realistic Asians - Brav5 | Stable Diffusion Checkpoint | Civitai
Im currently preparing and collecting dataset for SDXL, Its gonna be huge and a monumental task. I wanna thank everyone ...

構図を変えつつ比較

まずは構図を変えて試してみます。得意な構図、苦手な構図がモデルごとにことなるので、v6.0とv5についても差が出ると思い試してみました。正面は得意でもちょっと構図を変えた瞬間使い物にならないモデルもあるのでもっとも大事な指標の1つです。

Prompt:Photo of a beautiful Japanese idol 20 years old woman from below.

Negative prompt: EasyNegative

この呪文(プロンプト)をfrom below→close up→from behind→from below→from above→full bodyの順で変えて調査しています。

こちらが構図によるモデルの比較です。上段がv5で下段がv6.0となります。

全体的にはv6.0のほうがわずかに安定している気はしました。ただしv5のほうがナチュラルでハッキリしている感じなのです。好みによってはv5のほうに軍配があがります。以下は構図ごとの私の評価となります。

  • from side: v5がナチュラルな感じがしました。v6.0は加工された感じの写真になっています。v6.0のほうが顔のバランスが良い気がしますが、少しぼやけたような気もします。(同点)
  • close up: v5がナチュラルでv6.0は加工された感じになっています。v5のほうが顔がハッキリしていて良い気がします。バランスに関しては好みの問題といった感じでしょうか?(同点)
  • from behind: どっちも背後を向いていて、あまり変わらない衣装です。(同点)
  • from below: v5はナチュラルな感じがしますが目が少し歪んでいる気がします。v6.0は加工されている感じはしますが、バランスのとれた顔立ちになっています。(v6.0のほうが良い?)
  • from above: v5はナチュラルな感じがしていて顔のバランスが整っています。v6.0は目が少し歪んでいて人形のような雰囲気になっています。(v5が良い)
  • full body: 全身画像は顔が崩れがちになります。v6.0のほうが若干顔の崩れが小さいと思われます。(v6.0が良い)

RAW Photoを呪文(プロンプト)に追加

次のテーマに行く前に構図についてもう一つ検証してみます。v6.0は加工された写真が生成されやすいので、RAW Photo(無加工の写真)を追加することでどう変わるのか試してみました。

上段がv5で下段がv6.0

Prompt:RAW Photo, Photo of a beautiful Japanese idol 20 years old woman from below.
Negative prompt: EasyNegative

先ほどよりは自然な写真が生成されるようになりました。ただし、まだ加工された感じが残っています。

ポーズを変えつつ比較

次はポーズを変えて調査をしてみます。ポーズをつけると手や足などが増えたり、体が変形しないかを確認したいと思います。また顔が小さくなると、顔が崩れやすくなるため、その際にどのぐらい安定して綺麗な画像が生成できるかを試してみたいと思ってポーズの項目で検証しました。

上段がv5で下段がv6.0

  • looking at viewer: v5がナチュラルでv6.0が加工された写真っぽいですがどちらも顔が整ってます。
  • standing in street: どちらも加工されたような感じになっています。v6.0のほうが背景にボケが入ってたりと写真としの完成度は高い気がしました。(v6.0)
  • sitting on the chair: v5がナチュラルな感じでv6.0が加工された感じになっています。
  • lying on bed: どちらもナチュラルな感じになっている気がします。
  • dancing: v5はナチュラルですが若干目が崩れています。v6.0は加工された感じですが顔のバランスが整っています。(v.6.0)
  • contrapposto: v5がナチュラルな感じでv6.0が加工された感じです。

やはり、安定しているのはv6.0でした。

背景を変えつつ比較

写真のリアリティを出すためには、背景が重要です。モデルによっては背景のバリエーションが少なかったりしていまいち表現できないこともあるので、一通り背景が表現できているかを確認したいと思います。

上段がv5で下段がv6.0

  • in Shibuya: 渋谷の雰囲気が出ています。
  • in classroom: v5.0のほうが教室らしさが出ています。
  • on the beach: どちらも綺麗なビーチです。
  • in park: どちらも公園が表現されています。v6.0のほうがぼかしが強い気がします。
  • in raining: v5.0は雨粒がハッキリしていて、v6.0は被写体にフォーカスされている気がします。
  • in raining: どちらも田舎道が表現されていると思います。

背景に関しては、どちらも同じような精度で表現されています。v6.0のほうが被写体にフォーカスされている印象を受けました。

男性

Beautiful Asian Realistic v6.0 の強みの1つとして男を表現することが得意な点です。これについても検証してみます。

Prompt:Photo of a beautiful Japanese idol 20 years old woman from below.
Negative prompt: EasyNegative

上段がv5で下段がv6.0

男性を生成してみました。ここに関してはv6.0のほうが圧倒的に精度が高いです。

Beautiful v6.0とv5どっちが良いのか?

v6.0のほうがv5よりも安定した画像が生成されるので、迷うのであればv6.0をおすすめします。ただしv5のほうがナチュラルで無加工の写真は得意です。

Beautiful v6.0の強い点:

  • 顔が崩れにくく安定度が高い。
  • 男性の画像生成が得意

Beautiful v6.0の弱い点

  • ナチュラルな画像が作りにくい
  • 顔が若干少しぼやける

ナチュラルな写真が生成できることは、他の実写モデルと比較したときにBeautiful Realistic Asiansの大きな特徴の1つだったので、v5は安定度は低いとは言えまだまだ魅力的な候補の1つです。わたしは加工強めの画像を生成するときはchilloutmix、自然な画像を生成したいときはBeautiful Realistic Asisansのv5が良いかなと思っております。

コメント