『Stable Diffusion web UI』 9つのモデルで風景画を比較 

せっかく画像生成AIで絵を生成できるんだから、トップ絵もそろそろ変えていきたい。
やっと「モデル」というのがどういうものかが分かったので、色々試したくなります。

「Stable Diffusion web UI」を触っているといつの間にか時間がすぎていて、いまだに新しいゲームを始めれていない。
どうもそんな「つれづれ猫」です

目次

モデルを2.5~3D系のキャラ絵でざくっと比較

chilloutmix

chilloutmixはかなり使用率の高い人気モデルですが、商用利用×だったり、画像使用する際には使用明記が必須
こちらは利用規約が厳しいので、今後はあまりうちのサイトでは使わないかもしれません。

今回は他に、LoraのTifa_meenow_v2を使用。

9つのモデル

今回の主題じゃないのでサラっといきます。


比較方法:Sampling steps50で3枚見て一番出来の良いのを採用。
promptはすべて同一です。
vaeは今回の比較ではvae-ft-mse-840000-ema-prunedを使用しました。


ほとんどのモデルは「Civitai」というサイトで配布されています(検索窓にモデル名を入れると出てくる)が、閲覧注意な画像も多いので注意。
最初に導入したanything4.5と、Counterfeitあたりがアニメ調
特にCounterfeitは今回の比較の中では一番自然なアニメ調でした。
AbyssOrangeMix、FaceBombMix、MeinaMix、KoreanStyle2.5Dあたりは、ややアニメ寄りの2.5D
残りのchilled_re-generic_v2、NeverEnding Dream、faetasticが3D寄りという感じでしょうか。
chilled_re-generic_v2あたりはかなり本家に近い印象です。
あくまでこの1生成に限った評価です

ちなみに、モデルに関しては、以下のサイトから情報を頂いて導入しました。
何も知らない状態だったので助かります。

モデルによってかなり差が出るんですね。
かなり勉強になるサイトなので、時間がある時に読んでいきたいです。

トップ画像を作ってみよう

絵心のない自分なので、今までは「Photock」さんから頂いたフリー素材を使用していました。
素材としては綺麗で使いやすいものが多いのですが、いかんせん種類が少なくて、(フリー)写真ということでシンプルなものしかないのが難点。
なので、今回「Stable Diffusion web UI」で作ってしまおうということです。

この記事を書いた後だと、おそらく変わっていると思います。
「Stable Diffusion web UI」で背景イラストを作るのは楽しくてつい時間を忘れてしまいます(笑)
ちょくちょく気が向いたときに作って変更していきたいと思います。

使用モデルに関しては、今回は「FaeTastic」を軸に考えてみます。
このモデルの特徴としては「質感」をあらわすのが得意だと感じました。
「人物」に使うのもいいのですが、「構造物」「背景」を得意にしてるモデルだと思うので、背景モデルの軸にするにはオススメできそうです(といっても寄稿時はまだ大して使っていませんが)。

「Stable Diffusion web UI」をウェブで調べると、どうしても美少女に関するものばかりが目に付くのですが、「現実にないほど素晴らしい風景」「現実ではありえないファンタジックな風景」という画像を作るのも面白いと思います。
とくに人物だと〇〇に似ているといった問題が出てきますが、風景ならそういう問題はあまりないですから。
風景AI画像も今後需要とか伸びてきそうな気がします。
個人的に昔から「クリスチャン・ラッセン」とか「シム・シメール」の絵が好きなんですよね。
ラッセンの方が有名ですが、シメールの宇宙動物のコントラストが特に好み。

今回のAI画像のお題:水中の城 (FaeTasticモデル)

その他の設定

Sampling method:Euler a
解像度:1200×700
Sampling steps:50
SD VAE:vae-ft-mse-840000-ema-pruned

これね、かなり難しいというか、AIに非現実的な絵を思い通りに書かせるのは難しいですね。
風景画自体があまり話題になっていない気がしますが、実は非現実風景はAIの苦手ジャンルな気がします。

最初の失敗例としてはこんな感じ。

うん、水中なのになぜか下が海(笑)。
これはこれでファンタジックな絵だと思いますが、やはりAI的には水面と建物があったら、建物の下に水面があるのが当然のようです(それはそうですが)。

この絵をみて、「水中の城」という非現実は意外に手ごわいジャンルに思えました。


試行錯誤…

一応3枚連続でそれっぽいのができたのでよしとしましょう!
個人的に結構好みの画風です。

prompt

(((under the ocean))),best quality,insanely detailed,under sea,sunlight,castle,very beautiful  landscape, extremely detailed,amazing landscape,(((bottomless))),(around blue water),photograph,hyper realistic,High angle shot,blue and white,fantasy


negative prompt

lowres,low quality,((sky)),((air)),(( water surface)),ceiling,beach,bottom,((cave))

ひたすらに出て欲しい物、出て欲しくない物を連打しているだけのprompになっています。
prompt作成はまだまだ勉強中。

上記のプロンプトデータをツールに読み込ませるテキスト形式にいれたファイルのダウンロードリンクです。

設定ファイルのダウンロードリンク

下記のツールでファイルを読み込むことで、同じプロンプトが表示され、また任意のpromptの追加や削除が行えます

よかったらもっとカッコイイ絵にしてみて下さい♪
こういう設定ファイルをやり取りできるのはツール作った甲斐がありました。

見せてもらおうか、他のモデルの風景画の力を!

というわけで、ある程度似た傾向の絵が作れるpromptになったと思うので、せっかくなので他のモデルでも試してみましょう。
prompt等の諸条件は同一
同じ設定で3枚描いて、まともに書けたもので勝負します。
基本的に1~2枚ずつ。

facebombmix

うん、意味がわかりません(笑)
というか他の2枚はちょっとアレな女の子が移ってて画像的にNGでした…なぜ。
FaeTasticが素直に風景画ばっかりだったので、油断してたけどネガティブに人物関係を入れないとダメだったかもしれない(いまさら)

koreanstyle2.5D

お、これは割といい感じです。
ただちょっと上の波と下の石ころ(?)が大きすぎて砂場の城というか、あふれるミニチュア感がすこし残念

正統派のこちらに対し、もう1枚気になるのがあったのでそちらも。

どことなく、クリエイティブを感じる(笑)
このモデルは色使いが特徴的ですね。
ちなみにもう1枚は女の子でした(そこまでNGな感じではなかったけれど)。

neverendingDream

お~いいじゃないですか。
ちょっと魚が大きい気がするけども。

こちらももう1枚紹介。

何とも言えないエキゾチックさというか、自分にはない感性のお城なのが新鮮でした。
どこかモチーフになるようなお城があるのでしょうか。
3枚とも風景のみだったので、優等生。

chilledReGenericV2

3Dの女の子に定評のあるchill系はどうでしょうか。

予想外に優等生!
全体的に繊細なタッチですね。
特に上の海面の表現は一番きれいかもしれません。
勝手に女の子を入れてくるかと思ったけれどそんなことはなかった、疑ってごめんなさい。

chilledReGenericV2に関しては、記事寄稿段階ではCivitaiで直接ダウンロードできたのですが、現在は消えているようです。
今後は自分でマージしたものを使う予定です。
ですので、横道にそれますが少し触れておきます。

chilledReGenericV2の入手方法(作成方法)

直接アップロードしていいのかは不安なので、マージ(merge)方法になります。
マージとは、色を混ぜ合わせるように、model同士を混ぜ合わせる作業です。
Stable Diffusion のCheckpoint Mergerタグで行います。
手順さえ理解できれば、作業自体はそこまで難しい物ではありません。

<chilledReGenericVのmerge手順>
①lofi_V1Fp16とcolorful_v13を0.5でマージ⇒「M1(仮)」
Basil_mix_fixedと「M1(仮)」を0.3でマージ⇒「M2(仮)」
③museV1_v1と「M2(仮)」を0.4でマージ⇒chilledReGenericV2

※数値はMultiplier (M)に設定する数値
※lofi_V1Fp16、colorful_v13、museV1_v1に関してはCivitaiのサイトで入手(要無料会員登録)

・lofi_V1Fp16の入手:Civitaiでlofiで検索し、lofi_V1Fp16タグに合わせてから入手

・colorful_v13の入手:Civitaiでcolorfulで検索し、v1.3タグに合わせてから入手

・museV1_v1の入手:CivitaiでmuseV1で検索し入手



参考にさせて頂いたtwitter

詳細な手順を載せてくれているサイト

abyssorangemix

この辺りからは2D絵が得意なモデル群に行きます。
今回は「photograph」「hyper realistic」辺りの実写系promptを採用してるので苦手分野になるかも。

これは…パースとかそういう問題以前に、ただ色々なパーツを寄せ集めただけに見えます。
他の2枚の絵は正直、意味が分からないものでした。
このモデルは2Dのキャラ絵に特化してるのかもしれません。

anything-4.5

おぉ、城というか城塞都市というか、ちょっと作りが分からないけどそれっぽい!
思ったよりちゃんとしたものが出てきて驚きました。

と思ったら他2枚はこんな意味不明なのでした(笑)
この2枚が同じprompt/modelだと思える人は少ないかもしれない…
anythingは描画力というより、風景関係の理解力が発展途上なのかもしれませんね。
よくわからない場合は、似たものを並べておけ、ということなのでしょうか。

meinamix


前衛的芸術性の塊
私からは言うべきことはないです。
ちなみにあと1枚は女の子でした。

Counterfeit

最初のキャラ比較では自然なアニメ絵で、2D絵の強さは感じとれましたが、写実的風景画はどうでしょうか?

うん…期待はしてなかったけど、意味不明なのが出てきました。
残り2枚は女の子でした。

同プロンプトの風景画を比較してみて

やはりというか、2Dキャラ絵の学習と、リアル系の風景画の学習というのは相反するようです。
とはいえmeinamixあたりは、苦手なりに逆に独創性をもって突っ走ってる感があってよかったです。

3D系が得意なモデルは、実写系の風景画も得意ですね。
単純に画風とかだけではなく、風景系promptの理解度の差にも出てるのが面白いところです。

個人的風景画格付け ※あくまで今回の1回の比較結果から
1位:chilledReGenericV2

波の表現、綺麗な光源、promptの理解度のすべてで高性能

2位:FaeTastic

そつなくこなす優等生
今回は比較ベースとしてpromptの作成に使用したので、実は結構いろいろ良い絵が出たりしてます(細かいpromptが違うので採用できませんでしたが)。
風景promptの読み取り性能が高い所為か、ランダム幅が低かったのが少し残念(ほぼいちゃもん)。
あと、chilledReGenericV2という強敵がいたのが敗因

3位:neverendingDream

1枚目の出来はFaeTasticと同等かそれ以上。
安定感不足で、今後の発展次第ではさらに伸びる可能性も。


他に風景に強いモデルを見つけるまでは、この3つをメインに風景画に関しては作っていきたいと思います。
meinamixは絶対違うんだけど、なにか惹かれるものがありますね。

ちなみに今回の画像解像度は1200×700で作りました。
幅1200はサイトの幅に合わせて。
高さ700はサイトとしては高いですが、城という結構上に長い構造物を表す時にある程度の高さは必要という判断です。
最悪後でいい感じにトリミングしようと思っていましたが、結局面倒なのでそのまま使っています。

今回は扱いませんでしたが風景modelとしては「Realistic Vision V2.0」もかなりオススメです。

別の記事で紹介していますので、よかったらそちらもご覧になってみて下さい。


コメント

コメント一覧 (1件)

コメントする

目次