web uiの使い方

画像を生成してみる

プロンプト

ネガティブプロンプト

サンプリング方法

サンプリングステップ

サイズ変更の方法

画質を上げてみる

一度に大量の画像を生成する

生成回数

同時生成

同じ画像を生成する

この記事はweb uiの環境を構築している前提で書いています

もしまだ環境を構築していない場合は簡単に環境構築できるのでMacの場合は以下の記事を参考に構築してみてください

M1 / M2でstable diffusionを動かす

画像を生成してる

まずはwebuiを起動します

起動はwebui.shかwebui-user.batを実行するだけです

起動したらブラウザーを立ち上げてlocalhost:7860にアクセスします

http://localhost:7860

アクセスしたら以下のようなUIが立ち上がるはずです

それでは画像を生成しましょう

プロンプトを入れる

Prompt (press Ctrl+Enter or Alt+Enter to generate)にプロンプトを入れて生成します

二つテキストエリアがありますが一番上にあるやつです

試しに適当なプロンプトを入れて生成してみましょう

プロンプトは英単語を繋げて作ります

例えば猫耳の少女を作りたい場合は以下のように書きます

1girl, anime, (nekomimi: 2), blue hair, short hair,

これで生成してみましょう

生成にかかる時間はpcの性能や設定によって異なりますがデフォルトのモデルと設定を使っていると1分以内には生成されるはずです

info

内臓グラボの48gb memoryでも3分くらいで生成できます

M2 Pro Macbook Proの32gb memoryでは３０秒程度で生成できます

ネガティブプロンプト

先ほど入れたプロンプトはポジティブプロンプトと言われるものです

そのしたにもう一つテキストを入れる場所があります、それはネガティブプロンプトを入れるものです

ポジティブプロンプトはどのような画像を生成したいかを入れるところで、その逆の生成したくない画像を入れるのがネガティブプロンプトです

一見、特に入れる必要がないように思いますが、実はそんなことはなく、入れておいたら画像のクオリティが上がります

ネガティブあり

ネガティブなし

見比べてみてどうでしょうか、確実にクオリティがアップしています

上の画像に入れたネガティブプロンプトはシンプルなものです

worst_quality, lowres, blurry, watermark, disfigured, unnatural,

たった一行だけでしたが効果はあったようです

サンプリング

サンプリング方法は画像からどのようにノイズを除去するかの方法です

基本的にはDPM++2M Karrasを使っていたら問題ないでしょう

画像の質を上げる

画像の質を上げる方法の一つにサンプリングステップを上げるという方法があります

技術的に言えば、これはノイズを除去する回数ですが、簡単にいうと

1分で描いた絵、1時間で描いた絵見たいな感じです

値が高い方がクオリティの高い絵ができますが何事にも限度はあります、あげすぎると逆に下手になってしまいます

1時間で描いた絵より1週間で描いた方がうまく描けますがが100年で描いた一枚の絵はどうでしょう?

そういうことです

試しに比較してみましょう

ステップ数によってどのくらい変わるのか試してみたところ、劣化こそしなかったもののステップ数が50を超えたあたりから変化が見られませんでした、そのことから例外はありますが大体30ステップあたりがいいのではないでしょうか

10steps

20steps

50steps

150steps

1000steps

ちなみに、ステップを増やすとその分必要な時間も増えます

20ステップでは30秒程度せ生成できますが1000ステップになると20分程度必要になってきます

時間とクオリティはトレードオフの関係になっています

サイズ変更の方法

デフォルトでは 512X512 ですがサイズを変えることもできます

サイズを変えることはただ単純に画像の大きさを変える以上の意味を持ちます

例えば512X512だとキャラが全身ではなく、太ももより上が生成されると思いますが

600X800などの縦に長いサイズだと全身が生成されたりします

1920X1080だと背景が強調された画像がよく生成されます

たかがサイズですが、されどサイズです、一度考えてみてもいいかもしれません

よく使われるサイズは以下の通りです

W: 512 , H: 512

W: 600 , H: 800

W: 1920, H: 1080

一度に複数枚の画像を生成する

サイズ変更の横にBatch countとBatch sizeがあります

Batch countは単純に複数枚生成するだけですが、Bath sizeは同時に複数枚を生成します

つまり単純計算で2倍の速度で生成できるわけです

ただしデメリットもあります、それはより多くのリソースが必要だということです

簡単にいうとPCの性能1枚を生成できる以上にある必要があります

そのためよく使うのはBatch countです

同じ画像を生成する

生成する画像は毎回ランダムですが、時には同じ画像を生成したい時もあるでしょう

例えばモデルのテストだったり、プロンプトのテストだったり、そんな時に便利なのがseedです

同じseedで設定も同じだった場合は完全に同じ絵が生成されます

サイコロのボタンを押すと-1になりますが-1はランダムという意味です

リサイクルボタンを押せば直近に生成した画像のseedを見ることができます、これで偶然いい画像が生成できた時にさらに微調整ができるようになります

Extraにチェックを入れることでさらにカスタマイズできますが今回は割愛します

次にやること

今回生成した画像を見てどうでしょうか

人によってはクオリティが低いと感じるでしょう

プロンプトや設定が悪いのかもしれませんが一番はモデルでしょう、どんなに設定を頑張ったとしても、モデルには得意不得意があるので苦手なことをやらしても、あまり上手な絵を生成することができません

例えば僕が普段使っているモデルとstable diffusionのデフォルトのモデル、つまりオリジナルのモデルとを比較してみたのが下の画像です

lorama-zifp16

v1-5-pruned-emaonly

この二つの画像はほぼ同じ設定とプロンプトで生成していますが明らかにクオリティに違いが出ています

なぜそんなにも違いが出るのか、それは学習元画像が大きく影響しています

左のlorama-zifp16はもとを辿れば右のモデルと同じですが、右のモデルを更にイラストに特化して学習させています

そのため、lorama-zifp16で人以外を書くことは難しいのですが、人に関して言えば本家を大きく超える性能を出しているのです

クオリティを上げる方法は色々ありますが、まずはベースとなるモデルを選定するのが一番近道と言えそうです

「モデルをどう選んでいいかわからない」「モデルをどこでダウンロードできるのか知りたい」などありましたら以下の記事を参考にしてみてください

無料でダウンロードでき、なおかつ簡単なので、すぐにクオリティの高い画像を生成できるようになるはずです

高クオリティの画像が作れるモデル