2022年8月に一般公開された画像生成AIの「Stable Diffusion」はNVIDIA製GPUで計算を行うように設計されており、求められるマシンスペックも高いため、ローカル環境で行うには少し敷居が高いところがあります。プログラマーのcmdr2氏が開発した「Stable Diffusion UI」は誰でも簡単にStable Diffusionをローカル環境に導入可能な上に、GPUの代わりにCPUを使って処理を行うことができるので、高性能なGPUを積んでいないマシンでも画像を生成することが可能です。

GitHub - cmdr2/stable-diffusion-ui: A simple 1-click way to install and use Stable Diffusion on your own computer. Provides a browser UI for generating images from text prompts and images. Just enter your text prompt, and see the generated image. Windows 10/11 or Linux.

https://github.com/cmdr2/stable-diffusion-ui

Stable Diffusion UI本体は、上記GitHubのページのREADME.mdの「Installation」にあるリンクからダウンロード可能。今回はStable Diffusion UIをWindows環境に導入するため、「for Windows」のリンクをクリックします。



記事作成時点で、Stable Diffusion UIはZIP形式でGoogleドライブにアップロードされています。「ダウンロード」をクリック。



「このままダウンロード」をクリック。ファイルサイズは222MBです。



ダウンロードしてきた「stable-diffusion-ui.zip」をExplzhなどのフリーソフトやWindowsの標準機能で解凍し、表示されたフォルダをCドライブ直下に置きます。本来はフォルダをどこに置いてもいいそうですが、cmdr2氏は「フォルダのパスは短い方が安定してインストールできるため、CドライブやDドライブ直下にフォルダを置くのを推奨します」と述べています。



フォルダ内にある「Start Stable Diffusion UI.cmd」をダブルクリックして起動します。



コマンドプロンプトが立ち上がり、各種必要ツールを自動でインストールしてくれます。ただし、今回は最後にStable Diffusionのパッケージのインストールに失敗した模様。



そこで、もう一度「Start Stable Diffusion UI.cmd」を起動。



すると、今度はパッケージをすべてインストールし、起動に成功。メインに設定しているブラウザが自動で立ち上がり、「http://localhost:9000」にリダイレクトされ、Stable Diffusion UIにアクセスできるようになります。初期状態ではGPUを使う設定になっているので、CPU生成の設定にするために「Advanced Settings」をクリック。



Advanced Settingsではシード値、生成枚数、生成する画像の解像度、生成ステップ数、ガイダンススケール設定を設定できます。その下の「Use CPU instead of GPU (warning: this will be very "slow")」のチェックを入れます。これでGPUではなくCPUで画像生成処理が行われるようになります。



なお、Advanced Settingsの下にある「Image Modifiers」では、画像生成時に設定できる入力文字列(プロンプト)の例が表示されるので、どんなプロンプトがあるのかわからないという場合にお役立ちです。



中央上部に「Stable Diffusion is ready」と緑色で表示されているのを確認。今回のプロンプトはデフォルトで入力されている「a photograph of an astronaut riding a horse(馬に乗った宇宙飛行士の写真)」にして、「Make Image」をクリックします。



すると、右側に「Fetching」と表示されました。



コマンドプロンプトを確認すると、かなりゆっくりではありますが、画像の生成が行われているのが確認できます。



しばし待つと、「チーン」というSEと共に生成された画像がUI上に表示されました。なお、Windows 10 Pro・Ryzen 5 2600・RAM16GBを搭載した少し古いPCで動かしたところ、1枚の画像を生成するのにおよそ18分30秒かかりました。



生成された画像の右上に表示されている「Use as imput」をクリックすると、生成した画像をもとに新たな画像を生成するimg2imgモードを利用できます。



今度は搭載しているGeForce GTX 1060(VRAM 6GB)を使って生成してみたところ、わずか40秒ほどで1枚の画像が生成されました。画像右上の「Downloads」をクリックすると手元に保存できます。



なお、Stable Diffusion UIのバージョンは記事作成時点で2.05。それでもcmdr2氏によれば「あくまでもベータ版」とのこと。もしインストールや動作で失敗した場合用にトラブルシューティングのページを用意しているほか、Discordでも質問を受け付けているそうです。