近年、文章(プロンプト)を入力するだけで画像を生成してくれるAI「Stable Diffusion」が大きな注目を集めていますが、Stable diffusionは基本的にNVIDIA製のGPUで計算を行うように設計されており、他社製のGPUで計算を行うことは想定されていません。しかしプログラマーのrahulunair氏が開発した「stable_diffusion_arc」が、Intel製のGPUである「Intel Arc」でStable Diffusionを動作させることに成功しています。

GitHub - rahulunair/stable_diffusion_arc: Stable Difussion inference on Intel Arc dGPUs

https://github.com/rahulunair/stable_diffusion_arc

Stability AIが公開している「Stable Diffusion」は、入力した文章(プロンプト)に沿った画像を生成できるAIです。「海辺で遊ぶクマ」や「アイスクリームを食べる少女」などのキーワードから想像以上のクオリティーで画像が生成されます。

Stable Diffusionを使用するにはNVIDIA製のGPUを搭載したコンピューターを用意する必要があるため、当初は使用のハードルが高く、誰でも手を出せるものではありませんでした。しかし、Stable Diffusionはオープンソースでの開発が進められ、比較的低スペックのコンピューターでの動作やCPUだけでの動作、スマートフォン上のアプリで動作させることなどに成功しています。

今回、rahulunair氏はIntel Arc A770の16GBモデルを使用してStable Diffusionを動作させています。

Intel ArcでStable Diffusionを動作させるには、機械学習ライブラリであるPyTorchもしくはTensorFlowが必要です。Intel ArcでPyTorchを使用するには、Intel extensions for PyTorchまたはipexの最新版が必要とのこと。

最初に画像を生成する際には約60秒、それ以降は約30秒必要とされています。

以下はIntel ArcでPyTorchを用いてStable Diffusionを動作させ、生成した画像です。また、この画像のプロンプトは「vivid red hot air ballons over paris in the evening」とのこと。



また、以下の画像はTensorFlowを用いた画像です。プロンプトはPyTorchと同じ「vivid red hot air ballons over paris in the evening」です。



なお、「Intel ArcのセットアップはすべてLinux上で行いました」とrahulunair氏は述べています。