画像生成AIの「Stable Diffusion」を手がけるStability AIが2022年11月24日に、機能の追加や改善を行った「Stable Diffusion 2.0」をリリースしました。ところが、このバージョンではアダルト画像や特定のイラストレーターの画風を模倣した画像などが生成しにくくなっていることから、一部のユーザーが憤慨していると報じられています。

Stable Diffusion made copying artists and generating porn harder and users are mad - The Verge

https://www.theverge.com/2022/11/24/23476622/ai-image-generator-stable-diffusion-version-2-nsfw-artists-data-changes

新しくリリースされたStable Diffusion 2.0では、画像を高解像度化する機能や被写体までの距離を識別する能力の強化、AIが生成した画像だということを示す「デジタル透かし」機能の追加など、さまざまな新機能が盛り込まれました。詳細は以下の記事にまとめられています。

画像生成AI「Stable Diffusion」のバージョン2.0が登場、出力画像の解像度が拡大&デジタル透かしを入れられる機能も - GIGAZINE

今回のアップデートでは上記の変更の他に、ヌードやポルノ、セレブなど有名人のリアルな画像、特定のアーティストの作品を模倣した画像の生成といった、これまで物議を醸してきた挙動が改善されています。

この変更に対し、一部のインターネットユーザーからは「モデルがナーフ(弱体化)された」と非難する声が上がりました。

また、AI画像生成のプロンプトとして頻繁に名前が挙がるGreg Rutkowski氏の画風と似た画像を生成するよう指示しても、以前のようにRutkowski氏の画風を模倣したイラストが生成できなくなったことから、公式Discordで「Gregに何が起きたんだ」とこぼすユーザーもいたとのこと。

以下は、Redditユーザーのlkewis氏がStable Diffusion 1.5(左)と2.0(右)で同じプロンプトを使用して生成した画像を比べたものです。

見比べると、確かにRutkowski氏本人の作品に見られる特徴が、Stable Diffusion 2.0ではあまり顕著ではなくなっているように見えます。

この点は、多くの日本人にとって見慣れている「スタジオジブリ(studio ghibli)」をプロンプトに指定した画像を見比べると、よりはっきりと分かります。

Stability AIのCEOであるEmad Mostaque氏は、今回の変更について「このモデルから削除されたアーティストはいません」と述べて、画風を模倣する能力が低下したのは学習データを削除したからではなく、単なる技術的な変更の結果であると説明しました。

一方で同氏は、アダルト画像と子どもの画像を組み合わせることで児童ポルノが生成できる点が問題であると指摘した上で、「オープンモデルでは、子どもとNSFW(下品なコンテンツのこと)を保持することはできません。子どもを排除するか、NSFWを排除するかです」と述べて、Stable Diffusion 2.0からアダルトコンテンツを排除したことを明言しました。