画像生成AIの意義と課題について考えてみた!

最近、イラストレーター界隈で1つの話題が延々と議論され続けています。それは「画像生成AIは脅威なのか」というものです。

画像生成AIとは、ユーザーが文字(言葉)やラフ画像で題目を示すと、それに準じた画像を自動生成してくれるというものです。種類はさまざまで、印象派の絵画のようなものからアニメ調のイラストまで、それぞれのAI(描画エンジン)によって得意分野や出力される画像の傾向が若干違います。

問題は、この自動生成された画像の質が今年に入って一気に上がってきたことです。これまでは抽象的且つ曖昧で一般的なイラストレーターが描くような緻密で美しい画像の生成は難しいと思われていたものが、突然「これは美しい」、「これなら普通にかわいい」と思えるほどの絵を創り始めたのです。

ここに危機感を持ったのがイラストレーターです。自分たちの仕事が奪われる、もうイラストレーターは不要なのではないか……そのような意見までが散見されるほどに、議論は白熱しています。

画像生成AIの進化と成長は、技術的特異点(テクノロジカル・シンギュラリティ)の始まりなのでしょうか。それとも単なる思い過ごしなのでしょうか。

感性の原点からテクノロジーの特異点を俯瞰する連載コラム「Arcaic Singularity」。今回は画像生成AIの価値と意味、そして現状の課題について考察します。


画像生成AIは敵か、味方か


■画像生成AIはイラストレーターを殺せない
冒頭で書いたように、画像生成AIには現状一般ユーザーが利用できるものだけでもさまざまな種類が存在します。

芸術的な絵画調を得意とする「Midjourney」や写真のような画像も得意な「Stable Diffusion」、アニメ調のイラストを簡単に生成できる「Waifu Diffusion」、中には「AIピカソ」のようにスマホアプリになっているものもあります(エンジンにはStable Diffusionを使用)。

画像生成AIはもはや一部の実験的な存在ではなく、広く一般にも楽しまれる娯楽要素の強い1ジャンルとして存在しているのです。


スマホで簡単にイラスト作成。時代はここまで来た


ここで問題として挙がってきたのが「イラストレーター不要説」です。AIがここまで進化してしまったら一般的なイラストレーターなど必要ないのではないか、というものです。

結論から言ってしまえば、流石にそれは話が飛躍しすぎているとしか言えません。少なくとも現時点では。

確かに絵を描き始めたばかりの初心者や技術を学んでいる最中の人からすれば「こんなに綺麗な絵は私には描けない」、「私より上手だ」と感じるかもしれませんし、イラストレーター以外の人々も「半端な腕のイラストレーターなんてもう要らないな」と心無い言葉を突きつけるかもしれません。

しかしながら、それは前提を大きく取り違えています。AIは上手なイラストレーターの作品や名画のデータを取り込み、それを学習したことで人並み程度(あるいはそれ以上)に絵を生成できるようになったのです。人がいなければ始まらない道具が人を超えたところで、その後イラストレーターがいなくなれば進化は止まります。


鶏が先か卵が先か


「いずれはAIが生成した画像を元にAIが学習し出すだろう」と言う人もいます。しかしながら、そこにも問題があります。

AIが生成した画像をAIが参照し、学習した結果として生成された画像を参照してまた画像が生成され……と繰り返していくことの無意味さが分かるでしょうか。

そこに人間が介在しない場合、単にAIは劣化し続ける「意味のない絵」を参照し続けるだけの存在になり、いずれは人が理解できない謎の絵を吐き出し続ける存在になります。

仮にそこで人間が「この生成された画像は良い」、「この画像は参考にならない」と評価基準を持って学習させたとしても、やはりそこにはその絵がどのような意味を持って生み出されたのかという「価値」が欠落しています。

例えばリンゴの画像を学習させたとします。しかしAIはリンゴがどうして人々に好まれているのか、人々がリンゴを見て何を想像するのかを理解していません。「リンゴは赤い、丸い、ヘタがついている」という「情報」として集積しているに過ぎません。

その程度の情報しかなく、情報の先にある「想像」ができないAIが作り出したリンゴの画像をまたAIが学習に使用して……と繰り返したなら、恐らくそれはすぐに「リンゴではない何か」に陥ります。少なくとも人が見て「美味しそう」と感じないリンゴになるでしょう。


AIに美味しいリンゴの放つ芳醇な香りという「価値」は連想できない


■意味のない画像を人が「勝手に解釈する」不思議
昨今持て囃される有名な画像生成AIが作り出す「何物でもない何か」の画像に、筆者は不気味さや無感情故の怖さを感じるのです。

人々が美しい、素晴らしいと絶賛する生成画像の細部を見れば、人と衣装が溶け合って境界線がなくなっていたり、人の指が触手のようになっていたり。まるでラヴクラフトが生み出したクトゥルフ神話のイラストを見ている気分です。

何故そのような画像になってしまうのかは、前述の通り「AIが、自分の描く絵の本質を語れないから」に他なりません。絵を描く技術だけが凄まじく高く、人物の構造を知らない素人のイラストレーターのような状況です(実際はもっと酷い)。


AIが生み出す画像は緻密で美しく見えるが、細部はことごとく破綻している


それを確信したCMが1つあります。ネスレがフランスで展開しているブランド「La Laitiere」のTwitter広告で、フェルメールの「牛乳を注ぐ女」をモチーフにした絵(原画ではなくパンがヨーグルトになっている)に、画像生成AIによる絵画拡張を適用していくタイムラプス映像なのですが、そこで拡張された絵画が実に酷いものなのです。

絵が次第に拡張されていくと、そこには観衆やらテーブルの下の子供やらが追加され、風情ある日常を切り取った名画が粗末な舞台劇に置き換わってしまったのです。

それを「AIだからできた新しい解釈だ」と前向きに捉えることもできますが、ではAIが何かを「解釈」して名画を拡張したのでしょうか。結局はAIが学習結果から自動出力した「意味のない拡張」を、人間が勝手に解釈した気でいるだけなのです。


絵を描く技術のみに注目すれば凄まじい技術だが、そこに作家性や主張は欠片もない

■画像生成AIは道具であり手段である
もっと分かりやすく簡潔に言い換えましょう。現在の画像生成AIに漫画は描けません。

漫画はイラストよりもさらに物語性が重要であり、作者が込めたメッセージや思いが読者に伝わるかどうかが重要になるものです。しかしながら現在のAI(と我々が呼んでいる技術)には意志も感情もありません。

それっぽい単語を並べ、それっぽいイメージの絵を並べ、読者に「こんなお話なのかな?」と解釈「させる」ことはできても、AIが何かの意味やメッセージをその漫画に込めることは一切ありません。ただの条件反射と同じです。

そもそも、AI(人工知能)という言葉が誤解を招きます。現在のAIは単なる「機械学習」であり、収集されたデータの統計・解析でしかありません。そこに「知能」はありません。


AIにアメコミ調のイラストは創れても、アメコミの強烈なメッセージ性は創り出せない


単なるイラストであるうちは人を騙せても、漫画になった途端にほとんどの人が気づくはずです。「これは人を置き換えるものではない。人が使う道具だ」と。

AIが生み出す絵の違和感や不気味さは、学習が進めば改善されていくでしょう。だからこそ、現在の画像生成AIは「ただの道具」なのです。人が使いやすく改良していく道具です。敵でもなければ味方でもありません。PCのExcelアプリを指して「あれは敵だ。人の仕事を奪うものだ」と言う人がいるでしょうか(残念ながら稀にいるから現実は恐ろしいが)。

AIが人に何かを解釈させるほどの絵を描けるようになった今、「それを上手に活用する技術」が人々に求められているのです。時にはインスピレーションを得るための道具として、時には簡易なファンイラストを描くお手軽ツールとして。

洗濯機の登場で人々が手洗いの重労働から開放されたように、自動車の登場で経済活動の時間効率が飛躍的に向上したように、画像生成AIはイラストレーターや漫画家の強力な助っ人となるサポートツールです。それ単体で完結するものと考えるのは思考停止でしかありません。


AIがイラストをある程度想像通りに仕上げてくれるなら、イラストレーターはそれを手直ししたり参考にする程度でいい。それが道具の正しい使い方だ


画像生成AIの場合、学習元となるデータの著作権や生成された画像が著作物に酷似していた場合に著作権侵害を訴えられるのか、などといったグレーな問題も山積しており、人の作家性を脅かすという意味ではそちらのほうが問題かもしれません。

そういった法的・感情的な問題はひとまず置いておくとしても、AIが真の意味で自我や意思を持たない限り、それが画像生成であろうが合成音声であろうが自動運転であろうが、それは単なる「道具」あるいは「手段」であると筆者は考えます。


画像生成AI「NovelAI」は、学習元に著作権侵害をしている画像収集サイトの画像を利用していたことで問題になった


■シンギュラリティはまだ見えず。道具に価値を見出だせるのが人の力
いずれは……もしかしたらそれほど遠くない未来かもしれませんが、AIが自我を持つテクノロジカル・シンギュラリティはやってくるでしょう。しかしながら、今はそれを必要以上に怖がるタイミングでもなく、また怖がる意味のない時代です。

AIがどんなに完璧で美しい絵を描いたとしても、「このイラストレーターの絵が好き」という人の想いと、そのイラストレーターの絵に込めた想いを超えることはありません。

もちろんAIの創り出す絵にも需要は生まれると思いますが、それはデジタルイラストというジャンルに、新たな技術による多様性が1つ追加されたに過ぎません。

例えばこの世界に「写真」という技術が登場した時、絵画は衰退したでしょうか。人はそれまで世界を如何に写実的に描くのかを追求し技術を高めてきましたが、世界の姿をそのまま記録してしまう写真はすべての写実的絵画技術と労力を一瞬で置き去りにするものでした。

しかし現実を見てみれば、世界は人の手によるイラストや絵画で溢れています。「ある側面における完璧」だけが人の求めるものではないからです。デフォルメ技術や絵に込める作家性が人を動かし、人を感動させるからです。

一方で、それでは写真が意味のないものかと言えばそんなはずもなく。写真には「現実を記録する」という、とてつもなく重要で貴重な価値が存在します。写真も絵画それぞれが道具や手段としての意味と価値を持ち、人はそれを状況に応じて巧みに使い分けているのです。

画像生成AIもまた、そのように使い分けていく存在であると考えます。むしろ画像生成AIのおかげで作画時間が大幅に短縮でき、素晴らしいイラストを大量生産できるようになるならイラストレーターもファンもWin-Winなのではないでしょうか。


画像生成AIが生み出したイラストに一手間を加え自分なりの絵に仕上げられるのも、絵を描く者の感性と技術の基礎があってこそだ


筆者はかつて美術部に所属し、それなりに賞も頂き、そして自分の感性の限界を知って筆を置いた者ですが、そんな筆者でも「また自分好みの絵が描けるようになるのかな」と、画像生成AIには淡い期待すら持っていたりします。

何かを生み出す仕事がしたくて、しかしながら仕事につながるほどの技術も才能もなくて、ギリギリ仕事として成り立ちそうだった才能が物書きで、今に至るといったところです。

そんな物書きの仕事でも、いつかは必ず「製品紹介程度なら自動文章生成AIで十分」などと言われる時代が来るのでしょう。筆者はそれを忌避しませんし、むしろ歓迎します。

製品紹介をAIがやってくれるなら、筆者はレビュー製品の写真撮影やフィールドテストレビューに専念できるからです。AIには製品の使い勝手や手に持った時の感触までは分かりません。

イラストレーターのみなさん、画像生成AIは敵ではありません。もちろん味方でもありません。ただの道具や手段です。その新しい道具をいち早く使いこなした人が次の時代に生き残るのみです。ぜひ、使いこなしてみせてください。


AIの描いた世界に何か刺激されるものがあったなら、それがあなたの価値であり勝ちだ


記事執筆:秋吉 健


■関連リンク
・エスマックス(S-MAX)
・エスマックス(S-MAX) smaxjp on Twitter
・S-MAX - Facebookページ
・連載「秋吉 健のArcaic Singularity」記事一覧 - S-MAX