2023年3月21日にAdobeが発表したジェネレーティブAI「Adobe Firefly」に最初に搭載されるモデルは「Adobe Stock」の画像や著作権が失効しているパブリックドメインのコンテンツを学習しているため、既存のジェネレーティブAIのような著作権関連の問題に頭を悩ませる心配がないというのを特徴としています。そんなAdobe Fireflyが出力する画像を、画像生成AIの「Midjourney」が出力する画像と比べた様子をAI究者のジム・ファン氏が投稿しました。

以下が「車の上でポーズをとるデッドプール」というプロンプトで出力された画像です。著作権で保護されたキャラクターであるデッドプールは、Adobe Firefly(左)では見た目が似ている何かとして出力されています。一方のMidjourney(右)ではデッドプールが正しく出力されています。





次は「薄暗い街で水たまりに大きく映るスーパーマリオ」というプロンプト。Midjourneyは要求されたキャラクターを正しく出力していますが、Adobe Fireflyはマリオによく似た小人を映し出しています。ファン氏は「この解釈は……エキゾチック(?)」とコメントしました。





上記と同様のプロンプトで今度はピカチュウを出力してみたのがこんな感じ。またしてもMidjourneyは正確に描写していますが、Adobe Fireflyはやや異なった解釈を行いました。著作権で保護されたコンテンツを描写したことで「こんなことができるのはすごい」という主張の材料に使うことはできますが、商用として利用することはできないので、ジェネレーティブAIを商用に使いたい人は間違いなくAdobe Fireflyを使った方がよさげ。





今度は「東京の通勤客の大群衆の写真、目を引くのはシャープな顔立ちの赤い服の女性。暖色の光、エレガンス」というプロンプト。Adobe Fireflyは群衆の中でひときわ目立つ赤い服の人物を描写してはいますが、顔立ちまでは描写し切れていません。一方のMidjourneyはプロンプトをおおむね正確に描写しているように見えます。ファン氏は「これらのプロンプトはMidjourney向けに大幅に最適化されているため、不公平になる可能性があります」と付け加えています。





「抽象的なフラクタル・円形・モザイクの都市建築」というプロンプトがこれ。方向性は違えど、両者とも正しくプロンプトを反映している様子。





「iOSアプリのアイコン、スキューモーフィズムスタイルのSF惑星の風景」というプロンプトで出力されたものがこれ。「Adobe Fireflyはアプリのアイコンという指示を理解できるのか」というのを確かめるために入力されましたが、これに関しては不得手な様子です。





AIで出力される画像では、「人間の指」の形がおかしくなっていることがよくあります。Adobe Fireflyもこの問題を抱えており、出力された人間の左手の指がややぼやけてしまっています。





最後に「ゼーアルプ湖でタンポポに囲まれた赤いFerrari F40」というプロンプトを試した結果がこんな感じ。ゼーアルプ湖は山に囲まれたスイスの湖で、Midjourneyは画像内でその山を再現している様子。Adobe Fireflyはやや平野に近く、写実的なMidjourneyに比べてややイラストチックな画像になっています。





ファン氏は「Adobe Fireflyの学習元は限定されているため、データのキュレーションは非常に保守的で、性能が低下する可能性があります」「出力する画像の著作権を確保しなければならない企業にとっては、Adobe Fireflyは大きなプラスになるかもしれません。合法性のために品質を犠牲にすることをいとわない企業にとっては、Midjourneyはあまり魅力的な選択肢ではありません」と述べました。