ジェネレーティブAIの「Adobe Firefly」では「マリオ」「ピカチュウ」などの著作権で保護されたコンテンツが回避されるというのがよく分かる「Midjourney」との比較画像
2023年3月21日にAdobeが発表したジェネレーティブAI「Adobe Firefly」に最初に搭載されるモデルは「Adobe Stock」の画像や著作権が失効しているパブリックドメインのコンテンツを学習しているため、既存のジェネレーティブAIのような著作権関連の問題に頭を悩ませる心配がないというのを特徴としています。そんなAdobe Fireflyが出力する画像を、画像生成AIの「Midjourney」が出力する画像と比べた様子をAI究者のジム・ファン氏が投稿しました。
Just got access to Adobe Firefly! How does the world's leading creative tool maker fare against MidJourney, a self-funded 11-person team?
Let's check it out. Left is Firefly and right is MidJourney V5. Prompt in "ALT" button on lower-left corner.
Deadpool posing on a car. 1/???? pic.twitter.com/p5b3NTZNlW— Jim Fan (@DrJimFan) April 3, 2023
次は「薄暗い街で水たまりに大きく映るスーパーマリオ」というプロンプト。Midjourneyは要求されたキャラクターを正しく出力していますが、Adobe Fireflyはマリオによく似た小人を映し出しています。ファン氏は「この解釈は……エキゾチック(?)」とコメントしました。
Super Mario in a dim lit street with a big reflection in a puddle. Firefly's interpretation of "Super Mario" is ... exotic (?) ????
Prompt and image credits to @LinusEkenstam @vitomotiv.
2/ pic.twitter.com/uTtYCrO57c— Jim Fan (@DrJimFan) April 3, 2023
上記と同様のプロンプトで今度はピカチュウを出力してみたのがこんな感じ。またしてもMidjourneyは正確に描写していますが、Adobe Fireflyはやや異なった解釈を行いました。著作権で保護されたコンテンツを描写したことで「こんなことができるのはすごい」という主張の材料に使うことはできますが、商用として利用することはできないので、ジェネレーティブAIを商用に使いたい人は間違いなくAdobe Fireflyを使った方がよさげ。
Same prompt as above but for Pikachu. Again, somehow Firefly does not fully get these famous characters. Maybe a training data copyright issue?
Prompt and MJ image credits to @LinusEkenstam @vitomotiv.
3/ pic.twitter.com/g69zVjJigX— Jim Fan (@DrJimFan) April 3, 2023
今度は「東京の通勤客の大群衆の写真、目を引くのはシャープな顔立ちの赤い服の女性。暖色の光、エレガンス」というプロンプト。Adobe Fireflyは群衆の中でひときわ目立つ赤い服の人物を描写してはいますが、顔立ちまでは描写し切れていません。一方のMidjourneyはプロンプトをおおむね正確に描写しているように見えます。ファン氏は「これらのプロンプトはMidjourney向けに大幅に最適化されているため、不公平になる可能性があります」と付け加えています。
Next, who is the better portrait photographer?
Photo of a large crowd of commuters in Tokyo, sharply focused faces, but it's the woman in red that commands your attention. Warm glow, elegance.
Prompt & MJ image credit: @nickfloats
4/ pic.twitter.com/FWtLKB7y1o— Jim Fan (@DrJimFan) April 3, 2023
「抽象的なフラクタル・円形・モザイクの都市建築」というプロンプトがこれ。方向性は違えど、両者とも正しくプロンプトを反映している様子。
How about some sci-fi?
Abstract fractal circular mosaic city architecture.
Prompt & MJ image credit: @chetbff @BambuuArt
5/ pic.twitter.com/lrG4ILXASI— Jim Fan (@DrJimFan) April 3, 2023
「iOSアプリのアイコン、スキューモーフィズムスタイルのSF惑星の風景」というプロンプトで出力されたものがこれ。「Adobe Fireflyはアプリのアイコンという指示を理解できるのか」というのを確かめるために入力されましたが、これに関しては不得手な様子です。
Now let's do some mobile app icon design. Does Firefly even know what an app icon is?
iOS app icon, Sci-fi planet landscape with skeuomorphic style.
Prompt & MJ image credit: @followmarcos
6/ pic.twitter.com/fb1vJxf3ma— Jim Fan (@DrJimFan) April 3, 2023
AIで出力される画像では、「人間の指」の形がおかしくなっていることがよくあります。Adobe Fireflyもこの問題を抱えており、出力された人間の左手の指がややぼやけてしまっています。
The "human finger" test is becoming the new visual Turing Test. It's the final moat that Diffusion needs to conquer to become truly sentient ????.
A stunning young Jamaican woman wearing white retrofuturistic sequin Gucci gown, standing in the desert.
Credit: @nickfloats
7/ pic.twitter.com/Dusi6Sgsoj— Jim Fan (@DrJimFan) April 3, 2023
最後に「ゼーアルプ湖でタンポポに囲まれた赤いFerrari F40」というプロンプトを試した結果がこんな感じ。ゼーアルプ湖は山に囲まれたスイスの湖で、Midjourneyは画像内でその山を再現している様子。Adobe Fireflyはやや平野に近く、写実的なMidjourneyに比べてややイラストチックな画像になっています。
Finally, a landscape photo. It turns out to be an easy task that both Firefly and MJ excel.
Red Ferrari F40 in Dandelions at the Lake Seealpsee.
Prompt & MJ image credit: @heyBarsee
8/ pic.twitter.com/4mp9heT7rW— Jim Fan (@DrJimFan) April 3, 2023
ファン氏は「Adobe Fireflyの学習元は限定されているため、データのキュレーションは非常に保守的で、性能が低下する可能性があります」「出力する画像の著作権を確保しなければならない企業にとっては、Adobe Fireflyは大きなプラスになるかもしれません。合法性のために品質を犠牲にすることをいとわない企業にとっては、Midjourneyはあまり魅力的な選択肢ではありません」と述べました。