AIが自動生成した画像かどうか見破って判別できると自称する複数のツールをテストした結果とは？

2023年6月30日 15時0分

「MidJourney」や「Stable Diffusion」をはじめとする画像生成AIは、まるで実写のような超高画質の画像を生成することが可能です。しかし生成された画像は人間が撮影した画像と見分けが付かず、事実を誤認してしまう可能性があることが問題となっています。そこで、AI研究団体のOpticをはじめとするさまざまな団体が、画像が人間によって撮影されたものかAIによって生成されたものかを自動検出するツールを提供しています。これらの複数のAI検出ツールを使ったテストの結果を、海外メディアのニューヨーク・タイムズが公開しています。

How Easy Is It to Fool A.I.-Detection Tools? - The New York Times

https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html

ニューヨーク・タイムズによると、Opticが公開する「AI or Not」などのAI検出ツールは、高度なアルゴリズムを使用してコンテンツを分析し、微妙なテクスチャやピクセルの違いをピックアップして、AIが生成した画像と人間の写真家が撮影した画像を区別しているとのこと。

ニューヨーク・タイムズは現在のAI検出ツールの有効性を評価するために、100枚を超えるAI生成画像と実際の画像をAI検出ツールに投入し、ツールのテストを行いました。使用されたツールは「AI or Not」のほか、「AI Image Detector」、「Illuminarty」「Hive」「Sensity」の4種が使用されました。

ニューヨーク・タイムズが行ったテストの結果の例が以下。以下の画像はMidJourneyによって生成されたイーロン・マスク氏がロボットとキスをしている画像です。

この画像を5種類のAI検出ツールに投入した結果、AI or NotやHive、Sensityは正しく「AIが生成した画像」と見分けることができたものの、Umm-maybeことマシュー・ブラウン氏によって制作されたAI Image DetectorとIlluminartyは「本物」と判断してしまいました。ニューヨーク・タイムズによると、AI検出ツールは現実的におかしい状況であっても、それを無視して画像のシャープネスやコントラスト、ピクセルの配置方法に異常なパターンがないかを調査しているとのこと。

以下の笑顔を浮かべる修道女の画像はAIによって生成された画像です。

テストの結果、Illuminartyを除く4つの検出ツールが「AIが生成した画像だ」と見抜くことに成功しました。

以下はAIによって生成されたペンタゴンの近くで火災が起こっている画像です。

この画像では、Hiveを除いてすべての検出ツールが「本物の画像」と判断してしまっています。

写真家のデイモン・ウィンター氏によって撮影されたこの画像は、昼間と夜間に同じ場所で撮影された画像を合成したものです。

この画像に対しては、AI Image Detectorを除くすべてのツールが「本物の画像」と見分けることに成功しています。

AIによって生成されたこの画像は、極右的なソーシャルメディアの間で広まり、「図書館で行われた悪魔崇拝の儀式の画像」と主張されてきました。

テストの結果、AI Image Detectorを除く4つのツールが正しく「AIが生成した画像」と判断しています。

日没時にビーチに打ち寄せる波の画像は、「Absolutely Ai」によって生成された画像です。この画像は2023年2月にdigiDirectが主催する写真コンテストで優勝しています。

この画像に対して、AI or NotとHiveは「AIが生成した」と正しく判断できたものの、AI Image DetectorやIlluminarty、Sensityは人間が撮影した画像だとだまされてしまっています。

以下はAIによって生成された、俳優のダニエル・ラドクリフ氏に似た男性の画像です。

この画像では、Illuminartyを除くすべてのツールがAIが生成した画像と正しく判断しています。

以下の画像は写真家のアシュリー・ギルバートソン氏によって撮影された風景写真です。

この画像では、AI or NotだけがAIが生成した画像と判断したものの、その他すべてのAI検出ツールが正しく「人間が撮影した画像」と見分けることに成功しています。

しかし、時には明らかに現実的でない画像であってもAI検出ツールが間違うこともあります。以下の画像はAIによって生成された「巨大なネアンデルタール人が男女の横に立っているようなビンテージ画像」です。

この画像に対しては、すべての検出ツールが「本物の画像」と誤った判断を下しています。Hiveの創設者兼CEOのケビン・グオ氏によると、生成された元の画像から解像度を低下させた画像や、低品質な画像の判断は難しいとのこと。

さらに、Adobeが2023年5月に発表した「生成塗りつぶし」は、AIにより既存の画像の続きを生成できるPhotoshopの新機能です。そんなジェネレーティブ塗りつぶしを使って、ジョー・バイデンアメリカ合衆国大統領の肖像を拡大した画像が以下。

この例では、Sensityを除くAI検出ツールが「本物の画像」と判断してしまっています。

ニューヨーク・タイムズはさらに、絵画に対してもAI検出ツールのテストを行っており、以下の画像はジャクソン・ポロックによって描かれた「Convergence(コンバージェンス)」と呼ばれる絵画です。

Convergenceは、カラフルな絵の具の飛び散りを特徴とする絵画で、AI or Notを除くすべての検出ツールが「人間が描いた絵画」と正しく判断しています。

一方でMidJourneyを用いて生成されたこの絵画は、Convergenceと同様にカラフルな絵の具が飛び散った絵画です。

この画像もAI or Notを除くすべての検出ツールが「AIによって生成された絵画」と正しく判断することに成功しています。

しかし、ほとんどのAI検出ツールが正しく判断できる画像であっても、肉眼ではほとんど見えない微妙なテクスチャーでピクセルの分析を妨害することで、容易にツールをだますことができるとされています。以下の画像はMidJourneyを用いて生成された画像です。

この画像に対してはIlluminartyを除くすべてのツールがAIが生成した画像と正しく判断しています。

しかし、元の画像(左)に対して拡大しないと分からない程度の大きさのピクセルを加工した画像(右)では、AIによって生成された可能性は3.3％だという不正確な結果が提示されました。

ペンシルベニア州立大学の社会的責任人工知能センターのS・シャム・スンダー氏は「ウェブサイトは、バックエンドにAI検出ツールを組み込んで、AIによって生成された画像を自動的に識別し、ユーザーに対して警告や共有方法の制限などを提供する必要があります」と主張しています。またスンダー氏は「AI検出ツールだけが唯一の防御手段になってはいけません。AIを用いた画像を生成する人物は、透かしを作品中に埋め込む必要があります」と述べています。

一方でノースウェスタン大学でコンピューターサイエンスの准教授を務めるニック・ディアコプロス氏は「画像がAIによるものか人間によるものかを判別することは重要ではなく、どのような特徴がAIによって生成された画像か人間によるものかを適切に示すことができるインターフェイスを備えたAIシステムの構築が必要です」と主張しています。

This article frames the challenge as classifying images as “real” or “fake” but that’s the wrong way to think about using AI here. We need AI systems with interfaces that explain to forensic analysts what features are indicative of fakeness or realness: https://t.co/XTLF4pAUat— Nicholas Diakopoulos (@ndiakopoulos) June 28, 2023