どの画像生成AIがプロンプトに忠実な画像を生成できるのか分かる「GenAI Image Showdown」

2025年5月30日 19時0分

複数のAI企業や団体が画像生成AIを開発しており、どの開発者も自身が開発した画像生成AIの性能の高さをアピールしています。「GenAI Image Showdown」は複数の画像生成AIに同じプロンプトを入力した結果をまとめたウェブサイトで、どの画像生成AIがプロンプトに忠実な画像を生成できるのかが一発で分かります。

GenAI Image Showdown

https://genai-showdown.specr.net/

6種の画像生成AIに「スパイク付きのヘルメットを着用した2人のプロイセン兵士が向かい合い、金属製のリングを互いのヘルメットのスパイクに向けて投げ合うゲームをしている」というプロンプトを入力した結果が以下。AIの種類は左上から順にBlack Forest Labsの「FLUX.1 [dev]」、Googleの「Gemini 2.0 Flash」、テンセントの「Hunyuan Image 2.0」、Googleの「Imagen 3およびImagen 4」、Midjourneyの「Midjourney V7」、OpenAIの「4o Image Generation」です。Imagen 3とImagen 4がひとまとめになっているのは、両者の結果に有意な差が見られなかったからとのこと。6種の画像生成AIのうち「FLUX.1 [dev]」「Imagen 3およびImagen 4」「4o Image Generation」の3種がプロンプト通りの画像を生成することに成功しました。

「9個のトンガリがある星のデジタルイラスト」というプロンプトだと、「FLUX.1 [dev]」「Midjourney V7」「4o Image Generation」の3種が正しい画像を生成できました。

「5色のキューブを含むレイトレーシング画像。赤色のキューブは青色キューブの上に積み重なる。青色キューブは緑色のキューブの上に積み重なる。緑色キューブは紫色のキューブの上に積み重なる。紫色キューブは黄色のキューブの上に積み重なる。つまり、上から順に赤、青、緑、紫、黄の順番である。キューブは部分的に半透明でガラス製である」というプロンプトの場合、「Midjourney V7」以外の5種で正しく生成できました。

迷路を生成しつつ、迷路の正解ルートも示すように指示すると、「4o Image Generation」のみが正しく生成することに成功。

「小さい素数から順に20個の素数で構成された20面ダイス」というプロンプトだと、すべての画像生成AIが生成に失敗しました。

合計12個のテストの結果をまとめたグラフが以下。最も正答率が高かったのは「4o Image Generation」で、その後に「Imagen 3およびImagen 4」「FLUX.1 [dev]」「Gemini 2.0 Flash」「Hunyuan Image 2.0」「Midjourney V7」が続きました。

みんなの感想は？

どの画像生成AIがプロンプトに忠実な画像を生成できるのか分かる「GenAI Image Showdown」

外部サイト

ランキング