どの画像生成AIがプロンプトに忠実な画像を生成できるのか分かる「GenAI Image Showdown」

複数のAI企業や団体が画像生成AIを開発しており、どの開発者も自身が開発した画像生成AIの性能の高さをアピールしています。「GenAI Image Showdown」は複数の画像生成AIに同じプロンプトを入力した結果をまとめたウェブサイトで、どの画像生成AIがプロンプトに忠実な画像を生成できるのかが一発で分かります。
GenAI Image Showdown
https://genai-showdown.specr.net/

「9個のトンガリがある星のデジタルイラスト」というプロンプトだと、「FLUX.1 [dev]」「Midjourney V7」「4o Image Generation」の3種が正しい画像を生成できました。

「5色のキューブを含むレイトレーシング画像。赤色のキューブは青色キューブの上に積み重なる。青色キューブは緑色のキューブの上に積み重なる。緑色キューブは紫色のキューブの上に積み重なる。紫色キューブは黄色のキューブの上に積み重なる。つまり、上から順に赤、青、緑、紫、黄の順番である。キューブは部分的に半透明でガラス製である」というプロンプトの場合、「Midjourney V7」以外の5種で正しく生成できました。

迷路を生成しつつ、迷路の正解ルートも示すように指示すると、「4o Image Generation」のみが正しく生成することに成功。

「小さい素数から順に20個の素数で構成された20面ダイス」というプロンプトだと、すべての画像生成AIが生成に失敗しました。

合計12個のテストの結果をまとめたグラフが以下。最も正答率が高かったのは「4o Image Generation」で、その後に「Imagen 3およびImagen 4」「FLUX.1 [dev]」「Gemini 2.0 Flash」「Hunyuan Image 2.0」「Midjourney V7」が続きました。
