OpenAIがChatGPTの画像生成機能「ChatGPT Images 2.0」を日本時間の2026年4月22日に正式リリースしました。ChatGPT Images 2.0は第三者機関のテストで世界ランキングトップのスコアを記録しており、英語以外の言語の文字列描写やプロンプト追従性が大きく向上しているとのこと。ChatGPTの無料プランでも使用可能だったので実際に画像の生成・編集を試してみました。

ChatGPT 画像 | AI 画像生成

https://chatgpt.com/images/

上記のリンクをクリックして画像生成画面を開き、入力欄に画像の説明を入力してから送信ボタンをクリック。今回は「クマがサーモンを食べる漫画。日本語セリフ付きの漫画。『おなかがすいたな』『寿司でも食べるか』『やっぱり寿司はサーモンに限るクマね〜』というセリフを含めること」と入力しました。



1分程度で画像が出力されました。



生成された画像が以下。日本語のセリフが完璧に再現されています。解像度は1196×1315ピクセルで、ファイルサイズは2.24MBでした。以下の画像をクリックすると縮小前のオリジナル画像を確認できます。



画像に続けて編集内容を入力すると、指示通りに編集してくれます。試しに「セリフを縦書きに変更。水墨画風。」と入力すると、白黒の水墨画風に変化し、セリフも縦書きに変化しました。



生成された画像はこんな感じ。



「『冥土の土産のメイドパンチ』という強攻撃スキルを発動するメイドさんのイラスト。3DCGアニメ調のアクションRPGのゲーム画面風で。ゲームのHUDも描写すること」というプロンプトで生成した画像が以下。指示通りにパンチを放つメイドのイラストやテキストが生成されました。「冥土の土産のメイドパンチ」という指示したテキスト以外に「スイーツカタストロフィ」「ご奉仕ヒール」「お掃除スピン」といったシチュエーションに即した技名も盛り込まれています。



続けて、「このメイドさんの『コスチューム選択画面』を生成。『色違いメイド服』『和服』『水着』『サンタコス』などを選択可能」と入力した結果が以下。ゲームのコスチューム選択画面っぽい画像が生成されました。指示の趣旨に合わせて「ゴシックメイド」というコスチュームも追加されているほか、左下にはメイドパンチの技説明も記されています。



さらに続けて「『ゴシックメイド』を着用した状態のメイドさんのイラスト。車をスポンジで洗うシーン。『ゴシゴシ洗うぞゴシックメイド』という縦書きキャッチコピー付きで」と入力した結果が以下。



「実写に変換」と指示するとしっかり実写風になりました。



「自動販売機でジュースを買おうとする男の子の写真。真夏のバス停の横の自動販売機。男の子は半袖半ズボン。サンダルを履いている。高い位置にある炭酸ジュースのボタンを押すために背伸びしているシーン」だとこんな感じ。飲み物の種類は特に指定しませんでしたが、コカ・コーラやファンタっぽいデザインの飲み物が並んでいます。また、コーヒーブランドの「WONDA」のロゴも含んでいます。



「豪雪地帯の写真。『転倒注意』と記された看板が雪に埋もれている。看板をメインに撮影。」実写風の画像をかなり高品質に生成できます。



無料プランだと画像を8枚生成したところで制限に達しました。最初の画像生成から24時間後に制限が解除される仕組みのようです。



有料プランの「Plus」「Pro」「Business」に加入しているユーザーは思考機能も利用可能。思考機能を使うと「1つのプロンプトから複数の画像を生成し、自律的に2重チェックする」「実際に機能するQRコードを生成する」といった操作が可能です。





思考機能を用いて「鉄原子核の構造と説明をお願いします」というプロンプトで生成した画像が以下。非常に丁寧な説明画像が出力されました。



ChatGPT Images 2.0はChatGPTとCodexの全ユーザーを対象にリリースされています。また、「gpt-image-2」というAPI経由でも利用可能です。AIの名前を伏せつつ人間に生成結果の優劣を決めさせる形式のAI性能ランキングサイト「Arena(旧称:LM Arena)」では、gpt-image-2がテキストから画像を生成するカテゴリでNano Banana 2を抑えて1位の座を獲得しています。



画像を編集するカテゴリでもgpt-image-2が1位です。



gpt-image-2で生成する画像の解像度は「1024×1024」「1536×1024」「1024×1536」「2048×2048」「2048×1152」「3840×2160」「2160×3840」「auto」から選択可能。画像1枚当たりの生成コストは1024×1024ピクセルの場合、Lowだと0.006ドル(約0.96円)、Mediumだと0.053ドル(約8.44円)、Highだと0.211ドル(約33.6円)です。



APIの詳細は以下のリンク先で確認できます。

Image generation | OpenAI API

https://developers.openai.com/api/docs/guides/image-generation