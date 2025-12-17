ChatGPTで人物画像を生成、写真に合わせて合成しているところ Photo: かみやまたくみ

隠し球だったんですよね？ そうであってください。

2025年12月17日、OpenAIがChatGPTのアップデートを発表、今回は画像生成能力が大幅にアップしました。今までより格段に美しい画像が生成できるようになるとともに、「変えない欲しい部分をいじらずに画像を編集する能力」を獲得。画像をアップロードしてその上にいなかった人物を描き足したりするのもお手の物です。「ユーザーのイメージ通りの画像を作る能力」が劇的にアップしました。

このアップデートは既にChatGPTに反映されており、メニュー欄に新設された「Images」という項目から使えます。こちらのリンクからも飛べます。

メニュー欄の「Images」（赤枠）をタップすると、画像生成専用画面へ。下部に表示されるチャット欄に指示を打ち込み、画像をアップするなどして使います。 Image: かみやまたくみ

このアップデートで重要なのは、これが最近、高性能と評判が高いGoogleのAI｢Gemini（ジェミナイ）｣への対抗策であることです。先日、OpenAIはGoogleへの危機感を募らせ｢AI業界のトップ｣であり続けるために開発計画を変更、ChatGPTのテコ入れを決定したと報じられました。先週にはその通りにGPT-5.2がリリースされ、推論能力などが向上しています。

このアップデートはそれに次ぐ第2弾で、非常に力の入ったものとなっています。Geminiは画像生成面でChatGPTをかなり上回っていましたが、その差はほとんどなくなった気がします。ChatGPTはさまざまな面で「業界トップ」に相応しい水準を取り戻したのではないでしょうか。

細かい部分まで思うまま

今回のアップデートの内容を若干詳しくまとめます。GPT Image 1.5という新しい画像生成AIモデルを利用するようになっており、その結果として以下のような感じになっているとのこと。

- より強力な指示理解 - 精密な編集機能 - 細部の再現性向上 - これまでの4倍の速度

で、これらの進化ははっきりと実感できます。めちゃくちゃ性能が伸びてます。ChatGPTとGoogle Geminiに同一の入力をした結果を比較してみるとわかりやすかったです（以下のテストはすべて、双方課金プランで行っています）。

例1：写真を映画のワンシーンっぽくするのうますぎ

以下の例は、手持ちの写真をアップし、そこに架空のキャラクターを追加してみたものですが、指示理解能力の高さ・細部まで緻密に編集する能力を確かに感じました。プロンプトにご興味がある方は、実際の会話上でご覧ください。

元画像。これを背景として使います Photo: かみやまたくみ

ChatGPTの新しい画像編集機能で人物を追加、映画っぽいフィルターをかけてもらったもの Photo: かみやまたくみ, generated/edited with ChatGPT (GPT Image 1.5)

ChatGPTの出力はハイレベルです。男性はサイボーグという設定で、よく見ると目の部分がメカっぽくなっています。服装や小物のカメラも指定通り、かつかっこいい。ディテールまできちんとこだわれている。後から描き足したのに、背景ともしっかり馴染んでいます。

背景（神社の境内の写真）がほとんどそのまま維持されているのも注目に値します。ベースとなるイメージを崩さずに、そこに新しいイメージを付け加えられるのです。使いやすく、想像力を広げて自分好みのビジュアルを生み出しやすくなっています。

映画っぽい雰囲気作りのためにそれっぽく色などを調整するように依頼していますが、これもすごいですね。Geminiで生成した例が今ひとつだったので、それと比べるとすごさがわかりやすいと思います。

同じことをGeminiの画像生成機能（Nano Banana Pro）でやってみた結果。実際の会話はこちら（人物描写の関係で、ChatGPTと完全に同じ流れではありません） Photo: かみやまたくみ, generated/edited with Gemini (Nano Banana Pro)

Geminiも元画像を尊重し、またいい感じの構図・造詣で人物を追加できていますが、最終的な雰囲気はChatGPTが上ではないでしょうか。もちろん、題材との相性もあるのでこれで一概にChatGPTが上になったとまでは言えないのですが、ChatGPTが相当なレベルに達した感じがしました。

日本語のテキストは変になりやすい

日本人として気になるのが「日本語を綺麗に描けるか」です。日常的に使うとなると、ここはできて欲しいのですが…結果としては「短いテキストほど綺麗に描写できるっぽい」という感じでした。

Geminiと比べてどっちが優秀かについては、テキストの長さや生成内容によってケースバイケースな印象でした。日本語のフォントが綺麗に出やすいのはGeminiですが、変な要素が生えたりすることもあって単純な評価は難しい。どちらも完璧とは言えず、こだわるなら「両方で試していいほうを採用」って感じになるのではないかと。

例2-3：短めの文章を絵にしてみた結果

今回の発表内容を短くまとめたテキストを表示した電光掲示板の画像を作ってみてもらいました。よく見ると、ChatGPTはフォントの一部が変になっていますが、Geminiはフォントまで完璧という感じ。

短いテキストをChatGPTで画像にしたもの。実際の会話リンクを生成できなかったため、プロンプトはGeminiとの会話でご確認ください Image: かみやまたくみ, generated with ChatGPT (GPT Image 1.5)

短いテキストをChatGPTで画像にしたもの。実際の会話はこちら Image: かみやまたくみ, generated with Gemini (Nano Banana Pro)

表組をうまく絵にできるかも試してみました。フォントに関しては同様の結果ですが、Geminiは「指示に存在しない文字列」を描いてしまっており、指示追従性に関してはChatGPTが上っぽい雰囲気です。

Markdown形式で指定した表組をChatGPTで画像にしたもの。日本語のフォントがだいぶ怪しい。実際の会話はこちら Image: かみやまたくみ, generated with ChatGPT (GPT Image 1.5)

Markdown形式で指定した表組をGeminiで画像にしたもの。フォントは完璧ですが、3行目は描かないで欲しかった。実際の会話はこちら Image: かみやまたくみ, generated with Gemini (Nano Banana Pro)

例4：「写真内の英語を日本語に置き換え」はすごい綺麗にいった

「日本語が短い」「フォントのサンプルがある」という条件だと綺麗にいきやすいっぽい雰囲気がありました。以下は元画像にある英語だけを日本語に置換してもらったものです。ChatGPTもGeminiも完璧です。

元画像。中央の「SNEAKS」を「スニーク」に置き換えてもらいます Photo: かみやまたくみ

ChatGPTで写真内の英語を日本語に置き換えてもらった例。実際の会話はこちら Image: かみやまたくみ, generated with ChatGPT (GPT Image 1.5)

Geminiで写真内の英語を日本語に置き換えてもらった例。実際の会話はこちら Image: かみやまたくみ, generated with Gemini (Nano Banana Pro)

まだ試せていませんが、フォントファイルをアップして生成させると、表なんかも綺麗にいくかもしれないです。

例5：英語なら長文でも原文を維持したまま画像にできる

OpenAIの事例で長文を貼り付け、それをそのまま新聞風の画像にする、というものがありました。文字は細密な要素で、今までのAI画像生成が苦手とする分野でしたが、徐々に過去のものになりつつありますね。特に英語に関しては相当な水準で、再現もしました。

日本語に関してはただやっただけだとまだ厳しい印象でしたが。

以下は「日本語の新聞風にして」とOpenAIのプロンプトを書き換えてChatGPT・Geminiで試してみた例です。ChatGPTは部分的に変なフォントで日本語化した新聞を生成しています。Geminiはすべて英文となっており、やはりどちらも完璧ではありません。日本語のテキストを含む画像を生成する場合は、短めなほうがうまくいきそうな感じかなーと思います。

長文テキストをChatGPTで新聞風の画像にしてもらった例。実際の会話リンクがなぜか作成できなかったため、プロンプトは次の画像のキャプションからご確認ください（Geminiと同じものを入れています） Image: かみやまたくみ, generated with ChatGPT (GPT Image 1.5)

長文テキストをGeminiで新聞風の画像にしてもらった例。実際の会話はこちら Image: かみやまたくみ, generated with Gemini (Nano Banana Pro)

公式もいろんな「できること」を紹介しているので、併せて見ておくと幅が広がると思います。

でも急に進化すんの、正直やめて欲しいかも…

ChatGPTは凄まじい進化をしたと思います。推論・画像生成において確かに最新・最高水準の性能でしょう。以前のようにGeminiを置き去りにして独走という感じではなく、好みや利用シーンとの相性で選ぶ感じになってはいますが、AI利用者はどんどん増えているでしょうから自然な流れな気がします。

ChatGPTに関してはこれからアダルトコンテンツに対応するという話があり、こちらもまた話題になりそう。

しかし、OpenAIの開発スピードがやばすぎやしませんか。11月に突如としてAIとしての格を上げたGemini、テコ入れを12月頭に初めて2週間で一気に勢いを取り戻すほどの進化を見せたChatGPT。「出せるけど出してない技術」が山ほどあるって言われたほうが安心できます。ノー準備でやったんなら、人間業じゃなさすぎる。

個人的にはコンスタントに性能アップしてくれたほうが嬉しいかな…。いきなり性能上がると、使い勝手もがらっと変わるので。情報量も多いし、対応するのがあまりにも大変です。最近のAI状況、追い切れてる人っているんでしょうか？ いろいろと人間味がなさすぎる気がします。

個人ユーザーの感じ方はさておき、AIの覇者を巡る戦いは続きそうです。

Source: OpenAI (1, 2)