OpenAI、次世代画像生成「ChatGPT Images 2.0」公開 日本語の文字描画や自由なアスペクト比に対応
OpenAIは、画像生成モデル「ChatGPT Images 2.0」を公開した。従来モデルと比べ、指示への忠実度や表現力が向上。日本語を含む多言語の文字描画や、自由なアスペクト比での生成ができる。ChatGPT、Codex、APIを通じて、提供を開始した。
日本語対応と描画精度の向上
指示に対する忠実度が高まり、複雑な視覚的タスクの実行ができる。特に日本語、韓国語、中国語など、非ラテン文字の描画性能を大幅に強化した。
ポスターや漫画のコマ、図解など、画像内にテキストを組み込むデザイン制作において、言語がデザインの一部として自然に構成される。
柔軟なアスペクト比と複数枚の同時生成
出力サイズは、1:3の縦長から3:1の超ワイドまで柔軟に設定できる。ウェブサイトのバナー、プレゼンテーション用スライド、モバイル画面など、用途に応じた形式での生成が可能。
また、ChatGPT PlusやProなどの上位プランで推論(Thinking)モデルを選択した場合、一度のプロンプトで最大8枚の画像を同時に生成できる。キャラクターやオブジェクトの連続性を維持したまま、物語のシーケンスや異なるSNS向けの画像セットを効率的に作成できるようになった。
プロンプト例:新しくオープンする抹茶ショップ「kizuna」の宣伝広告ビジュアルイメージを作ってください。陽光がきれいに差し込む、いちご抹茶(アイス)の魅力的なビジュアルにして、ストリートウェア感のある雰囲気と和風の雰囲気を組み合わせてください。さらに、X、Instagramストーリーズ、Instagramフィード、LinkedIn で使えるように、複数のアスペクト比の出力を含めてください
推論機能による情報の正確性と背景知識
さらに、推論機能を用いることで、モデルが生成前にウェブ検索を実行し、リアルタイムの情報やアップロードされた資料の内容を反映する。
2025年12月までの知識を基に、教育用グラフィックや視覚的な要約など、正確さが求められるコンテンツ制作を支援する。生成プロセスの過程で構造を論理的に組み立てるため、従来よりも意図に沿った出力が得られる。
プロンプト例:アップロードした PDF ファイルをもとに、横長の学術論文ポスターを作成してください。元資料に含まれる重要なチャート、図、プロットも必ず入れてください
提供状況とAPI
API向けには「gpt-image-2」として提供し、最大2K解像度での出力(ベータ版)をサポートした。ローカライズされた広告や教育コンテンツなど、ビジネス用途での活用を見込む。
ChatGPTおよびCodexの全ユーザーが利用できるが、推論機能を活用した高度な出力は、ChatGPT Plus、Pro、Businessの各ユーザーに限定される。APIの利用料金は、選択した品質や解像度によって決定する。
