画像生成AI「Qwen-Image-2.0」が登場、実写と文字に強くEditモデルとの統合も果たす

AlibabaのAI研究チームであるQwen(Tongyi Lab)が画像生成AI「Qwen-Image-2.0」を2026年2月10日に発表しました。Qwen-Image-2.0はQwen-ImageとQwen-Image-Editを統合したモデルで、写実的な画像や文章を含む画像の生成を得意としています。
Qwen-Image-2.0: Professional infographics, exquisite photorealism
Qwen-Image-2.0は既存のQwen-Imageシリーズと比べて生成画像の品質が向上しています。Alibabaが運営するAIブラインドテストサービス「AI Arena」では、テキストから画像を生成タスクにおいてGemini-2.5-Flash-Image-Preview(Nano Banana)を上回っています。

画像を編集するタスクでもGemini-2.5-Flash-Image-Preview(Nano Banana)を上回り、Gemini-3-Pro-Image-Preview(Nano Banana Pro)に匹敵するスコアを記録しています。

Qwen-Image-2.0は既存のQwen-Imageシリーズと比べてモデルサイズが小さくなっており、高速な推論が可能とのこと。また、1000トークンの入力に対応しており、要素の配置を細かく指定しつつスライド画像を生成することもできます。
Qwen-Image-2.0を使って「これまでのQwen-Imageシリーズの変遷を説明するスライド」を作成した結果が以下。画像の中に複数の画像を含むという複雑な構成でも破綻なく処理可能です。

森の実写風画像。

長い文章を含む画像も生成できます。

人物の配置を細かく指定してポスターを生成。

情報密度の高いスライドも生成できます。

さらに、各コマのセリフや構図を指定しつつマンガを生成することも可能。

編集タスクも実行可能です。以下の例では1枚のポートレートを入力して9枚の別ポーズ画像を生成しています。

別々の写真に写る被写体を1枚の写真にまとめることもできます。

Qwen-Image-2.0はQwen Chatで使用可能です。なお、これまでのQwen-Imageシリーズは誰でもダウンロード可能なオープンモデルとしても公開されていましたが、記事作成時点ではQwen-Image-2.0のモデルデータは公開されていません。
