Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される

2025年6月30日 11時32分

AlibabaのAI開発チームであるQwenが画像生成AI「Qwen VLo」を2025年6月26日(木)に発表しました。Qwen VLoは画像内に含まれるコンテンツ理解力が高く、正確な画像編集が可能とのこと。また、プログレッシブ生成手法を採用しており、左上から順番に画像が生成されるのも大きな特徴です。

Qwen VLo: From "Understanding" the World to "Depicting" It | Qwen

https://qwenlm.github.io/blog/qwen-vlo/

Qwen VLoの画像生成過程を示すデモ映像が以下。既存の画像生成AIモデルの多くは「画像全体を粗く描写し、段階的に高精細にしていく」という生成手法を採用していますが、Qwen VLoはプログレッシブ生成手法を採用しており、画像が左から右、上から下へと段階的に生成されます。Qwen VLoは画像の生成中に予測内容を継続的に改良・最適化しており、最終的な生成結果の一貫性を確保しています。開発チームはプログレッシブ生成手法について「視覚的な品質を向上させるだけでなく、ユーザーに柔軟かつ制御可能なクリエイティブ体験を提供できる」とアピールしています。

Alibabaの画像生成AI「Qwen VLo」が画像を生成する様子 - YouTube

Qwen VLoはチャットAI「Qwen Chat」内で利用可能です。言語は中国語と英語に対応しており、テキストからの画像生成だけでなく、画像を入力して編集することもできます。