画像生成AI「Midjourney」の開発チームが、2023年3月16日(木)に「Midjourney V5」のアルファ版をリリースしました。「Midjourney V5」では超高画質な画像生成が可能となっているだけでなく、画像生成AIの課題であった「『手』を正確に描写できない問題」が解決されたという報告も寄せられています。





開発チームによると、「Midjourney V5」では「プロンプトに対する反応の向上」「出力画像の解像度が2倍に」「プロンプトに含まれるテキストの量を減らしても詳細な画像を出力可能」「2:1を超える幅広画像に対応」といった機能改善が実施されているとのこと。



既に、インターネット上には「Midjourney V5」を用いて生成した画像が多数公開されています。

「Midjourney V5」で生成した「異なるアングルから撮影した2枚のポートレートを横に並べた画像」が以下。「同一人物の顔を別のアングルから描写」という複雑なタスクを問題なくこなせています。





「Midjourney」や「Stable Diffusion」などの画像生成AIには「『手』を正確に描写するのが難しい」という問題が存在しています。しかし、「Midjourney V5」で生成された以下の画像では、手が正確に描写されています。





「Midjourney V5」で生成された実写風画像たち。人間の顔や手、背景のボケ具合などが非常に自然で、言われなければAI生成画像と気付けない出来栄えです。





「Midjourney V4」(左)と「Midjourney V5」(右)に同じプロンプトを入力して生成した画像。見比べると、「Midjourney V5」の方が服装や視線の不自然さが少なくなっています。





上記のように「Midjourney V5」では非常に美麗な画像を生成できますが、弱点も存在しています。例えば、以下の画像は一見すると実写風に見えますが、よく観察すると「画像左側の陳列物がガラスケースを貫通している」「看板に判読不能な謎言語が記されている」といった非現実的な部分もあることが分かります。





「Midjourney V5」は、記事作成時点ではテスト段階とのこと。Midjourney関連の最新情報は、以下のDiscordサーバーで公開されています。

Midjourney | Discord

https://discord.com/invite/midjourney