AIに関する非営利の研究機関として設立されたOpenAIは、違和感なく2つの顔写真を合成したり、顔写真に年齢やヒゲ、笑顔などの属性を追加したりすることができる技術「Glow」を発表しました。

Glow: Generative Flow with Invertible 1×1 Convolutions

(PDFファイル)https://d4mucfpksywv.cloudfront.net/research-covers/glow/paper/glow.pdf

Glow: Better Reversible Generative Models

https://blog.openai.com/glow/

OpenAIのディーデリック・キングマ氏とプラフルラ・ダリワル氏によって開発されたGlowは、可逆1×1畳み込み(invertible 1x1 convolutions)を使用した画像生成AIです。Glowは学習した画像から自動でラベル付けを行うのも特徴で、デモ用として用意された3万人分の顔写真を学習させた場合、自動で「笑顔」「年齢」「細目」「金髪」「ヒゲ」などのラベルが設定されます。設定されたラベルは後から自由に操作することができ、新しく入力した画像に変化を加えることが可能になります。

たとえば、左上のINPUTにセットされたジェフリー・ヒントン氏の顔写真の場合、赤枠のように「Smiling(笑顔)」「Age(年齢)」「Blonde Hair(金髪)」「Beard(ヒゲ)」の値を最大にして、「Narrow Eyes(細目)」を最小(目を大きく開ける状態)にセットすると、右上のOUTPUTの顔写真に変更することが可能。ヒゲが黒いことに少し違和感が残りますが、実際にいても不思議ではない男性の顔となっており、AIが独自に判断して作り出した顔には見えません。



また、Glowは2つの画像を合成して、合成度合いを変更することもできます。LEFT INPUTにニール・ドグラース・タイソン氏の顔写真、RIGHT INPUTにラシダ・ジョーンズ氏の顔写真をセットし、赤枠のMIXを中央の位置に設定して2つの画像を均等に合成すると、OUTPUTに実際にいても不思議ではない自然な男性の顔が生成されました。



また、MIXの値を左側に寄せると、LEFT INPUTのドグラース・タイソン氏の特徴が強くなるものの、生成される顔写真はこちらも自然な顔となり……



ジョーンズ氏(右)側に寄せても、違和感はありませんでした。



OpenAIはダリワル氏の写真と9名の有名人の画像を合成したムービーも公開しています。以下の画像をクリックするとムービーが再生されます。



9枚並んだダリワル氏の写真が、徐々に変化し……



ほとんど違和感なく、9人それぞれの有名人の顔写真に変わりました。髪型や顔の特徴があまりにも異なっていたりすると途中の画像がおかしくなるようですが、ムービーとして見ると大きな違和感を感じることはありませんでした。



キングマ氏とダリワル氏も途中の画像のデキが気に入らないのか、「Glowは不自然な変化を付けることがある」と述べており、より自然な変化を付けるために「自己回帰モデルやVAEを使用して改善していきたい」としています。

OpenAIはGlowをGitHubで公開しており、誰でも自由に試すことが可能です。Glowを動作させるためには、TensorFlowとHorovodが必要で、具体的な操作方法などについてはGlowのドキュメントで説明されています。