画像生成AI「FLUX」の開発チームが、高品質なポートレートの生成に特化した新たなトレーナー「FLUX Portrait Trainer」を公開しました。特徴としてはディテールの細かさや瞳のハイライト、さまざまな顔の大きさのよりよい表現などが挙げられています。

Train Flux LoRAs For Portraits | Training | AI Playground | fal.ai

https://fal.ai/models/fal-ai/flux-lora-portrait-trainer?ref=blog.fal.ai

Introducing the FLUX Portrait Trainer

https://blog.fal.ai/introducing-the-flux-portrait-trainer/

以下はサンプルとして公開された、FLUX Portrait Trainerの同じモデルを使って生成された画像です。体毛の1本1本や瞳の中に映り込んだハイライト、肌の質感など、細かなディテールが高い品質で表現されていて、開発チームは「絵が画面から飛び出してくるように見える」と述べています。



以下の画像はCheeseAIが提供したデータセットをもとに、「kptz woman in a pitch black room. I single shaft of volumetric light slants across her right eye.」というプロンプトで生成された画像。「真っ暗な部屋(pitch black room)」との指示が含まれますが、データセットには日中に撮影した写真しか含まれていなかったとのこと。左はFLUX Portrait Trainerでトレーニング済みのモデルによる生成で、狙い通りの画像を出力できていますが、右の汎用トレーナーでトレーニング済みのモデルによる生成は、「真っ暗」にすることができませんでした。



同様に「kptz old woman」というプロンプトで、同一シード・同一パラメータの条件のもと生成された画像が以下。左のFLUX Portrait Trainerでトレーニング済みモデルによる生成画像はプロンプトで求めたとおりの画像になっている一方、右の汎用トレーナーでトレーニング済みモデルによる生成画像は、トレーニングに用いたデータと一致する画像が出力され、プロンプトが無視されています。



なお、FLUX Portrait Trainerは汎用トレーナーを補完するもので、アプリケーションによっては別のトレーナーの方がうまくいくこともあると開発チームは説明しています。