AI開発企業のKreaが画像生成AI「Krea 2」をオープンモデル化しました。Krea 2は実写風画像もイラスト風画像も高品質に生成可能。すでにComfyUIでも生成可能になったので、実際にいろいろ生成してみました。

Krea 2 Technical Report - Krea

https://www.krea.ai/blog/krea-2-technical-report





Krea 2はファインチューニング用のベースモデルである「Krea 2 Raw」とファインチューニングと蒸留を施した「Krea 2 Turbo」の2種類がオープンモデルとして公開されています。どちらのモデルもパラメーター数は120億で、ラインセンスは一定の条件下で商用利用が可能な「Krea 2 Community License Agreement」を採用しています。

krea/Krea-2-Raw · Hugging Face

https://huggingface.co/krea/Krea-2-Raw

krea/Krea-2-Turbo · Hugging Face

https://huggingface.co/krea/Krea-2-Turbo

Krea 2 Turboの生成例が以下。



AIの名前を伏せつつ人間に品質を評価させるDesign Arenaの画像生成ランキングでは、Krea 2 TurboはFLUX.2より高品質だと評価されています。



実際に、ComfyUIでKrea 2 Turboを使った画像生成を試してみます。まずComfyUIを最新版にアップデートしてテンプレート一覧画面で「krea」などのフレーズで検索して「Krea-2:テキストから画像へ」をクリックします。記事作成時では「Krea-2:テキストから画像へ」は2個登録されていて、サムネイルの左上に「Krea」と記されていない方が今回実行するKrea 2 Turboのテンプレートです。左上に「Krea」と記されている方はKreaのAPIを用いて画像生成するテンプレートなので注意。



テンプレートを開いたら右上の「不足しているモデルを表示」をクリック。



「すべてダウンロード」をクリックして必要なモデルをダウンロードします。合計ファイルサイズは17.8GBなので回線状況によってはかなり待つ必要あり。モデルのダウンロードが完了したらComfyUIを再起動します。



再起動してワークフローを開き直したら左上の「実行する」をクリック。



しばらく待つとあらかじめ入力されているプロンプトに沿ったサンプル画像が出力されます。



サンプル画像はこんな感じ。実写と手描きイラストが混在する画像を正しく指示通りに描写できています。



いろいろプロンプトを書き換えて生成してみます。テンプレートの初期状態だと「krea2-warmpastel」というLoRAが有効になっているので、無効化するためにグループ(青いエリア)を右クリックして「Byapass Group Nodes」をクリックしておきます。



後は「Text to Image」の入力欄にプロンプトを入力して「実行する」をクリックすればOK。



日本語で『路地裏で室外機の上に座って新聞を読むメイドさん。日本人。髪の毛は青色の黒色と青色のグラデーション。新聞には「GIGAZINE」と書いてある』と入力した結果が以下。「路地裏」「室外機に座る」「メイド」「髪の毛のグラデーション」「新聞の文字」をすべて指示通りに描写できています。



プロンプト:路地裏で室外機の上に座って新聞を読むメイドさん。日本人。髪の毛は青色の黒色と青色のグラデーション。新聞には「GIGAZINE」と書いてある

ポートレートも生成。



プロンプト:メイドさん。ポートレート。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き

「スマートフォンで素人が撮影したようなブレのある写真」という指示を追加するとAIっぽさがかなり抑えられます。



プロンプト:メイドさん。ポートレート。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。スマートフォンで素人が撮影したようなブレのある写真。

イラスト風画像も高品質に生成可能。



プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ

水彩画風にしてみました。



プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ。水彩画

アニメ塗り。



プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ。アニメ塗り

ゴッホ風。



プロンプト:メイドさん。ゴッホが描いたポートレート構図の絵画。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ

「AMD RYzen 5 7600X」と「NVIDIA GeForce RTX 5070Ti」を搭載したWindows PCで1024×1024ピクセルの画像を生成した結果、プロンプトを書き換えた場合は16〜25秒、同じプロンプトを使い回す場合は9〜15秒程度で生成できました。Kサンプラーのステップ数は初期設定の8のまま生成しています。



生成中のGPUへの負荷はこんな感じ。VRAM容量16GBのRTX 5070Tiで問題なく生成できました。



上述の通り、Krea 2はベースモデルの「Krea 2 Raw」と蒸留済みの「Krea 2 Turbo」が公開されています。LoRA作成ツールのMusubi TunerもすでにKrea 2をサポートしており、RTX 6000 Pro Blackwellで15分程度でLoRAを作成できるそうです。