画像生成AI「Krea 2」がオープンモデル化されてローカル生成可能になったのでComfyUIで実写風画像とイラスト風画像を生成してみたよレビュー

AI開発企業のKreaが画像生成AI「Krea 2」をオープンモデル化しました。Krea 2は実写風画像もイラスト風画像も高品質に生成可能。すでにComfyUIでも生成可能になったので、実際にいろいろ生成してみました。
Krea 2 Technical Report - Krea
https://www.krea.ai/blog/krea-2-technical-report
today, we release the open weights of Krea 2.
welcome Krea 2 Raw and Krea 2 Turbo, an undistilled model from mid-training meant to be fine-tuned, and a fast distilled version with a wide aesthetic diversity.
read the details below 👇 pic.twitter.com/3ymzUL2bxv— Krea (@krea_ai) June 23, 2026
Krea 2はファインチューニング用のベースモデルである「Krea 2 Raw」とファインチューニングと蒸留を施した「Krea 2 Turbo」の2種類がオープンモデルとして公開されています。どちらのモデルもパラメーター数は120億で、ラインセンスは一定の条件下で商用利用が可能な「Krea 2 Community License Agreement」を採用しています。
krea/Krea-2-Raw · Hugging Face
https://huggingface.co/krea/Krea-2-Raw
krea/Krea-2-Turbo · Hugging Face
https://huggingface.co/krea/Krea-2-Turbo
Krea 2 Turboの生成例が以下。

AIの名前を伏せつつ人間に品質を評価させるDesign Arenaの画像生成ランキングでは、Krea 2 TurboはFLUX.2より高品質だと評価されています。

実際に、ComfyUIでKrea 2 Turboを使った画像生成を試してみます。まずComfyUIを最新版にアップデートしてテンプレート一覧画面で「krea」などのフレーズで検索して「Krea-2:テキストから画像へ」をクリックします。記事作成時では「Krea-2:テキストから画像へ」は2個登録されていて、サムネイルの左上に「Krea」と記されていない方が今回実行するKrea 2 Turboのテンプレートです。左上に「Krea」と記されている方はKreaのAPIを用いて画像生成するテンプレートなので注意。

テンプレートを開いたら右上の「不足しているモデルを表示」をクリック。

「すべてダウンロード」をクリックして必要なモデルをダウンロードします。合計ファイルサイズは17.8GBなので回線状況によってはかなり待つ必要あり。モデルのダウンロードが完了したらComfyUIを再起動します。

再起動してワークフローを開き直したら左上の「実行する」をクリック。

しばらく待つとあらかじめ入力されているプロンプトに沿ったサンプル画像が出力されます。

サンプル画像はこんな感じ。実写と手描きイラストが混在する画像を正しく指示通りに描写できています。

いろいろプロンプトを書き換えて生成してみます。テンプレートの初期状態だと「krea2-warmpastel」というLoRAが有効になっているので、無効化するためにグループ(青いエリア)を右クリックして「Byapass Group Nodes」をクリックしておきます。

後は「Text to Image」の入力欄にプロンプトを入力して「実行する」をクリックすればOK。

日本語で『路地裏で室外機の上に座って新聞を読むメイドさん。日本人。髪の毛は青色の黒色と青色のグラデーション。新聞には「GIGAZINE」と書いてある』と入力した結果が以下。「路地裏」「室外機に座る」「メイド」「髪の毛のグラデーション」「新聞の文字」をすべて指示通りに描写できています。

プロンプト:路地裏で室外機の上に座って新聞を読むメイドさん。日本人。髪の毛は青色の黒色と青色のグラデーション。新聞には「GIGAZINE」と書いてある
ポートレートも生成。

プロンプト:メイドさん。ポートレート。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き
「スマートフォンで素人が撮影したようなブレのある写真」という指示を追加するとAIっぽさがかなり抑えられます。

プロンプト:メイドさん。ポートレート。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。スマートフォンで素人が撮影したようなブレのある写真。
イラスト風画像も高品質に生成可能。

プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ
水彩画風にしてみました。

プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ。水彩画
アニメ塗り。

プロンプト:メイドさん。ポートレート構図のイラスト。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ。アニメ塗り
ゴッホ風。

プロンプト:メイドさん。ゴッホが描いたポートレート構図の絵画。カメラ目線。日本人。髪の毛は赤色のウルフカット。頬にピンク色のハート型の落書き。背景は居心地の良いカフェ
「AMD RYzen 5 7600X」と「NVIDIA GeForce RTX 5070Ti」を搭載したWindows PCで1024×1024ピクセルの画像を生成した結果、プロンプトを書き換えた場合は16〜25秒、同じプロンプトを使い回す場合は9〜15秒程度で生成できました。Kサンプラーのステップ数は初期設定の8のまま生成しています。

生成中のGPUへの負荷はこんな感じ。VRAM容量16GBのRTX 5070Tiで問題なく生成できました。

上述の通り、Krea 2はベースモデルの「Krea 2 Raw」と蒸留済みの「Krea 2 Turbo」が公開されています。LoRA作成ツールのMusubi TunerもすでにKrea 2をサポートしており、RTX 6000 Pro Blackwellで15分程度でLoRAを作成できるそうです。
Musubi TunerでKrea 2をday 0サポートしました。H2D only block swapとの組み合わせでほぼ速度低下なく12GB VRAMから学習可能です。またトークン順の最適化、flash attentionのGQAネイティブ対応などで高速化を図りました。
ドキュメントはこちら:https://t.co/ZSqPGwJjv5— Kohya Tech (@kohya_tech) June 23, 2026
Krea 2のLoRA学習結果。わりと短時間で学習できるみたい(このLoRAだとRTX 6000 Pro Blackwell Max-Qで15分くらい)。
1枚目LoRAなし、2枚目あり、3枚目プロンプト応答をみたやつ(眼鏡外す)、4枚目画風を変えてみたやつ。 pic.twitter.com/rRZHhBVPDV— Kohya Tech (@kohya_tech) June 23, 2026
