VRAM容量の少ない安めのグラボでも画像生成AI「FLUX.1 Kontext [dev]」を動かせる省メモリ高速版をNVIDIAが開発、VRAM使用量を24GBから7GBまで削減し2.1倍高速動作

「FLUX.1 Kontext [dev]」は自然言語で画像を編集可能な画像生成AIモデルで、2025年6月26日にリリースされました。このFLUX.1 Kontext [dev]にはNVIDIAと共同開発したNVIDIA製GPU最適化版が存在しており、基本モデルと比べてVRAM使用量を大幅に削減しつつ処理を高速化することに成功しています。
RTX AI Accelerates FLUX.1 Kontext | NVIDIA Blog
FLUX.1 Kontext [dev]はFLUX.1 Kontextシリーズのオープンウェイトモデル版として開発されたモデルで、画像の特徴を保ったままプロンプト通りの編集を施すことを得意としています。また、FLUX.1 Kontext [dev]には高度な自然言語理解能力が備わっており、いわゆる「呪文」ではなく自然言語での指示が可能です。
高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル - GIGAZINE

FLUX.1 Kontext [dev]の基本モデルのVRAM使用量は24GBで、実行するには大量のVRAMを搭載した高価なグラフィックボードが必要です。一方で、NVIDIAのTensorRTを用いてFP8に量子化したモデルはVRAM使用量が12GBにまで削減され、FP4に量子化したモデルはVRAM使用量がわずか7GBにまで抑えられました。

FP4での演算にはNVIDIAのGeForce RTX 50シリーズが対応しています。FLUX.1 Kontext [dev]の基本モデルを実行する場合はVRAM容量32GBのGeForce RTX 5090が必要ですが、FP4モデルならVRAM容量16GBのGeForce RTX 5060 Tiで実行することができます。

各グラフィックボードの実売価格は以下の通り。GeForce RTX 5090は40万円以上で売られています。
Amazon | ZOTAC GAMING GeForce RTX 5090 SOLID グラフィックスカード ZT-B50900D-10P VD8992 | ZOTAC | グラフィックボード 通販

一方でGeForce RTX 5060 Tiなら8万円前後で入手可能です。
Amazon | ZOTAC GAMING GeForce RTX 5060 Ti 16GB Twin Edge グラフィックスボード ZT-B50620E-10M VD9182 | ZOTAC | グラフィックボード 通販

量子化には高速化のメリットもあり、FP8モデルは基本モデルと比べて2倍、FP4モデルは2.1倍の速度で実行できます。量子化には「SVDQuant」という手法を活用しており、品質を保ちつつモデルサイズを削減しているそうです。

FLUX.1 Kontext [dev]の基本モデルと量子化モデルは以下のリンク先で配布されています。
black-forest-labs/FLUX.1-Kontext-dev · Hugging Face
https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
