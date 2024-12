イギリス・サリー大学のサリー人間中心人工知能研究所が、控えめで手頃な価格のハードウェアのみを使用して瞬時に画像を生成するAIモデル「NitroFusion」を作成したと発表しました。Surrey announces world's first AI model for near-instant image creation on consumer-grade hardware | University of Surrey

https://www.surrey.ac.uk/news/surrey-announces-worlds-first-ai-model-near-instant-image-creation-consumer-grade-hardwareNitroDiffusionhttps://chendaryen.github.io/NitroFusion.github.io/通常、高速な画像生成を行うには大規模なハードウェアへの投資が必要ですが、NitroFusionは単一の一般消費者向けのグラフィックカードのみを使用して瞬時に画像を生成できるとのこと。ただし、具体的にどのグラフィックカードが使用できるのかという情報は述べられていません。サリー人間中心人工知能研究所の共同所長を務めるイー・ジェ・ソン教授はNitroFusionについて、「大規模なコンピューティングリソースの必要性を排除し、誰もがAIを利用できるようにするパラダイムシフトだ」とアピールしました。NitroFusionの仕組みはこんな感じ。トレーニングを通じて複数ステップの教師モデルを1ステップの生徒ジェネレーターに凝縮するのが特徴です。プロジェクトのページに実際の生成例および他のモデルとの比較が掲載されています。左端に比較対象として「Stable Diffusion XL(SDXL)を使用して25ステップかけて生成した画像」があり、1ステップ同士の比較対象として「SDXL-Turbo」「SDXL-Lightning」と続きます。「DMD2」は教師モデルで、1ステップのものと4ステップの生成画像が掲載されており、右端の「NitroSD-Realism」がNitroFusionのモデルです。教師モデルとして「Hyper-SDXL」を採用した「NitroSD-Vibrant」モデルの画像生成例はこんな感じ。左半分には先ほどと同じ比較用のモデルでの生成例が掲載されています。NitroFusionのモデルは1ステップでの画像生成においてそれなりの品質が出せるのが特徴ですが、複数回のステップを行う事で細部のクオリティが向上するとのこと。HuggingFaceでモデルが公開されており、GitHubでコードが公開されています。ライセンスは「NitroSD-Realism」がCC BY-NC-SA 4.0で商用利用不可、NitroSD-VibrantがOpen RAIL++-Mで商用利用可能となっています。