NVIDIAが45℃の冷却液を循環させるAIサーバー向けの完全液体冷却方式を発表しました。Rubin世代のAIインフラではチップやネットワーク機器を含む全ての主要部品を閉ループ式の液体で冷却し、ファンを使わない設計を採用するとしています。

Hotter Than a Hot Tub: The 45°C Breakthrough to Cool AI’s Biggest Machines | NVIDIA Blog

https://blogs.nvidia.com/blog/liquid-cooling-ai-factories/

Nvidia announces liquid cooling system that runs ‘hotter than a hot tub’ - promises to reduce electricity consumption and cut water use by up to 100%, but sustainability challenges remain | Tom's Hardware

https://www.tomshardware.com/tech-industry/data-centers/nvidia-announces-liquid-cooling-system-that-runs-hotter-than-a-hot-tub-promises-to-reduce-electricity-consumption-and-cut-water-use-by-up-to-100-percent-but-sustainability-challenges-remain

GPUの高性能化により問題となるのは発熱で、近年ではデータセンターの冷却システムとして空冷ではなく冷却液を用いた「液冷」システムが注目されています。たとえば、Microsoftではサーバーを「低温で沸騰する液体」に沈めて冷却するシステムを開発しています。

煮えたぎる液体にサーバーを沈めて冷却するMicrosoftのデータセンター - GIGAZINE



今回NVIDIAが新しく発表した方式は、水75%とプロピレングリコール25%からなる冷却液がプロセッサーに直接取り付けたコールドプレートを流れる完全液体冷却方式です。

従来のデータセンターでは、サーバーが発する熱を大量の冷気で取り除くため、冷却設備だけで消費電力の最大40%を占める場合があります。NVIDIAの完全液体冷却方式は冷却液が45℃でサーバーに入り、熱を吸収しておよそ55℃で出ることでサーバーの性能を維持する設計。冷却液の温度が高いことで、条件が整う地域では屋外のドライクーラーによる放熱が可能になり、電力負荷の大きい冷却器(チラー)の稼働を減らせるとのこと。



NVIDIAによれば、チラー設備の設定温度を1℃上げると冷却にかかるエネルギーコストを約4%削減できるとの試算もあるそうで、高温液体冷却はデータセンター全体の電力使用量を抑える手段になると述べています。

特にこの方式では、外気温などの条件が整う地域だと屋外のドライクーラーだけで熱を外部へ放出でき、機械式チラーを稼働させずに済む可能性があるとのこと。NVIDIAは施設の冷却に必要な水を冷却塔を使う一般的な方式と比べて最大100%削減できるとしています。



一方で、完全液体冷却方式の効果は立地の気候に左右されます。暑い地域や外気温が45℃を超える時期にはチラーの稼働が必要になる可能性があるものの、年間を通じた稼働時間を限定できれば、資源消費の削減につながるとみられます。

完全液体冷却方式では、従来は空冷に頼っていた部品も液体で冷やす必要があるため、NVIDIAはサーバー内部の冷却構造も見直しています。従来だと空冷サーバーで6Uを必要とした構成を2Uに収められるケースもあり、コスト削減だけでなく高密度化、省スペース化、騒音低減を見込めるそうです。



また、データセンターから出る排熱を近隣の商業施設や住宅の暖房に再利用する可能性も示されています。ただし、GPUサーバー自体が必要とする大量の電力や、その電力供給に伴う環境負荷は別の課題として残るとNVIDIAは述べました。