CPU・GPU・TPUをワンチップで担う「Tachyum Prodigy」のCPUスペックが明らかに、最大クロック周波数5.7GHz・128コア・TDP 950Wのモンスタースペック
半導体企業のTachyumが、CPU・GPU・TPUの機能を単一のアーキテクチャに統合したチップ「Prodigy」を発表しました。ProdigyのCPUスペックは最大128コア、動作周波数は5.7GHz、16チャネルDDR5メモリ、TDPは950Wとなっており、テクノロジーメディアのWccftechは「非常識なスペック」と評しています。
Tachyum's Prodigy CPU Specs Unveiled: 5nm Universal Processors With Up To 128 Cores, 5.7 GHz Clocks, 16-Channel DDR5-7200 Memory Support & 950W TDP
ProdigyはCPU・GPU・TPUのタスクを同一のチップ上で実行可能なユニバーサルプロセッサです。すべてのタスクを同一のチップ上で実行できるため、競合製品よりもコストを節約することが可能でありながら、高性能という特徴を有しています。TachyumはProdigyを発表したプレゼンテーションの中で、「ProdigyはHPC面ではIntelのXeon CPUの4倍のパフォーマンスを発揮し、NVIDIAのH100に対してはHPC面で3倍、AI&推論ワークロード面では6倍のパフォーマンスを実現します」とそのハイパフォーマンスぶりをアピールしていました。また、競合他社のシステムと比較すると同じ電力で10倍以上のパフォーマンスを実現可能ともアピールしています。
Prodigyの特徴的なスペックは以下の通り。
・最大5.7GHzで動作する高性能ユニファイド64ビットコアを最大128個搭載
・16チャネルのDDR5メモリコントローラー
・PCIe 5.0が64レーン
・4ソケットおよび2ソケットのマルチプロセッササポート
・空冷式と液冷式の両方をサポートしたデータセンター向けラックソリューション
・SPEC CPU2017の整数演算パフォーマンスはIntel Xeon Platinum 8380の約4倍で、AMD EPYC 7763 HPCの約3倍
・倍精度浮動小数点数パフォーマンスはNVIDIA H100の約3倍
・AIFP8のパフォーマンスはNVIDIA H100の約6倍
Prodigyの各モデルのスペックは以下の通り。
コア数クロック周波数メモリPCIeTDP市場セグメントT16128-AIX1285.7GHz16x DDR5-7200Gen5 x64950WハイエンドAI/HPCT16128AIM1284.5GHz16x DDR5-7200Gen5 x64700WミドルレンジAI/HPCT16128-AIE1284.0GHz16x DDR5-7200Gen5 x64600WエントリーAI/HPCT16128-HT1284.5GHz16x DDR5-6400Gen5 x64300WスループットT864-HS645.7GHz8x DDR5-6400Gen5 x32300WスピードT864-HT644.5GHz8x DDR5-6400Gen5 x32300W効率T832-HS325.7GHz8x DDR5-6400Gen5 x32300WエントリーT832-LP323.2GHz8x DDR5-4800Gen5 x32180W低電力
Prodigyは2つあるいは4つのマルチソケットをサポートしているため、4つのT16128-AIXからなる最大512コア・TDP 3800Wのシステムを構築することも可能。なお、ProdigyはすべてTSMCの5nmプロセスノードで製造され、命令セットアーキテクチャはネイティブおよびx86・ARMアーキテクチャ・RISC-Vに対応。
HPCおよびAI関連の固有の機能としては以下が挙げられています。
・コアあたり2x1024ビットベクトル単位
・コアあたり4096ビットのマトリックスプロセッサ
・FP64、FP32、TF32、BF16、Int8、FP8、TAIデータ型
・スパースデータ型は効率を最適化
・低精度数値型を使用した量子化のサポート
・行列を効率的に保存・ロードするためのスキャッター/ギャザー
TachyumはProdigy専用の空冷ラックや液冷ラックを用意しており、NVIDIAのH100 DGX PODを使用した場合のT16128-AIXの倍精度浮動小数点数(FP64)性能が約90T(テラ)FLOPSであるのに対して、専用空冷ラックなら最大6.2P(ペタ)FLOPS、液冷ラックなら最大12.9PFLOPSまでパフォーマンスを向上させることが可能です。
なお、Prodigyは2022年下半期にリリース予定となっており、さらに次世代モデルとなる「Prodigy 2」が2024年下半期に登場予定です。Prodigy 2について、Tachyumは「製造プロセス3nmで、より多くのコア・メモリ・メモリ帯域幅を持ち、PCIe 6.0およびCXLに対応する」としています。