半導体企業のTachyumが、CPU・GPU・TPUの機能を単一のアーキテクチャに統合したチップ「Prodigy」を発表しました。ProdigyのCPUスペックは最大128コア、動作周波数は5.7GHz、16チャネルDDR5メモリ、TDPは950Wとなっており、テクノロジーメディアのWccftechは「非常識なスペック」と評しています。

Tachyum's Prodigy CPU Specs Unveiled: 5nm Universal Processors With Up To 128 Cores, 5.7 GHz Clocks, 16-Channel DDR5-7200 Memory Support & 950W TDP

https://wccftech.com/tachyums-prodigy-cpu-specs-unveiled-5nm-universal-processors-up-to-128-cores-5-7-ghz-16-channel-ddr5-7200-memory-950w-tdp/

ProdigyはCPU・GPU・TPUのタスクを同一のチップ上で実行可能なユニバーサルプロセッサです。すべてのタスクを同一のチップ上で実行できるため、競合製品よりもコストを節約することが可能でありながら、高性能という特徴を有しています。TachyumはProdigyを発表したプレゼンテーションの中で、「ProdigyはHPC面ではIntelのXeon CPUの4倍のパフォーマンスを発揮し、NVIDIAのH100に対してはHPC面で3倍、AI&推論ワークロード面では6倍のパフォーマンスを実現します」とそのハイパフォーマンスぶりをアピールしていました。また、競合他社のシステムと比較すると同じ電力で10倍以上のパフォーマンスを実現可能ともアピールしています。

Prodigyの特徴的なスペックは以下の通り。

・最大5.7GHzで動作する高性能ユニファイド64ビットコアを最大128個搭載

・16チャネルのDDR5メモリコントローラー

・PCIe 5.0が64レーン

・4ソケットおよび2ソケットのマルチプロセッササポート

・空冷式と液冷式の両方をサポートしたデータセンター向けラックソリューション

・SPEC CPU2017の整数演算パフォーマンスはIntel Xeon Platinum 8380の約4倍で、AMD EPYC 7763 HPCの約3倍

・倍精度浮動小数点数パフォーマンスはNVIDIA H100の約3倍

・AIFP8のパフォーマンスはNVIDIA H100の約6倍



Prodigyの各モデルのスペックは以下の通り。

 コア数クロック周波数メモリPCIeTDP市場セグメントT16128-AIX1285.7GHz16x DDR5-7200Gen5 x64950WハイエンドAI/HPCT16128AIM1284.5GHz16x DDR5-7200Gen5 x64700WミドルレンジAI/HPCT16128-AIE1284.0GHz16x DDR5-7200Gen5 x64600WエントリーAI/HPCT16128-HT1284.5GHz16x DDR5-6400Gen5 x64300WスループットT864-HS645.7GHz8x DDR5-6400Gen5 x32300WスピードT864-HT644.5GHz8x DDR5-6400Gen5 x32300W効率T832-HS325.7GHz8x DDR5-6400Gen5 x32300WエントリーT832-LP323.2GHz8x DDR5-4800Gen5 x32180W低電力

Prodigyは2つあるいは4つのマルチソケットをサポートしているため、4つのT16128-AIXからなる最大512コア・TDP 3800Wのシステムを構築することも可能。なお、ProdigyはすべてTSMCの5nmプロセスノードで製造され、命令セットアーキテクチャはネイティブおよびx86・ARMアーキテクチャ・RISC-Vに対応。

HPCおよびAI関連の固有の機能としては以下が挙げられています。

・コアあたり2x1024ビットベクトル単位

・コアあたり4096ビットのマトリックスプロセッサ

・FP64、FP32、TF32、BF16、Int8、FP8、TAIデータ型

・スパースデータ型は効率を最適化

・低精度数値型を使用した量子化のサポート

・行列を効率的に保存・ロードするためのスキャッター/ギャザー

TachyumはProdigy専用の空冷ラックや液冷ラックを用意しており、NVIDIAのH100 DGX PODを使用した場合のT16128-AIXの倍精度浮動小数点数(FP64)性能が約90T(テラ)FLOPSであるのに対して、専用空冷ラックなら最大6.2P(ペタ)FLOPS、液冷ラックなら最大12.9PFLOPSまでパフォーマンスを向上させることが可能です。



なお、Prodigyは2022年下半期にリリース予定となっており、さらに次世代モデルとなる「Prodigy 2」が2024年下半期に登場予定です。Prodigy 2について、Tachyumは「製造プロセス3nmで、より多くのコア・メモリ・メモリ帯域幅を持ち、PCIe 6.0およびCXLに対応する」としています。