GPU大手のNVIDIAが主催する「GPU Technology Conference(GTC)」で、Pascal世代の新型GPU「TESLA P100」を発表。さらにTESLA P100を8台搭載するディープラーニング用スーパーコンピューター「DGX-1」も同時に発表し、従来のシステムの75倍高速に計算できるという圧倒的な性能を明らかにしています。

The NVIDIA DGX-1 Deep Learning System|NVIDIA

http://www.nvidia.com/object/deep-learning-system.html

Tesla P100 Most Advanced Data Center Accelerator|NVIDIA

http://www.nvidia.com/object/tesla-p100.html

Quadro VR Recommended Systems|NVIDIA

http://www.nvidia.com/object/quadro-vr-recommended-systems.html

NVIDIA Announces Tesla P100 Accelerator - Pascal GP100 Power for HPC

http://www.anandtech.com/show/10222/nvidia-announces-tesla-p100-accelerator-pascal-power-for-hpc

NVIDIAは新GPUシリーズ「Tesla」ファミリーを発表しました。Teslaファミリーの最注目はハイエンドモデル「Tesla P100」。



裏側はこんな感じ。Tesla P100は2つのコネクタで接続するCPUのLGAパッケージのようなスタイルの模様。



Tesla P100はTSMCの16nm FinFETプロセスで製造されるディープラーニング用途に適したGPUで、メモリにHBM2を採用。ディープラーニングで重要とされる半精度浮動小数点演算は21.2 TFLOPSを実現します。



従来のGPUアーキテクチャと違い、GPU同士が互いのVRAMに直接アクセスできる「NVLink」を採用しており、CPUメモリやPCI Expressの遅いデータ転送速度のボトルネックを解消。4つのGPUをNVLinkによって相互接続することで、最大160GB/sという帯域幅を実現するとのこと。



Tesla P100搭載のサーバーは。IBM、HP、Dellなどから2017年第1四半期に発売される予定です。



さらにNVIDIAは自動運転カーやVRシミュレーションまでさまざまな人工知能技術開発に対応できるディープラーニング用スーパーコンピューター「DGX-1」を発表しました。



DGX-1はGPUに16GBメモリを内蔵するTesla P100を8基搭載し、半精度浮動小数点演算は最大170TFLOPS。



デュアルCPUのXeon E5-2697を搭載するディープラーニング用システムが150時間かかる計算をわずか2時間で終わらせるという驚異的な性能を誇ります。



DGX-1は2016年価格12万9000ドル(約1400万円)で発売予定です。

・おまけ

2017年からフォーミュラEが開催する無人レース「Roborace」の頭脳として、「NVIDIA Drive PX 2」が採用されることになったとNVIDIAは発表しています。



なお、Drive PX 2については以下の記事で確認できます。

ボード1枚でMacBook Pro150台分の能力を持ち自動運転カーを実現する「NVIDIA Drive PX 2」 - GIGAZINE