GTC 2018:Nvidia推出超級電腦DGX 2 宣布與ARM合作
鉅亨網編譯許家華 2018-03-28 15:06
Nvidia (NVDA-US) 已是 GPU 的深度學習和人工智能(AI)世界的主宰,其創辦人暨執行長黃仁勳在 2018 GPU 技術大會(GTC)上發表演說,宣布 NVIDIA GPU 硬體和平台效能的重大改善,推出搭載史上最強大 GPU 的超級電腦「DGX 2」,預計在第三季推出,售價為 39.9 萬美金。
他以三個方面重點介紹 NVIDIA 的 AI / 深度學習:
1. 升級到 Tesla V100 數據中心 GPU 平台(以及基於它的硬體產品)。
2. 軟體改進、善提高了 GPU 加速深度學習的推理效能。
3. 與 ARM 的新合作關係將整合 Nvidia 深度學習加速器( Nvidia Deep Learning Accelerator )到基於 ARM 的 T 晶片。
真正的重大消息是核心技術本身:
特斯拉 V100 GPU 現在將配備 32GB 記憶體,比之前 16GB 的記憶體擴大一倍,這意味著可以容納更大更深度的學習模式,也意味著這些模式的預測能力的準確度更高。
Nvidia 自有的 DGX 系統已立即應用上新 GPU 技術,其他 OEM 廠 Cray、惠普、IBM、聯想、超微和 Tyan 都將在今年第二季推出自家產品。
平台改善的第二個重要部分就是推出 NVSwitch,藉由全新的 NVSwitch 技術,透過 12 個 NVSwitch 晶片一口氣將 16 張 Tesla V100 GPU 串接,使得 16 張 Tesla V100 能夠共享運算資源、記憶體並且相互溝通,構成一個超大型 GPU 。
NVSwitch 由台積電代工,基本通道仍是基於原本最多可串接 8 組 Tesla V100 GPU 的 NVLink 2 ,故 DGX 2 實際上是將 2 組 NVLink2 通道利用 12 個 NVSwitch 相互串接,打通 16 個 Tesla V100 的溝通通道 ,單一 NVSwitch 供高達 2.4TB 的頻寬,讓 GPU 彼此之間無論是溝通、記憶體共享以及偕同運算等如同一個巨大 GPU。
Nvidia 表示,DGX-2 是世界上第一個 2 PetaFLOP(每秒 2 x 10 ^ 15 個浮點運算)系統,「專為數據科學家推動深度學習研究和計算的極限而設計。」
除了深度學習應用程序之外,新款 32GB GPU 在各種高性能計算(HPC)方案中都可良好運作。為此,Nvidia 正在更新其 CUDA,TensorRT,NCCL 和 cuDNN 軟件以及 Isaac 機器人 SDK。
上述 TensorRT 軟件是一種深度學習推理優化器。根據 Nvidia 的說法,TensorRT 4 是最新版本,運算速度較 CPU 運算高出 190 倍。
另外,NVIDIA 在 GTC 2017 公布了開源機器學習推理加速器架構 NVDLA ,而在稍早的 2018 GTC 大會進一步宣布與 Arm 合作,將 NVDLA 整合到 ARM 今年二月所公布的人工智慧平台計畫 Project Trillium 當中。
該專案是由 Arm 所推出的機器學習運算解決方案,主要提供所有終端裝置,例如手機、平板電腦、感測器或 IoT 設備等,針對人工智慧所依賴的神經網絡(neural network)運算進行加速。
Project Trillium 被視為 Arm 進一步透過人工智慧應用,進軍物聯網市場的重要策略。藉由雙方合作,NVIDIA 可進一步將深度運算加速器架構推展到 Arm 的市場。
- 遊學是年輕人的專利? 壯世代遊學團正夯!
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇