英偉達剛剛公布了采用 Ampere 架構(gòu)的 A100 GPU 的首份實際性能數(shù)據(jù):可知其在特定的 AI 基準測試項目中一共打破了 16 項性能紀錄,速度是 Volta V100 的 4.2 倍,較主要競爭對手取得了巨大的領(lǐng)先優(yōu)勢。首先,2018 年面世的 MLPerf 主要側(cè)重于機器學習性能。該基準測試套件總共包括了八項測試,但英偉達 Ampere A100 GPU 的訓練速度已經(jīng)全面實現(xiàn)了超越。

(來自:Nvidia)
其次,英偉達分享了 DGX SuperPOD 系統(tǒng)取得的八項新紀錄。該系統(tǒng)通過 HDR InfiniBand 連接到一起,構(gòu)成了一個龐大的 DGX A100 高性能計算系統(tǒng)集群。
DGX SuperPod 由 140 個 DGX A100 系統(tǒng)組成,共計擁有 1120 個 NVIDIA Ampere A100 GPU、170 個 Mellanox Quantum 200G Infiniband 交換機、4 PB 存儲空間、以及 15 公里的光纜。

令人贊嘆的 DGX SuperPod 系統(tǒng)中包括大約 770 萬個 Ampere CUDA 核心,作為 DGX V 擴展計劃的一部分,其為該系統(tǒng)增加了近乎 700 Petaflops 的算力,目前已部署在加州圣克拉拉市的英偉達公司總部。

通過與上一代 Volta V100(以及谷歌第三代 TPU 和華為 Ascend HPC 等新品)進行比較,可知 Ampere A100 Tensor Core GPU 加速卡的性能增長也是相當驚人。
此外在 MLPerf 基準測試套件的詳細結(jié)果中,還對即將推出的 AI 加速方案進行了預覽,比如英特爾的 Cooper Lake-SP 至強處理器、以及谷歌的第四代 TPU 。

MLPerf 表示,其基準測試套件可對機器學習(ML)和人工智能(AI)工作負載進行評估,結(jié)果發(fā)現(xiàn) Ampere A100 性能是 Volta V100 的 2.5 倍。即便是提升最小的項目,其領(lǐng)先幅度也有近 50% 。
相比之下,華為 Ascend 芯片只能及時完成一項測試、且性能遠不及 Volta V100 。谷歌第三代 TPU 也只能及時完成兩項測試,第一項較 Volta V100 領(lǐng)先 20%,第二項卻又落后 10% 。

至于八槽的 Cooper Lake-SP 平臺,其能夠在 1104.53 分鐘內(nèi)完成圖像分類測試項目,但是英偉達的雙 Ampere A100 系統(tǒng)只需 33.37 分鐘。至于明年的谷歌第四代 TPU,目前尚不知曉其具有多大的優(yōu)勢。

最后,英偉達展示了其 GPU 加速卡在 AI Full-Stack Innovations 項目中的表現(xiàn)。上一代 Volta V100 平臺的 MLPerf 0.5 基準測試項目對比,Ampere A100 平臺上的的 MLPerf 0.7 基準測試有 4.2 倍的性能提升。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔此類作品侵權(quán)行為的直接責任及連帶責任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷,低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國內(nèi)免費AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時代,個人站長如何用AI工具實現(xiàn)“一人公司”
- 個人站長消亡論?從“消失”到“重生”的三大破局路徑
- raksmart法蘭克福云服務(wù)器延遲高嗎?
- 常見的海外站群服務(wù)器有哪些?地區(qū)選擇與核心優(yōu)勢解析
- 自媒體人搭建直播服務(wù)器使用raksmart優(yōu)化技巧