常聽人說AI對存儲性能提出了新需求,那么AI對存儲有怎樣的需求呢?
人工智能全流程中,涉及數據的采集、數據的預處理、模型訓練、模型部署等環節,跟以往操作差異最大的在于訓練環節,為此,有外媒動手做了一個評測。結果顯示,在訓練環節,高性能存儲設備對于性能的提升完全沒有幫助。
測試架構是這樣的,一臺戴爾PowerEdge R740xd服務器,有兩塊至強黃金6130 CPU,256GB DRAM內存,用它來運行byteLAKE的AI測試,測試的變量是三款SSD,一個是鎧俠SAS 口的PX04S,一個是三星的983ZET,還有一個是英特爾傲騰900P。
鎧俠SAS口 PX04S SSD
三星PCIe卡983ZET
英特爾傲騰900P
測試中分析了機器學習在訓練階段的性能表現,測試程序用的是byteLAKE的EWA Gurad,它是一個實時監測模型,該模型包括一個輸入層,22個卷積層,5個池化層,2個路由層,還有一個探測層。
測試優劣的評判標準是時間,就是做5000個Epoch所耗費的時間,每換一次SSD就進行一次測試,測試結果如下。
鎧俠 98小時 24分
三星 98小時 44分
英特爾 98小時 42分
明顯可見,本地的SSD對性能幾乎沒有影響,換了不同性能的SSD,既有SAS口的,也有PCIe口的,既有NAND SSD也有機遇3D Xpoint的SSD,最終性能表現都差不多。
在數據的獲取時,SSD會有優勢,但在計算環節,對SSD的要求并不高,那是不是說明CPU的訓練能力不夠,導致瓶頸呢?
為了進一步測試,在服務器里加入來了一塊英偉達T4顯卡,然后再跑一下測試。
鎧俠 4h 30分鐘
三星 4小時 28分鐘
Intel 4小時 27分鐘
GPU的加速效果還是非常明顯的,提升了22倍,計算性能提升來的話,SSD的性能差異是否明顯呢?從數據來看,顯然還是沒什么影響。
測試結果發現,高性能的存儲并沒有提升AI訓練階段的性能,由于AI模型的復雜結構限制,機器學習訓練的時間要遠遠高于數據載入的時間。雖然英偉達T4顯卡加速了機器學習的速度,但并沒有讓SSD發揮優勢,
當然,想要看具體某個零部件對于系統性能影響的話還需要許多細致的工作,比如,換一個AI框架,換別的零部件什么的。這一測試其實是有意義的,可以讓我們找出有利于性能提升的部分,把錢花在刀刃上。
責任編輯:pj
-
服務器
+關注
關注
14文章
10253瀏覽量
91487 -
AI
+關注
關注
91文章
39793瀏覽量
301406 -
人工智能
+關注
關注
1817文章
50098瀏覽量
265374
發布評論請先 登錄
超越臺積電?英特爾首個18A工藝芯片邁向大規模量產
全球首款落地!英特爾攜手新華三等合作伙伴,重磅推出全域液冷服務器
打造智算基石:英特爾攜手本土生態發布全域液冷服務器
英特爾攜本地生態伙伴發布雙路冷板式全域液冷服務器,引領數據中心散熱與能效革新
新一代戴爾PowerEdge服務器助力數據中心降本增效
看點:AMD服務器CPU市場份額追上英特爾 華為Mate80主動散熱專利曝光
英特爾服務器CPU市場失守:從99.9%到50%以下
主控CPU全能選手,英特爾至強6助力AI系統高效運轉
戴爾PowerEdge R7715服務器性能評測
英特爾發布全新GPU,AI和工作站迎來新選擇
戴爾PowerEdge R770服務器的性能測試
英特爾代工:明確重點廣合作,服務客戶鑄信任
戴爾PowerEdge XR7620邊緣服務器的性能實測
英特爾至強6:如何煉就數據中心“全能型選手”
戴爾PowerEdge R740xd服務器與英特爾傲騰900P的使用區別
評論