近兩年以來(lái)存儲(chǔ)市場(chǎng)可謂好不熱鬧,SSD帶來(lái)的急速已經(jīng)體現(xiàn)在了下至消費(fèi)電子,上至超算的性能上,然而隨著高性能計(jì)算走上了全新的道路,大吞吐量和大容量也已經(jīng)不再是HPC存儲(chǔ)關(guān)注的唯二設(shè)計(jì)目標(biāo)了。
那么當(dāng)下的HPC存儲(chǔ)遇上了哪些挑戰(zhàn)呢?首先數(shù)據(jù)生成已經(jīng)在被數(shù)據(jù)接入逐漸取代,大數(shù)據(jù)環(huán)境下,IOPS要求的反而是小數(shù)據(jù)的隨機(jī)存取。其次,“尋找”到真正所需的數(shù)據(jù)成了最關(guān)鍵的一環(huán),也對(duì)元數(shù)據(jù)在統(tǒng)計(jì)、讀取、寫入和刪除上提出了更高的要求。加之近年來(lái)涌現(xiàn)的不同文件與數(shù)據(jù)形式,處理起來(lái)需要額外的注意,高性能存儲(chǔ)必須具備大型數(shù)據(jù)轉(zhuǎn)移的能力。
新的高性能計(jì)算場(chǎng)景
就以目前一些在建的智能城市項(xiàng)目為例,諸多傳感器和執(zhí)行器散落在城市中,激光雷達(dá)、攝像頭、微流控傳感器和電機(jī),它們將產(chǎn)生PB級(jí)別的原始數(shù)據(jù),這些數(shù)據(jù)在需要經(jīng)過(guò)壓縮、預(yù)處理、上傳、深度學(xué)習(xí)和推理,存儲(chǔ)可以說(shuō)與邊緣計(jì)算和機(jī)器學(xué)習(xí)緊密聯(lián)系在一起。
另一個(gè)例子就是我們的自動(dòng)駕駛,如今的自動(dòng)駕駛方案都是通過(guò)數(shù)據(jù)與高性能計(jì)算實(shí)現(xiàn)的,像特斯拉這樣的廠商甚至自研自建芯片和超算,用于其自動(dòng)駕駛技術(shù)的開發(fā)。自動(dòng)駕駛測(cè)試車隊(duì)每天都要將PB級(jí)的遙測(cè)傳感數(shù)據(jù)傳輸給數(shù)據(jù)平臺(tái),隨后經(jīng)過(guò)標(biāo)簽、分類、錯(cuò)誤檢測(cè)和仿真,再放到大型存儲(chǔ)系統(tǒng)中,而這樣的大型存儲(chǔ)平臺(tái)不僅大小可能擴(kuò)展至EB級(jí),還要承受著仿真、再處理與機(jī)器學(xué)習(xí)的繁重負(fù)載。
在這些新場(chǎng)景給出的挑戰(zhàn)下,興起了一波新的技術(shù),比如PCIe 4.0朝PCIe 5.0轉(zhuǎn)變,光模塊從200G朝400G的轉(zhuǎn)變,使用GPU直接存儲(chǔ)等專用協(xié)議等等。這些技術(shù)多數(shù)是對(duì)HPC存儲(chǔ)在吞吐量上的提升,而更重要的是對(duì)特定工作流效率的優(yōu)化。
HPC系統(tǒng)中存儲(chǔ)的組成
在當(dāng)下的HPC場(chǎng)景中,無(wú)論是本地部署還是云端環(huán)境,都需要一個(gè)計(jì)算平臺(tái),可能是CPU或是CPU+GPU/加速器的配置,這一節(jié)點(diǎn)可以充分利用3D Xpoint這樣的持久內(nèi)存,不僅可以提供低延遲的內(nèi)存數(shù)據(jù)訪問(wèn),在斷電下不丟失數(shù)據(jù),還可以用上DAOS這樣分布式異步對(duì)象存儲(chǔ)的文件系統(tǒng)。

Lustre文件系統(tǒng) / Lustre
接著是存儲(chǔ)平臺(tái),也就是并行文件系統(tǒng)的所在,這個(gè)系統(tǒng)可能是基于Lustre、Spectrum或是NVMe-oF的方案。但無(wú)論是哪種系統(tǒng),考慮到需要低成本大容量,通常都會(huì)用到NVMe硬盤和HDD硬盤的混合方案,但這就提出了數(shù)據(jù)分布以及數(shù)據(jù)移動(dòng)上的挑戰(zhàn)。不過(guò)現(xiàn)在已經(jīng)有了PCC/LROC這樣的客戶端持久性高速緩存,在存儲(chǔ)或數(shù)據(jù)敏感的環(huán)境中,只需完成計(jì)算平臺(tái)和存儲(chǔ)平臺(tái)相關(guān)的數(shù)據(jù)移動(dòng),進(jìn)一步降低了I/O開銷。
最后是數(shù)據(jù)的管理,這一部分屬于對(duì)大量數(shù)據(jù)更加長(zhǎng)期的存儲(chǔ),比如像波音這樣的航空公司,需要對(duì)每一架飛機(jī)的細(xì)致數(shù)據(jù)存儲(chǔ)50年以上,還要具備數(shù)據(jù)追溯的能力。這樣的存儲(chǔ)并不需要擁有高速的性能,但在前端的程序需要時(shí)提供即時(shí)的交互,而且為了節(jié)能考慮,要做到所謂的“零功耗存儲(chǔ)”。
超算是怎么做的?
隨著不少超算都已經(jīng)在布局百億億級(jí)的系統(tǒng),作為HPC中最頂端的應(yīng)用,我們自然可以從中窺得一二,看一看當(dāng)下主流的HPC存儲(chǔ)方案。以計(jì)劃于今年打造完成的Frontier超算為例,該超算將成為美國(guó)第一臺(tái)百億億級(jí)別的超算,算力約為1.5 exaFLOPS。

Frontier超級(jí)計(jì)算機(jī) / AMD
Frontier采取了AMD的全套方案,結(jié)合AMD的EPyc CPU和Radeon Instinct GPU,在AMD的緩存一致性互聯(lián)方案下,CPU上的代碼可以直接訪問(wèn)GPU內(nèi)存,這也就是我們?cè)谏衔奶岬降腉PU直接存儲(chǔ)技術(shù)。在存儲(chǔ)系統(tǒng)上,F(xiàn)rontier用到了679PB基于Lustre+ZFS的文件系統(tǒng)方案,用47700塊硬盤實(shí)現(xiàn),最高速率可達(dá)5TB/s。高速存儲(chǔ)上,共有5400塊NVMe固態(tài)硬盤組成11PB的存儲(chǔ)空間,提供10TB/s的讀取速度。

Aurora超級(jí)計(jì)算機(jī) / 英特爾
而Aurora同樣作為今年推出的百億億級(jí)超算系統(tǒng),則選擇了英特爾的方案,單個(gè)計(jì)算節(jié)點(diǎn)由兩個(gè)Xeon Sapphire Rapids、6個(gè)Xe Ponte Vecchio GPU和一個(gè)通用內(nèi)存架構(gòu)組成。其主要存儲(chǔ)方案也選擇了英特爾的DAOS文件系統(tǒng),結(jié)合NVMe和傲騰持久內(nèi)存,組成一套大于230PB的系統(tǒng),并實(shí)現(xiàn)25TB/s的速度。
小結(jié)
在HPC存儲(chǔ)上的挑戰(zhàn)除了以上提到的這些外,還有近來(lái)興起的存內(nèi)計(jì)算激發(fā)的計(jì)算能力挑戰(zhàn),未來(lái)5年內(nèi),無(wú)論是存儲(chǔ)結(jié)構(gòu)、文件系統(tǒng)乃至存儲(chǔ)材料都會(huì)再度迎來(lái)新的變化。這些變化會(huì)先一步解決HPC上的難題,再潛移默化地改善日常應(yīng)用。
那么當(dāng)下的HPC存儲(chǔ)遇上了哪些挑戰(zhàn)呢?首先數(shù)據(jù)生成已經(jīng)在被數(shù)據(jù)接入逐漸取代,大數(shù)據(jù)環(huán)境下,IOPS要求的反而是小數(shù)據(jù)的隨機(jī)存取。其次,“尋找”到真正所需的數(shù)據(jù)成了最關(guān)鍵的一環(huán),也對(duì)元數(shù)據(jù)在統(tǒng)計(jì)、讀取、寫入和刪除上提出了更高的要求。加之近年來(lái)涌現(xiàn)的不同文件與數(shù)據(jù)形式,處理起來(lái)需要額外的注意,高性能存儲(chǔ)必須具備大型數(shù)據(jù)轉(zhuǎn)移的能力。
新的高性能計(jì)算場(chǎng)景
就以目前一些在建的智能城市項(xiàng)目為例,諸多傳感器和執(zhí)行器散落在城市中,激光雷達(dá)、攝像頭、微流控傳感器和電機(jī),它們將產(chǎn)生PB級(jí)別的原始數(shù)據(jù),這些數(shù)據(jù)在需要經(jīng)過(guò)壓縮、預(yù)處理、上傳、深度學(xué)習(xí)和推理,存儲(chǔ)可以說(shuō)與邊緣計(jì)算和機(jī)器學(xué)習(xí)緊密聯(lián)系在一起。
另一個(gè)例子就是我們的自動(dòng)駕駛,如今的自動(dòng)駕駛方案都是通過(guò)數(shù)據(jù)與高性能計(jì)算實(shí)現(xiàn)的,像特斯拉這樣的廠商甚至自研自建芯片和超算,用于其自動(dòng)駕駛技術(shù)的開發(fā)。自動(dòng)駕駛測(cè)試車隊(duì)每天都要將PB級(jí)的遙測(cè)傳感數(shù)據(jù)傳輸給數(shù)據(jù)平臺(tái),隨后經(jīng)過(guò)標(biāo)簽、分類、錯(cuò)誤檢測(cè)和仿真,再放到大型存儲(chǔ)系統(tǒng)中,而這樣的大型存儲(chǔ)平臺(tái)不僅大小可能擴(kuò)展至EB級(jí),還要承受著仿真、再處理與機(jī)器學(xué)習(xí)的繁重負(fù)載。
在這些新場(chǎng)景給出的挑戰(zhàn)下,興起了一波新的技術(shù),比如PCIe 4.0朝PCIe 5.0轉(zhuǎn)變,光模塊從200G朝400G的轉(zhuǎn)變,使用GPU直接存儲(chǔ)等專用協(xié)議等等。這些技術(shù)多數(shù)是對(duì)HPC存儲(chǔ)在吞吐量上的提升,而更重要的是對(duì)特定工作流效率的優(yōu)化。
HPC系統(tǒng)中存儲(chǔ)的組成
在當(dāng)下的HPC場(chǎng)景中,無(wú)論是本地部署還是云端環(huán)境,都需要一個(gè)計(jì)算平臺(tái),可能是CPU或是CPU+GPU/加速器的配置,這一節(jié)點(diǎn)可以充分利用3D Xpoint這樣的持久內(nèi)存,不僅可以提供低延遲的內(nèi)存數(shù)據(jù)訪問(wèn),在斷電下不丟失數(shù)據(jù),還可以用上DAOS這樣分布式異步對(duì)象存儲(chǔ)的文件系統(tǒng)。

Lustre文件系統(tǒng) / Lustre
接著是存儲(chǔ)平臺(tái),也就是并行文件系統(tǒng)的所在,這個(gè)系統(tǒng)可能是基于Lustre、Spectrum或是NVMe-oF的方案。但無(wú)論是哪種系統(tǒng),考慮到需要低成本大容量,通常都會(huì)用到NVMe硬盤和HDD硬盤的混合方案,但這就提出了數(shù)據(jù)分布以及數(shù)據(jù)移動(dòng)上的挑戰(zhàn)。不過(guò)現(xiàn)在已經(jīng)有了PCC/LROC這樣的客戶端持久性高速緩存,在存儲(chǔ)或數(shù)據(jù)敏感的環(huán)境中,只需完成計(jì)算平臺(tái)和存儲(chǔ)平臺(tái)相關(guān)的數(shù)據(jù)移動(dòng),進(jìn)一步降低了I/O開銷。
最后是數(shù)據(jù)的管理,這一部分屬于對(duì)大量數(shù)據(jù)更加長(zhǎng)期的存儲(chǔ),比如像波音這樣的航空公司,需要對(duì)每一架飛機(jī)的細(xì)致數(shù)據(jù)存儲(chǔ)50年以上,還要具備數(shù)據(jù)追溯的能力。這樣的存儲(chǔ)并不需要擁有高速的性能,但在前端的程序需要時(shí)提供即時(shí)的交互,而且為了節(jié)能考慮,要做到所謂的“零功耗存儲(chǔ)”。
超算是怎么做的?
隨著不少超算都已經(jīng)在布局百億億級(jí)的系統(tǒng),作為HPC中最頂端的應(yīng)用,我們自然可以從中窺得一二,看一看當(dāng)下主流的HPC存儲(chǔ)方案。以計(jì)劃于今年打造完成的Frontier超算為例,該超算將成為美國(guó)第一臺(tái)百億億級(jí)別的超算,算力約為1.5 exaFLOPS。

Frontier超級(jí)計(jì)算機(jī) / AMD
Frontier采取了AMD的全套方案,結(jié)合AMD的EPyc CPU和Radeon Instinct GPU,在AMD的緩存一致性互聯(lián)方案下,CPU上的代碼可以直接訪問(wèn)GPU內(nèi)存,這也就是我們?cè)谏衔奶岬降腉PU直接存儲(chǔ)技術(shù)。在存儲(chǔ)系統(tǒng)上,F(xiàn)rontier用到了679PB基于Lustre+ZFS的文件系統(tǒng)方案,用47700塊硬盤實(shí)現(xiàn),最高速率可達(dá)5TB/s。高速存儲(chǔ)上,共有5400塊NVMe固態(tài)硬盤組成11PB的存儲(chǔ)空間,提供10TB/s的讀取速度。

Aurora超級(jí)計(jì)算機(jī) / 英特爾
而Aurora同樣作為今年推出的百億億級(jí)超算系統(tǒng),則選擇了英特爾的方案,單個(gè)計(jì)算節(jié)點(diǎn)由兩個(gè)Xeon Sapphire Rapids、6個(gè)Xe Ponte Vecchio GPU和一個(gè)通用內(nèi)存架構(gòu)組成。其主要存儲(chǔ)方案也選擇了英特爾的DAOS文件系統(tǒng),結(jié)合NVMe和傲騰持久內(nèi)存,組成一套大于230PB的系統(tǒng),并實(shí)現(xiàn)25TB/s的速度。
小結(jié)
在HPC存儲(chǔ)上的挑戰(zhàn)除了以上提到的這些外,還有近來(lái)興起的存內(nèi)計(jì)算激發(fā)的計(jì)算能力挑戰(zhàn),未來(lái)5年內(nèi),無(wú)論是存儲(chǔ)結(jié)構(gòu)、文件系統(tǒng)乃至存儲(chǔ)材料都會(huì)再度迎來(lái)新的變化。這些變化會(huì)先一步解決HPC上的難題,再潛移默化地改善日常應(yīng)用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4791瀏覽量
90064 -
HPC
+關(guān)注
關(guān)注
0文章
346瀏覽量
24976 -
超算
+關(guān)注
關(guān)注
1文章
118瀏覽量
9532
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
國(guó)產(chǎn)高性能ONFI IP解決方案全解析
)時(shí)代,數(shù)據(jù)存儲(chǔ)的吞吐量瓶頸日益凸顯,高性能的ONFI IP能夠確保大規(guī)模數(shù)據(jù)的高效存取,是SSD及先進(jìn)存儲(chǔ)系統(tǒng)的核心技術(shù)基石。2. 奎芯科技 ONFI IP 的核心技術(shù)規(guī)格奎芯科技提
發(fā)表于 01-13 16:15
國(guó)產(chǎn)高性能ONFI IP解決方案全解析
(HPC)時(shí)代,數(shù)據(jù)存儲(chǔ)的吞吐量瓶頸日益凸顯,高性能的ONFI IP能夠確保大規(guī)模數(shù)據(jù)的高效存取,是SSD及先進(jìn)存儲(chǔ)系統(tǒng)的核心技術(shù)基石。 2.?奎芯科技 ONFI IP?的核心技術(shù)規(guī)格
存儲(chǔ)迭代暗涌:HBM4與UFS4.1浪潮下,燒錄環(huán)節(jié)何以成為新瓶頸?
存儲(chǔ)芯片市場(chǎng)擴(kuò)產(chǎn)繁榮,HBM4、UFS4.1等先進(jìn)技術(shù)加速量產(chǎn),但被低估的燒錄環(huán)節(jié)成關(guān)鍵瓶頸。先進(jìn)存儲(chǔ)對(duì)燒錄的速度、精度和協(xié)議復(fù)雜度提出極高要求,面臨三重技術(shù)關(guān)卡。需專用燒錄方案突破
高性能網(wǎng)絡(luò)存儲(chǔ)設(shè)計(jì):NVMe-oF IP的實(shí)現(xiàn)探討
的 NVMeRAID0 橫向擴(kuò)展能力,通過(guò)多通道NVMe控制器并行訪問(wèn)多個(gè)SSD,實(shí)現(xiàn)以下技術(shù)特性:
?多 SSD 帶寬聚合,讀寫性能接近線性提升
?跨盤條帶(Striping)調(diào)度優(yōu)化,減少跨盤等待
發(fā)表于 12-19 18:45
當(dāng)AI運(yùn)行遭遇存儲(chǔ)瓶頸:一個(gè)專業(yè)硬盤盒如何讓性能提升40%?
在AI項(xiàng)目的整個(gè)生命周期中,數(shù)據(jù)存儲(chǔ)的效能直接決定了工作流的順暢程度。面對(duì)海量的訓(xùn)練集和頻繁的模型迭代,普通存儲(chǔ)設(shè)備往往在速度、散熱與擴(kuò)展性上力不從心,成為隱形的性能
全球前四!京東云云海AI存儲(chǔ)躋身IO500高性能存儲(chǔ)榜單
存儲(chǔ)技術(shù),云海AI存儲(chǔ)不采用 PMEM 硬件,具備更強(qiáng)通用性的同時(shí)也實(shí)現(xiàn)了更低存儲(chǔ)成本。 IO500是全球高性能計(jì)算HPC領(lǐng)域最權(quán)威、最具影響力的存
武漢芯源小容量存儲(chǔ)芯片EEPROM產(chǎn)品的特點(diǎn)
和讀取,適用于需要長(zhǎng)期保存關(guān)鍵數(shù)據(jù)的設(shè)備。
多種存儲(chǔ)容量:武漢芯源半導(dǎo)體的EEPROM產(chǎn)品提供多種存儲(chǔ)容量選擇,從2KB到512KB不等,以滿足不同應(yīng)用的需求。
先進(jìn)的工藝:采用華虹95nm最先進(jìn)工藝制造
發(fā)表于 11-21 07:10
推薦高性能存儲(chǔ)psram芯片
智能穿戴、物聯(lián)網(wǎng)設(shè)備和端側(cè)AI應(yīng)用快速發(fā)展,PSRAM偽靜態(tài)隨機(jī)存儲(chǔ)器,正成為越來(lái)越多嵌入式系統(tǒng)的優(yōu)選方案,如何選擇一個(gè)高性能、小尺寸與低功耗的psram芯片是一個(gè)值得思考的問(wèn)題。由EMI自主研發(fā)
不止于4層!華秋PCB 6層板爆款重磅上線
4層之后,再看6層上月,華秋PCB推出了4層板爆款,以“真香”價(jià)格引爆市場(chǎng)。今天,華秋PCB懷著更大的誠(chéng)意,為您帶來(lái)承諾中的下一站——「華秋PCB6層板爆款」正式登場(chǎng)!不止于降價(jià),我們重新定義6層板
華納云為游戲數(shù)據(jù)庫(kù)選擇高性能NVMe SSD存儲(chǔ)
游戲數(shù)據(jù)庫(kù)對(duì)速度、可靠性和可擴(kuò)展性有極高要求。隨著在線游戲的發(fā)展,開發(fā)者越來(lái)越依賴NVMe SSD存儲(chǔ)來(lái)提供服務(wù)器租用和服務(wù)器托管解決方案。本文將指導(dǎo)您了解為游戲數(shù)據(jù)庫(kù)選擇高性能NVMe SSD
RF SoC技術(shù)構(gòu)建高性能雷達(dá)信號(hào)收發(fā)系統(tǒng)丨應(yīng)對(duì)多通道、高速度與同步挑戰(zhàn)
RF SoC技術(shù)構(gòu)建高性能雷達(dá)信號(hào)收發(fā)系統(tǒng)|應(yīng)對(duì)多通道、高速度與同步挑戰(zhàn) 高性能雷達(dá)信號(hào)收發(fā)系統(tǒng)集成了 高速信號(hào)采集、同步發(fā)射、大容量數(shù)據(jù)存儲(chǔ)
高性能存儲(chǔ)控制器的技術(shù)解析
SSD2351芯片:高性能存儲(chǔ)控制器的技術(shù)解析** ? SSD2351是一款由行業(yè)領(lǐng)先廠商推出的高性能固態(tài)硬盤(SSD)主控芯片,專為滿足現(xiàn)代數(shù)據(jù)中心、企業(yè)存儲(chǔ)和
半導(dǎo)體存儲(chǔ)芯片核心解析
(FTL,磨損均衡,糾錯(cuò)等),存在讀寫干擾問(wèn)題。
結(jié)構(gòu)演進(jìn):
平面 NAND:傳統(tǒng)二維結(jié)構(gòu),工藝微縮遇到瓶頸。
3D NAND:將存儲(chǔ)單元垂直堆疊(幾十層到幾百層),突破密度限制,降低成本,提高性能
發(fā)表于 06-24 09:09
TurMass?:高性能全國(guó)產(chǎn)無(wú)線物聯(lián)網(wǎng)技術(shù)解析,突破 LPWAN 瓶頸
TurMass? 技術(shù)憑借其在大規(guī)模多天線技術(shù)、高性能調(diào)制技術(shù)、高效時(shí)隙雙工、大容量多址接入、低功耗設(shè)計(jì)以及強(qiáng)大的抗干擾能力等多方面的卓越表現(xiàn),為窄帶無(wú)線傳輸領(lǐng)域帶來(lái)了革命性的變革。
西部數(shù)據(jù)推出大容量存儲(chǔ)方案,賦能NAS用戶、創(chuàng)意專業(yè)人士與內(nèi)容創(chuàng)作者
了更高的要求。隨著當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的需求不斷增長(zhǎng),西部數(shù)據(jù)公司(NASDAQ: WDC)推出了一系列全新升級(jí)的產(chǎn)品,旨在滿足市場(chǎng)對(duì)大容量存儲(chǔ)解決方案的迫切需求。 大容量與高性能的HDD賦能
發(fā)表于 03-12 16:16
?537次閱讀
速度和容量受制?No!高性能存儲(chǔ)的瓶頸不止于此
評(píng)論