電子發(fā)燒友網(wǎng)報道(文/周凱揚)當下服務(wù)器市場在內(nèi)存上面臨的一大挑戰(zhàn)就是成本,截至今日,我們在選擇云服務(wù)容器時,內(nèi)存依然占了很大一部分,往往內(nèi)存用量擴大一倍后,價格也隨之上漲了一倍。這其實與內(nèi)存本身的擴展性有關(guān),目前服務(wù)器上更大的存儲已經(jīng)成為常態(tài),但要想實現(xiàn)更大的內(nèi)存始終存在瓶頸。因此,從2013年開始,每bit內(nèi)存的價格基本趨于平緩了。
但服務(wù)器CPU的核心數(shù)增加的速度可沒有因此減緩下來,加上AI等新型工作負載的引入,更大的內(nèi)存容量、更大的內(nèi)存帶寬,都成了當下服務(wù)器內(nèi)存面臨的痛點。為此,業(yè)界開始考慮從系統(tǒng)層級上來解決這些問題,比如為CPU增加DDR通道,好讓其支持更大的帶寬和容量。
但這就又引入了一系列新問題,為了滿足新增的DDR通道,需要更多的引腳,也提高了成本降低了可靠性,PCB的層數(shù)也開始增加。這也造就了整個服務(wù)器主板的尺寸變得異常大,甚至難以放進1U標準尺寸的機柜里。
CXL的靈活性和延遲
這時對于內(nèi)存媒介無限制的CXL,就提供了一個靈活的內(nèi)存接口,讓設(shè)計者可以從持久性、延遲、帶寬等各個參數(shù)特性上靈活選擇,讓服務(wù)器CPU不止可以使用常用的DDR內(nèi)存,也能支持LPDDR5和持久內(nèi)存等等。我們此前已經(jīng)多次介紹過CXL了,這次就來講下作為內(nèi)存擴展,CXL有哪些優(yōu)勢。
比如一個80核的CPU,應(yīng)用要求每個核心配置2GB的DDR5內(nèi)存,也就是需要160GB的DDR5內(nèi)存。如果采用16GB DIMM x8的配置明顯滿足不了,32GB x 8多出了96GB內(nèi)存,徒增了近乎500美元的成本,使用32GB x 5這樣不跑滿通道的配置雖然容量對了,但是會降低帶寬和性能。
而這時我們反觀CXL,CXL可以在配置了原生DDR通道配置了8個16GB DIMM的情況下,再加入32GB的CXL內(nèi)存,如此一來不僅滿足了內(nèi)存容量的需求,還增加了額外的帶寬,況且我們已經(jīng)提到了CXL并沒有內(nèi)存媒介的限制,所以可以用上LPDDR5之類的CXL擴展內(nèi)存進一步降低成本。

各種緩存、內(nèi)存和存儲的延遲對比 / CXL聯(lián)盟
作為一個分布式內(nèi)存,盡管CXL主打的是低延遲,但要說與CPU的內(nèi)存、緩存和寄存器比起來,延遲還是有一定差距的。今年的Hot Chips上,CXL聯(lián)盟就給出了CXL在延遲上的具體數(shù)字。獨立于CPU外的CXL內(nèi)存延遲在170-250ns左右,高過獨立于CPU的NVM、網(wǎng)絡(luò)連接的解構(gòu)內(nèi)存、SSD和HDD等。
雖然在我們看來這個數(shù)字已經(jīng)很小了,但相較原生的主要內(nèi)存,還是把延遲擴大了兩倍。來自Meta和AMD的兩位專家提出了一個概念,也就是對內(nèi)存進行分層,分為用于實時分析等關(guān)鍵任務(wù)的“熱”內(nèi)存、訪問不那么頻繁的“暖”內(nèi)存和用于龐大數(shù)據(jù)的“冷”內(nèi)存。“熱”內(nèi)存頁面放在原生DDR內(nèi)存里,而“冷”內(nèi)存頁面則交給CXL內(nèi)存。
然而在當前的軟件眼里,它們才分不清楚什么是“熱”內(nèi)存和“冷”內(nèi)存,原生內(nèi)存用完后,就開始去占用CXL內(nèi)存,如此一來原本作為“冷”內(nèi)存的CXL,也開始變成“熱”內(nèi)存。所以目前最大的挑戰(zhàn)就是在操作系統(tǒng)和軟件層面,如何檢測到“冷”內(nèi)存頁面,將其主動轉(zhuǎn)入CXL內(nèi)存里,為原生內(nèi)存留出空間。Meta和AMD的兩位專家表示,他們已經(jīng)在開發(fā)相應(yīng)的軟硬件技術(shù)。
CXL或許不會成為HPC和AI應(yīng)用的寵兒
固然CXL對于云服務(wù)廠商和諸多數(shù)據(jù)中心擁有不錯的吸引力,然而這種形式的內(nèi)存可能并不適用于HPC與超算應(yīng)用。“富岳之父”松岡聰教授表示CXL這種內(nèi)存解構(gòu)方案還存在不少技術(shù)問題,使其不能在主流的HPC甚至是AI負載中物盡其用。松岡聰教授并沒有給出具體的細節(jié),但他給出了一個例子,那就是多年前SGI的NUMALINK系統(tǒng)也是采用了分布式內(nèi)存解構(gòu)的方式,但我們也都知道如今市面上的NUMALINK產(chǎn)品基本已經(jīng)銷聲匿跡了。
但他并沒有徹底否認內(nèi)存解構(gòu)這種思路,就連富岳超算本身也用這一技術(shù),從而將MPI進行put/get運算時的遠程內(nèi)存訪問延遲降低至亞微秒級。但加入一個單獨的UMA內(nèi)存池,已經(jīng)在歷史中證明了這對HPC來說收效甚微。
首先,這需要更高硬件交換機成本,再者,在超算這種大型配置規(guī)模的系統(tǒng)上,缺乏對應(yīng)的編程標準。因此,對于目前的HPC大型系統(tǒng)來說,CXL內(nèi)存或許會先出現(xiàn)在一小部分節(jié)點上,比如一些需要近存或存內(nèi)計算AI負載,而不會普及到整個系統(tǒng)。
寫在最后
其實對于CXL的擔心也沒必要那么多,對于服務(wù)器市場來說,低核心數(shù)的CPU依然會繼續(xù)使用原生DDR通道來配置DIMM內(nèi)存。到了高核心數(shù)CPU上,再根據(jù)系統(tǒng)成本、容量、功耗和帶寬等參數(shù)來靈活應(yīng)用CXL內(nèi)存,而這才是CXL帶來的最大優(yōu)勢,靈活性。況且目前CXL內(nèi)存還沒有大規(guī)模量產(chǎn)出來,自然也沒有普及開來,大家對其實際性能表現(xiàn)還沒有個大致了解,也許引入CXL的延遲后,對性能的損失不會那么糟糕。
但服務(wù)器CPU的核心數(shù)增加的速度可沒有因此減緩下來,加上AI等新型工作負載的引入,更大的內(nèi)存容量、更大的內(nèi)存帶寬,都成了當下服務(wù)器內(nèi)存面臨的痛點。為此,業(yè)界開始考慮從系統(tǒng)層級上來解決這些問題,比如為CPU增加DDR通道,好讓其支持更大的帶寬和容量。
但這就又引入了一系列新問題,為了滿足新增的DDR通道,需要更多的引腳,也提高了成本降低了可靠性,PCB的層數(shù)也開始增加。這也造就了整個服務(wù)器主板的尺寸變得異常大,甚至難以放進1U標準尺寸的機柜里。
CXL的靈活性和延遲
這時對于內(nèi)存媒介無限制的CXL,就提供了一個靈活的內(nèi)存接口,讓設(shè)計者可以從持久性、延遲、帶寬等各個參數(shù)特性上靈活選擇,讓服務(wù)器CPU不止可以使用常用的DDR內(nèi)存,也能支持LPDDR5和持久內(nèi)存等等。我們此前已經(jīng)多次介紹過CXL了,這次就來講下作為內(nèi)存擴展,CXL有哪些優(yōu)勢。
比如一個80核的CPU,應(yīng)用要求每個核心配置2GB的DDR5內(nèi)存,也就是需要160GB的DDR5內(nèi)存。如果采用16GB DIMM x8的配置明顯滿足不了,32GB x 8多出了96GB內(nèi)存,徒增了近乎500美元的成本,使用32GB x 5這樣不跑滿通道的配置雖然容量對了,但是會降低帶寬和性能。
而這時我們反觀CXL,CXL可以在配置了原生DDR通道配置了8個16GB DIMM的情況下,再加入32GB的CXL內(nèi)存,如此一來不僅滿足了內(nèi)存容量的需求,還增加了額外的帶寬,況且我們已經(jīng)提到了CXL并沒有內(nèi)存媒介的限制,所以可以用上LPDDR5之類的CXL擴展內(nèi)存進一步降低成本。

各種緩存、內(nèi)存和存儲的延遲對比 / CXL聯(lián)盟
作為一個分布式內(nèi)存,盡管CXL主打的是低延遲,但要說與CPU的內(nèi)存、緩存和寄存器比起來,延遲還是有一定差距的。今年的Hot Chips上,CXL聯(lián)盟就給出了CXL在延遲上的具體數(shù)字。獨立于CPU外的CXL內(nèi)存延遲在170-250ns左右,高過獨立于CPU的NVM、網(wǎng)絡(luò)連接的解構(gòu)內(nèi)存、SSD和HDD等。
雖然在我們看來這個數(shù)字已經(jīng)很小了,但相較原生的主要內(nèi)存,還是把延遲擴大了兩倍。來自Meta和AMD的兩位專家提出了一個概念,也就是對內(nèi)存進行分層,分為用于實時分析等關(guān)鍵任務(wù)的“熱”內(nèi)存、訪問不那么頻繁的“暖”內(nèi)存和用于龐大數(shù)據(jù)的“冷”內(nèi)存。“熱”內(nèi)存頁面放在原生DDR內(nèi)存里,而“冷”內(nèi)存頁面則交給CXL內(nèi)存。
然而在當前的軟件眼里,它們才分不清楚什么是“熱”內(nèi)存和“冷”內(nèi)存,原生內(nèi)存用完后,就開始去占用CXL內(nèi)存,如此一來原本作為“冷”內(nèi)存的CXL,也開始變成“熱”內(nèi)存。所以目前最大的挑戰(zhàn)就是在操作系統(tǒng)和軟件層面,如何檢測到“冷”內(nèi)存頁面,將其主動轉(zhuǎn)入CXL內(nèi)存里,為原生內(nèi)存留出空間。Meta和AMD的兩位專家表示,他們已經(jīng)在開發(fā)相應(yīng)的軟硬件技術(shù)。
CXL或許不會成為HPC和AI應(yīng)用的寵兒
固然CXL對于云服務(wù)廠商和諸多數(shù)據(jù)中心擁有不錯的吸引力,然而這種形式的內(nèi)存可能并不適用于HPC與超算應(yīng)用。“富岳之父”松岡聰教授表示CXL這種內(nèi)存解構(gòu)方案還存在不少技術(shù)問題,使其不能在主流的HPC甚至是AI負載中物盡其用。松岡聰教授并沒有給出具體的細節(jié),但他給出了一個例子,那就是多年前SGI的NUMALINK系統(tǒng)也是采用了分布式內(nèi)存解構(gòu)的方式,但我們也都知道如今市面上的NUMALINK產(chǎn)品基本已經(jīng)銷聲匿跡了。
但他并沒有徹底否認內(nèi)存解構(gòu)這種思路,就連富岳超算本身也用這一技術(shù),從而將MPI進行put/get運算時的遠程內(nèi)存訪問延遲降低至亞微秒級。但加入一個單獨的UMA內(nèi)存池,已經(jīng)在歷史中證明了這對HPC來說收效甚微。
首先,這需要更高硬件交換機成本,再者,在超算這種大型配置規(guī)模的系統(tǒng)上,缺乏對應(yīng)的編程標準。因此,對于目前的HPC大型系統(tǒng)來說,CXL內(nèi)存或許會先出現(xiàn)在一小部分節(jié)點上,比如一些需要近存或存內(nèi)計算AI負載,而不會普及到整個系統(tǒng)。
寫在最后
其實對于CXL的擔心也沒必要那么多,對于服務(wù)器市場來說,低核心數(shù)的CPU依然會繼續(xù)使用原生DDR通道來配置DIMM內(nèi)存。到了高核心數(shù)CPU上,再根據(jù)系統(tǒng)成本、容量、功耗和帶寬等參數(shù)來靈活應(yīng)用CXL內(nèi)存,而這才是CXL帶來的最大優(yōu)勢,靈活性。況且目前CXL內(nèi)存還沒有大規(guī)模量產(chǎn)出來,自然也沒有普及開來,大家對其實際性能表現(xiàn)還沒有個大致了解,也許引入CXL的延遲后,對性能的損失不會那么糟糕。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
服務(wù)器
+關(guān)注
關(guān)注
14文章
10251瀏覽量
91480 -
2cxl
+關(guān)注
關(guān)注
0文章
5瀏覽量
6530
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
網(wǎng)絡(luò)授時服務(wù)器 ntp時間服務(wù)器品牌 校時服務(wù)器廠家#電工
服務(wù)器
jf_47371611
發(fā)布于 :2026年02月11日 17:53:43
時鐘服務(wù)器廠商 gps網(wǎng)絡(luò)校時服務(wù)器 衛(wèi)星時鐘服務(wù)器#電工
服務(wù)器
jf_47371611
發(fā)布于 :2026年02月11日 17:50:52
Penguin Solutions SMART Modular CXL NV-CMM E3.S 2T 內(nèi)存模塊通過 CXL 兼容性認證
失性內(nèi)存模塊已成功通過 CXL? 兼容性測試。此項里程碑不僅代表產(chǎn)品符合行業(yè)標準,也進一步確立 Penguin Solutions 在 CXL 先進內(nèi)存技術(shù)領(lǐng)域中值得信賴的領(lǐng)導地位。該
服務(wù)器數(shù)據(jù)恢復—服務(wù)器斷電導致raid模塊損壞的數(shù)據(jù)恢復案例
某品牌服務(wù)器中有12塊硬盤,組建了一組raid5磁盤陣列,服務(wù)器內(nèi)存儲的是普通文件。
機房供電不穩(wěn)定導致服務(wù)器斷電,管理員重啟服務(wù)器后發(fā)現(xiàn)
瀾起科技推出CXL? 3.1內(nèi)存擴展控制器,助力下一代數(shù)據(jù)中心基礎(chǔ)設(shè)施性能升級
下一代數(shù)據(jù)中心服務(wù)器提供更高帶寬、更低延遲的內(nèi)存擴展和池化解決方案。 瀾起科技CXL 3.1內(nèi)存擴展控制器采用PCIe? 6.2物理層接口,
國外服務(wù)器地址怎么填寫才正確?#國外服務(wù)器 #國外服務(wù)器地址 #服務(wù)器
服務(wù)器
jf_57681485
發(fā)布于 :2025年06月11日 14:06:38
DNS服務(wù)器無法訪問?2分鐘快速排查與解決!#DNS服務(wù)器 #DNS #服務(wù)器
服務(wù)器
jf_57681485
發(fā)布于 :2025年06月10日 14:55:34
高通SoC陣列服務(wù)器
高通SoC陣列服務(wù)器是基于高通系統(tǒng)級芯片(SoC)構(gòu)建的高密度計算解決方案,核心特點為低功耗、高算力集成與模塊化設(shè)計,主要應(yīng)用于邊緣計算和云服務(wù)場景。以下是其技術(shù)特性和應(yīng)用方向的綜合分析: 一
歐洲VS美國服務(wù)器怎么選?1分鐘解析核心差異 #歐洲服務(wù)器 #美國服務(wù)器 #服務(wù)器
服務(wù)器
jf_57681485
發(fā)布于 :2025年05月22日 13:46:32
DeepSeek企業(yè)級部署服務(wù)器資源計算 以raksmart裸機云服務(wù)器為例
以RakSmart裸機云服務(wù)器為例,針對DeepSeek企業(yè)級部署的服務(wù)器資源計算指南,涵蓋GPU/CPU/內(nèi)存/存儲/網(wǎng)絡(luò)等核心維度的詳細計算方法與配置推薦,主機推薦小編為您整理發(fā)布以raksmart裸機云
服務(wù)器數(shù)據(jù)恢復—如何預防服務(wù)器故障與恢復服務(wù)器數(shù)據(jù)!
服務(wù)器常見故障:
硬件故障:磁盤損壞、電池故障等。
軟件問題:操作系統(tǒng)崩潰、未知的程序運行錯誤等。
病毒破壞:勒索病毒加密、刪除服務(wù)器數(shù)據(jù)等。
不可控力量;服務(wù)器浸水、火燒、機房倒塌等導致
救場服務(wù)器內(nèi)存的CXL

評論