服務(wù)器的全液冷,一般都需要液冷板覆蓋CPU、內(nèi)存(DIMM)、硬盤(SSD)、電源、IO以及其他SOC的散熱。今天給大家分享一款浪潮的全液冷冷板服務(wù)器的液冷系統(tǒng)架構(gòu)。
1.全液冷冷板服務(wù)器創(chuàng)新實踐
此次全液冷冷板系統(tǒng)開發(fā)是基于浪潮信息2U四節(jié)點高密計算服務(wù)器i24,每個液冷節(jié)點支持兩顆英特爾第五代至強平臺可擴展處理器,搭配16根DDR5內(nèi)存,1張PCIe擴展卡和1張OCP3.0網(wǎng)卡。整機可支持8張SSD固態(tài)硬盤,在實現(xiàn)高密算力的同時滿足客戶存儲需求。服務(wù)器主要的發(fā)熱部件包括CPU、內(nèi)存, I/O 板卡, 本地硬盤,機箱電源等。液冷方案實現(xiàn)了系統(tǒng)中95%左右的熱量通過冷板接觸熱源由液體直接帶走,剩余5%左右的熱量經(jīng)由PSU電源后置的風(fēng)液式換熱器里面的冷卻水帶走,系統(tǒng)級即可實現(xiàn)接近100%液冷熱捕獲率。整體設(shè)計理念是基于在滿足性能和可靠性要求的基礎(chǔ)上,從系統(tǒng)級決方案開始,探索高能效,低成本和易于運維的全液冷服務(wù)器全新設(shè)計之道:
節(jié)點與硬盤區(qū)域?qū)崿F(xiàn)內(nèi)部水電信號盲插結(jié)構(gòu)共用,去除了多余管路,單節(jié)點運行即可支持多張固態(tài)硬盤液冷。
節(jié)點冷板設(shè)計采用串聯(lián)主流路,冷板焊接接口明顯減少,降低漏液風(fēng)險。
全新的內(nèi)存液冷設(shè)計方案,顛覆了業(yè)界現(xiàn)有方案在散熱性能,公差控制,維護(hù)便利性及信號接觸可靠性方面的弊端,為解決高功耗內(nèi)存散熱難題打開了新思路。
全新的OCP網(wǎng)卡和硬盤液冷方案簡單可靠,均可支持30次以上熱插拔,方便客戶在開機狀態(tài)下進(jìn)行維修,擴容或系統(tǒng)更新操作。
此全液冷冷板方案最大化地利用現(xiàn)有風(fēng)冷模組及業(yè)界成熟的冷板和風(fēng)冷散熱器加工工藝,避免定制化液冷部件和復(fù)雜加工工藝,優(yōu)化成本。
對低密度低成本鋁冷板的散熱可行性及與冷卻工質(zhì)的長期相容性做了大量拓展研究,為鋁冷板在數(shù)據(jù)中心行業(yè)應(yīng)用可行性分析積累了寶貴實踐數(shù)據(jù)。
2.系統(tǒng)組成及管路布局
2.1全液冷服務(wù)器整機介紹
2U四節(jié)點全液冷服務(wù)器系統(tǒng)由節(jié)點、機箱、中背板、固態(tài)硬盤模組組成。節(jié)點和機箱組件間通過快接頭、電源及信號連接器實現(xiàn)水、電、信號盲插。

2.2全液冷服務(wù)器單節(jié)點介紹
全液冷服務(wù)器的節(jié)點由節(jié)點外殼、主板、CPU芯片、內(nèi)存模組、內(nèi)存冷板、CPU冷板,IO冷板,電源及電源后置換熱器等組成。

3.通流方式選擇及流量計算
3.1全液冷冷板通流方式選擇
為了簡化流路設(shè)計的復(fù)雜性,此全液冷服務(wù)器的散熱冷卻工質(zhì)流路選用串聯(lián)流路設(shè)計,冷卻工質(zhì)整體由低功耗器件往高功耗器件流動和散熱,詳細(xì)流動方向見下圖及表所示。


3.2全液冷冷板流量設(shè)計
全液冷服務(wù)器流量需要滿足系統(tǒng)散熱需求:1)為了確保二次側(cè)管路材料的長期可靠性,二次側(cè)回水溫度不超過65?C;2)確保全液冷服務(wù)器各零部件在定義的邊界條件下滿足散熱需求,選取銅冷板+PG25作為流量設(shè)計分析。
為進(jìn)一步驗證該流量下,各個冷板覆蓋部件是否超溫,通過CFD軟件進(jìn)行散熱仿真。結(jié)果顯示全液冷服務(wù)器銅冷板在進(jìn)水溫度51?C(W45)以及冷卻工質(zhì)PG25 1.3LPM流量條件下所有零部件溫度都滿足溫度要求,且具有一定的安全溫度裕量,詳細(xì)數(shù)據(jù)如下表所示:


綜上分析所述,全液冷服務(wù)器采用單節(jié)點流量1.3LPM完全滿足系統(tǒng)散熱設(shè)計目標(biāo),而且經(jīng)濟(jì)合理利用CDU提供的冷卻工質(zhì)。
結(jié)合冷板式液冷特點及行業(yè)先進(jìn)液冷數(shù)據(jù)中心分析,冷板液冷未來技術(shù)優(yōu)化方向主要圍繞通過技術(shù)創(chuàng)新進(jìn)一步提高能效,降低初投資成本,減少漏液安全隱患及提高運維便利性展開。
完善部件液冷方案, 提高液冷覆蓋率。除CPU, GPU,內(nèi)存之外,目前業(yè)界對服務(wù)器內(nèi)其他發(fā)熱部件如何通過冷板液冷實現(xiàn)經(jīng)濟(jì)有效散熱的探索還比較少,方案尚未成熟,價格昂貴,有待通過設(shè)計方案的創(chuàng)新實現(xiàn)標(biāo)準(zhǔn)化,規(guī)模化應(yīng)用的經(jīng)濟(jì)性和可靠性,進(jìn)一步提高冷板液冷數(shù)據(jù)中心能效,減少數(shù)據(jù)中心空調(diào)用量和成本,降低冷卻系統(tǒng)復(fù)雜度。
提高通用化及可維護(hù)性。目前已知的全冷板液冷方案大多基于高度定制化服務(wù)器設(shè)計,液冷方案無法靈活適用于傳統(tǒng)通用服務(wù)器架構(gòu)。對硬盤和網(wǎng)卡等通常需要熱插拔的部件無法支持不斷電維護(hù)。內(nèi)存液冷方案對冷板管路加工精度要求非常高,在內(nèi)存安裝,維護(hù)及可靠性方面也存在一定的弊端。
拓展冷板液冷材料范圍,減輕重量,降低成本。服務(wù)器重量隨著液冷部件的增多大幅上升,對服務(wù)器運維和運輸過程中的可靠性帶來諸多挑戰(zhàn)。拓展低密度低成本冷板液冷材料范圍,有助于推動行業(yè)多樣化發(fā)展。
提升液冷系統(tǒng)長期使用的安全性,降低漏液風(fēng)險。選取合理的冷板環(huán)路材料和液冷冷卻工質(zhì),并進(jìn)行充分的相容性測試及系統(tǒng)性能老化性測試,是保障液冷系統(tǒng)全生命周期內(nèi)安全穩(wěn)定運行,降低漏液風(fēng)險的關(guān)鍵。
來源:熱能工匠
-
soc
+關(guān)注
關(guān)注
40文章
4600瀏覽量
229653 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10318瀏覽量
91637 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
18文章
5707瀏覽量
75160 -
液冷
+關(guān)注
關(guān)注
5文章
162瀏覽量
5789
原文標(biāo)題:液冷 | 全液冷服務(wù)器系統(tǒng)架構(gòu)設(shè)計案例分享
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
AI服務(wù)器機架供電架構(gòu)解析:PSU、BBU 與 CBU 的設(shè)計邏輯及關(guān)鍵芯片方案
高端AI服務(wù)器液冷系統(tǒng):壓力傳感器的精度與穩(wěn)定性選型邏輯解析
NTC溫度傳感器,液冷服務(wù)器散熱故障的防線
液冷服務(wù)器溫控揭秘,NTC溫度傳感器的應(yīng)用
液冷重塑AI服務(wù)器電源?對材料器件有何要求
液冷服務(wù)器成為AI黃金賽道!華為力挺,兩大國際芯片巨頭下場
液冷散熱時代:AI服務(wù)器如何重構(gòu)磁元件設(shè)計
電能質(zhì)量在線監(jiān)測裝置數(shù)據(jù)存儲在本地服務(wù)器時有哪些注意事項?
華納云:海外服務(wù)器負(fù)載均衡與高可用架構(gòu)設(shè)計
數(shù)據(jù)中心液冷服務(wù)器該配什么樣的 UPS 不間斷電源?
華納云服務(wù)器角色服務(wù)器失敗的原因和解決辦法
曙光數(shù)創(chuàng)推出液冷數(shù)據(jù)中心全生命周期定制新服務(wù)
高密度ARM服務(wù)器的散熱設(shè)計
全液冷服務(wù)器系統(tǒng)架構(gòu)設(shè)計案例分享
評論