服務(wù)器的全液冷,一般都需要液冷板覆蓋CPU、內(nèi)存(DIMM)、硬盤(SSD)、電源、IO以及其他SOC的散熱。今天給大家分享一款浪潮的全液冷冷板服務(wù)器的液冷系統(tǒng)架構(gòu)。
1.全液冷冷板服務(wù)器創(chuàng)新實(shí)踐
此次全液冷冷板系統(tǒng)開發(fā)是基于浪潮信息2U四節(jié)點(diǎn)高密計(jì)算服務(wù)器i24,每個(gè)液冷節(jié)點(diǎn)支持兩顆英特爾第五代至強(qiáng)平臺可擴(kuò)展處理器,搭配16根DDR5內(nèi)存,1張PCIe擴(kuò)展卡和1張OCP3.0網(wǎng)卡。整機(jī)可支持8張SSD固態(tài)硬盤,在實(shí)現(xiàn)高密算力的同時(shí)滿足客戶存儲需求。服務(wù)器主要的發(fā)熱部件包括CPU、內(nèi)存, I/O 板卡, 本地硬盤,機(jī)箱電源等。液冷方案實(shí)現(xiàn)了系統(tǒng)中95%左右的熱量通過冷板接觸熱源由液體直接帶走,剩余5%左右的熱量經(jīng)由PSU電源后置的風(fēng)液式換熱器里面的冷卻水帶走,系統(tǒng)級即可實(shí)現(xiàn)接近100%液冷熱捕獲率。整體設(shè)計(jì)理念是基于在滿足性能和可靠性要求的基礎(chǔ)上,從系統(tǒng)級決方案開始,探索高能效,低成本和易于運(yùn)維的全液冷服務(wù)器全新設(shè)計(jì)之道:
節(jié)點(diǎn)與硬盤區(qū)域?qū)崿F(xiàn)內(nèi)部水電信號盲插結(jié)構(gòu)共用,去除了多余管路,單節(jié)點(diǎn)運(yùn)行即可支持多張固態(tài)硬盤液冷。
節(jié)點(diǎn)冷板設(shè)計(jì)采用串聯(lián)主流路,冷板焊接接口明顯減少,降低漏液風(fēng)險(xiǎn)。
全新的內(nèi)存液冷設(shè)計(jì)方案,顛覆了業(yè)界現(xiàn)有方案在散熱性能,公差控制,維護(hù)便利性及信號接觸可靠性方面的弊端,為解決高功耗內(nèi)存散熱難題打開了新思路。
全新的OCP網(wǎng)卡和硬盤液冷方案簡單可靠,均可支持30次以上熱插拔,方便客戶在開機(jī)狀態(tài)下進(jìn)行維修,擴(kuò)容或系統(tǒng)更新操作。
此全液冷冷板方案最大化地利用現(xiàn)有風(fēng)冷模組及業(yè)界成熟的冷板和風(fēng)冷散熱器加工工藝,避免定制化液冷部件和復(fù)雜加工工藝,優(yōu)化成本。
對低密度低成本鋁冷板的散熱可行性及與冷卻工質(zhì)的長期相容性做了大量拓展研究,為鋁冷板在數(shù)據(jù)中心行業(yè)應(yīng)用可行性分析積累了寶貴實(shí)踐數(shù)據(jù)。
2.系統(tǒng)組成及管路布局
2.1全液冷服務(wù)器整機(jī)介紹
2U四節(jié)點(diǎn)全液冷服務(wù)器系統(tǒng)由節(jié)點(diǎn)、機(jī)箱、中背板、固態(tài)硬盤模組組成。節(jié)點(diǎn)和機(jī)箱組件間通過快接頭、電源及信號連接器實(shí)現(xiàn)水、電、信號盲插。

2.2全液冷服務(wù)器單節(jié)點(diǎn)介紹
全液冷服務(wù)器的節(jié)點(diǎn)由節(jié)點(diǎn)外殼、主板、CPU芯片、內(nèi)存模組、內(nèi)存冷板、CPU冷板,IO冷板,電源及電源后置換熱器等組成。

3.通流方式選擇及流量計(jì)算
3.1全液冷冷板通流方式選擇
為了簡化流路設(shè)計(jì)的復(fù)雜性,此全液冷服務(wù)器的散熱冷卻工質(zhì)流路選用串聯(lián)流路設(shè)計(jì),冷卻工質(zhì)整體由低功耗器件往高功耗器件流動和散熱,詳細(xì)流動方向見下圖及表所示。


3.2全液冷冷板流量設(shè)計(jì)
全液冷服務(wù)器流量需要滿足系統(tǒng)散熱需求:1)為了確保二次側(cè)管路材料的長期可靠性,二次側(cè)回水溫度不超過65?C;2)確保全液冷服務(wù)器各零部件在定義的邊界條件下滿足散熱需求,選取銅冷板+PG25作為流量設(shè)計(jì)分析。
為進(jìn)一步驗(yàn)證該流量下,各個(gè)冷板覆蓋部件是否超溫,通過CFD軟件進(jìn)行散熱仿真。結(jié)果顯示全液冷服務(wù)器銅冷板在進(jìn)水溫度51?C(W45)以及冷卻工質(zhì)PG25 1.3LPM流量條件下所有零部件溫度都滿足溫度要求,且具有一定的安全溫度裕量,詳細(xì)數(shù)據(jù)如下表所示:


綜上分析所述,全液冷服務(wù)器采用單節(jié)點(diǎn)流量1.3LPM完全滿足系統(tǒng)散熱設(shè)計(jì)目標(biāo),而且經(jīng)濟(jì)合理利用CDU提供的冷卻工質(zhì)。
結(jié)合冷板式液冷特點(diǎn)及行業(yè)先進(jìn)液冷數(shù)據(jù)中心分析,冷板液冷未來技術(shù)優(yōu)化方向主要圍繞通過技術(shù)創(chuàng)新進(jìn)一步提高能效,降低初投資成本,減少漏液安全隱患及提高運(yùn)維便利性展開。
完善部件液冷方案, 提高液冷覆蓋率。除CPU, GPU,內(nèi)存之外,目前業(yè)界對服務(wù)器內(nèi)其他發(fā)熱部件如何通過冷板液冷實(shí)現(xiàn)經(jīng)濟(jì)有效散熱的探索還比較少,方案尚未成熟,價(jià)格昂貴,有待通過設(shè)計(jì)方案的創(chuàng)新實(shí)現(xiàn)標(biāo)準(zhǔn)化,規(guī)模化應(yīng)用的經(jīng)濟(jì)性和可靠性,進(jìn)一步提高冷板液冷數(shù)據(jù)中心能效,減少數(shù)據(jù)中心空調(diào)用量和成本,降低冷卻系統(tǒng)復(fù)雜度。
提高通用化及可維護(hù)性。目前已知的全冷板液冷方案大多基于高度定制化服務(wù)器設(shè)計(jì),液冷方案無法靈活適用于傳統(tǒng)通用服務(wù)器架構(gòu)。對硬盤和網(wǎng)卡等通常需要熱插拔的部件無法支持不斷電維護(hù)。內(nèi)存液冷方案對冷板管路加工精度要求非常高,在內(nèi)存安裝,維護(hù)及可靠性方面也存在一定的弊端。
拓展冷板液冷材料范圍,減輕重量,降低成本。服務(wù)器重量隨著液冷部件的增多大幅上升,對服務(wù)器運(yùn)維和運(yùn)輸過程中的可靠性帶來諸多挑戰(zhàn)。拓展低密度低成本冷板液冷材料范圍,有助于推動行業(yè)多樣化發(fā)展。
提升液冷系統(tǒng)長期使用的安全性,降低漏液風(fēng)險(xiǎn)。選取合理的冷板環(huán)路材料和液冷冷卻工質(zhì),并進(jìn)行充分的相容性測試及系統(tǒng)性能老化性測試,是保障液冷系統(tǒng)全生命周期內(nèi)安全穩(wěn)定運(yùn)行,降低漏液風(fēng)險(xiǎn)的關(guān)鍵。
來源:熱能工匠
-
soc
+關(guān)注
關(guān)注
40文章
4576瀏覽量
229102 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10251瀏覽量
91478 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
18文章
5647瀏覽量
75008 -
液冷
+關(guān)注
關(guān)注
5文章
160瀏覽量
5773
原文標(biāo)題:液冷 | 全液冷服務(wù)器系統(tǒng)架構(gòu)設(shè)計(jì)案例分享
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
液冷重塑AI服務(wù)器電源?對材料器件有何要求
液冷服務(wù)器成為AI黃金賽道!華為力挺,兩大國際芯片巨頭下場
液冷散熱時(shí)代:AI服務(wù)器如何重構(gòu)磁元件設(shè)計(jì)
服務(wù)器數(shù)據(jù)恢復(fù)—意外斷電!Linux服務(wù)器數(shù)據(jù)恢復(fù)大揭秘
電能質(zhì)量在線監(jiān)測裝置數(shù)據(jù)存儲在本地服務(wù)器時(shí)有哪些注意事項(xiàng)?
華納云:海外服務(wù)器負(fù)載均衡與高可用架構(gòu)設(shè)計(jì)
數(shù)據(jù)中心液冷服務(wù)器該配什么樣的 UPS 不間斷電源?
新品 | 破局散熱困境!捷智算5090 浸沒式液冷服務(wù)器全新來襲!
華納云服務(wù)器角色服務(wù)器失敗的原因和解決辦法
曙光數(shù)創(chuàng)推出液冷數(shù)據(jù)中心全生命周期定制新服務(wù)
高密度ARM服務(wù)器的散熱設(shè)計(jì)
服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器的系統(tǒng)和普通電腦系統(tǒng)一樣嗎?
AI服務(wù)器液冷散熱如何實(shí)現(xiàn)動態(tài)平衡?
全液冷服務(wù)器系統(tǒng)架構(gòu)設(shè)計(jì)案例分享
評論