20個(gè)關(guān)鍵術(shù)語
AI工作負(fù)載正在重新定義現(xiàn)代數(shù)據(jù)中心的供電需求。超高的電流需求、日益垂直的供電路徑以及先進(jìn)的散熱架構(gòu)意味著如今的電源工程師必須掌握遠(yuǎn)超傳統(tǒng)DC/DC轉(zhuǎn)換的知識。
本篇指南將分三個(gè)部分解釋對電源系統(tǒng)產(chǎn)生影響的20個(gè)關(guān)鍵術(shù)語:
1. 供電架構(gòu)及其拓?fù)浣Y(jié)構(gòu)
2. 系統(tǒng)控制、保護(hù)和數(shù)字化優(yōu)化
3. 影響電源設(shè)計(jì)的AI、散熱和系統(tǒng)級趨勢
1. 塑造AI系統(tǒng)的核心供電架構(gòu)
現(xiàn)代AI硬件消耗著非常高的功率,通常每個(gè)處理器高達(dá)數(shù)千瓦,并且需要經(jīng)過復(fù)雜的多級轉(zhuǎn)換路徑。理解這一流程背后的架構(gòu)是AI服務(wù)器電源設(shè)計(jì)的基礎(chǔ)。
HVDC是設(shè)備內(nèi)部用于為高壓DC/DC轉(zhuǎn)換器供電且高于安全特低電壓(SELV, Safety Extra-Low Voltage)等級(通常 >60 Vdc)的直流母線電壓,它可以提高轉(zhuǎn)換效率并支持更高電流的負(fù)載,比如來自AI加速器。典型例子包括±400 V和+800 V。隨著機(jī)架功率超過 30-60 kW,采用±400 V或+800 V的HVDC成為一個(gè)高效的選擇。較低的輸電電流可以減少銅損、縮短電纜尺寸并減少電力到達(dá)服務(wù)器之前的轉(zhuǎn)換級數(shù)。
IBA – 中間母線架構(gòu)
IBA是使用48 V或12 V中間母線為電壓調(diào)節(jié)模塊供電的數(shù)據(jù)中心供電方案。系統(tǒng)通常從HVDC過渡到IBA,這是一種階梯式供電方式,其中電力在進(jìn)行本地調(diào)節(jié)前先被轉(zhuǎn)換為穩(wěn)定的中間電壓。在AI服務(wù)器中,出于安全性和效率的考慮,這種中間電壓通常為48-54 V。
DCX – 直流變壓器
DCX是可在高功率下提供高效母線功率轉(zhuǎn)換的隔離式、固定比率DC/DC轉(zhuǎn)換器。作為基于HVDC架構(gòu)的關(guān)鍵組件,DCX利用隔離和固定比率轉(zhuǎn)換在不同電壓等級之間傳輸電力。DCX能在最終穩(wěn)壓之前讓高功率、高效率的電力分配到機(jī)架或服務(wù)器機(jī)箱的更深處。
LLC – 電感-電感-電容諧振轉(zhuǎn)換器
LLC是在電源中為實(shí)現(xiàn)低噪聲和高密度而使用的高效諧振轉(zhuǎn)換器。LLC轉(zhuǎn)換器廣泛用于前端或中間級,以在各種負(fù)載條件下實(shí)現(xiàn)高效率。LLC的軟開關(guān)特性使其成為AI環(huán)境嚴(yán)苛散熱條件的理想選擇。
VRM – 電壓調(diào)節(jié)模塊
VRM是為處理器或集成電路(IC)提供精確穩(wěn)壓電源的模塊。AI加速器需要數(shù)百甚至數(shù)千安培的亞伏級電源。VRM是最終穩(wěn)壓級,可將該電源直接提供給xPU封裝(CPU/GPU/NPU等,參見第3節(jié))。該模塊的瞬態(tài)響應(yīng)能力是AI計(jì)算板卡最關(guān)鍵的性能要素之一。
TLVR – 跨電感電壓調(diào)節(jié)器
TLVR是采用耦合電感的先進(jìn)電壓調(diào)節(jié)拓?fù)浣Y(jié)構(gòu),可為高電流CPU供電。TLVR是新一代VRM架構(gòu),可在高電流下提供更快的瞬態(tài)響應(yīng)和更高的效率。隨著AI加速器帶來極端負(fù)載階躍,TLVR的設(shè)計(jì)變得越來越重要。
VPD – 垂直供電
VPD是可將電流直接從電路板邊緣輸送到高電流專用集成電路(ASIC)或顯卡(GPU)的電源架構(gòu)。為了克服橫向印刷電路板(PCB)布線的限制,VPD通過中介層或封裝層垂直布線。通過縮短電源路徑,VPD提高了配電效率并降低了IR壓降,這對于高電流AI處理器至關(guān)重要。
TDP – 熱設(shè)計(jì)功耗
TDP是設(shè)備在典型工作負(fù)載下持續(xù)耗散的最大功耗。電源工程師必須了解TDP,因?yàn)樗x了每個(gè)AI處理器的持續(xù)熱極限,從而影響功率預(yù)算、模塊布局和調(diào)節(jié)器密度。更高的TDP意味著電氣設(shè)計(jì)和散熱設(shè)計(jì)之間更緊密的耦合。
CESS – 電容式儲能系統(tǒng)
CESS是一種本地能量緩沖系統(tǒng),它利用高容量儲能器件(例如超級電容器)來吸收或提供快速的負(fù)載瞬變,從而在高性能電源系統(tǒng)(例如AI加速板卡)中電流突變期間穩(wěn)定電壓。通過在負(fù)載附近吸收和釋放電荷,CESS可以減輕上游轉(zhuǎn)換器的壓力并穩(wěn)定電源分配網(wǎng)絡(luò)(PDN)。
PDN – 電源分配網(wǎng)絡(luò)
PDN是一種分層電源分配系統(tǒng)。PDN涵蓋從機(jī)架饋電經(jīng)由VRM到硅片電源凸點(diǎn)的整個(gè)電氣路徑。設(shè)計(jì)低阻抗的PDN對于維持電壓穩(wěn)定性以及防止AI工作負(fù)載的性能下降至關(guān)重要。
這些概念共同構(gòu)成了現(xiàn)代AI電源分配的核心結(jié)構(gòu)。
2.AI電源系統(tǒng)中的系統(tǒng)控制、遙測與保護(hù)
由于AI加速器會產(chǎn)生高度動態(tài)而且有時(shí)難以預(yù)測的電流波形,現(xiàn)代電源系統(tǒng)必須依靠智能控制接口、監(jiān)測能力以及穩(wěn)健的保護(hù)機(jī)制來確保系統(tǒng)的安全與穩(wěn)定運(yùn)行。
PMBus – 電源管理總線
PMBus是用于電源轉(zhuǎn)換器和監(jiān)測設(shè)備的數(shù)字通信接口標(biāo)準(zhǔn)。PMBus可為DC/DC轉(zhuǎn)換器提供實(shí)時(shí)配置與遙測功能。它使電源設(shè)計(jì)師能夠監(jiān)測AI集群中數(shù)千個(gè)節(jié)點(diǎn)上的電壓、電流、溫度、故障狀態(tài)及各項(xiàng)性能指標(biāo)。
AVS – 自適應(yīng)電壓調(diào)節(jié)
AVS使xPU(包括CPU、GPU、NPU等,詳見第3節(jié))能根據(jù)當(dāng)前工作負(fù)載或芯片運(yùn)行狀態(tài)發(fā)出精確的電壓調(diào)節(jié)請求。這不僅能降低功耗、提升能效比,還能使AI推理與訓(xùn)練任務(wù)中常見的快速負(fù)載變化變得更穩(wěn)定。
DLC – 動態(tài)負(fù)載補(bǔ)償
動態(tài)負(fù)載補(bǔ)償通過調(diào)節(jié)控制環(huán)路行為并應(yīng)用前饋技術(shù),在快速負(fù)載瞬變期間穩(wěn)定轉(zhuǎn)換器的輸出電壓。當(dāng)AI加速器在微秒級時(shí)間內(nèi)從空閑狀態(tài)切換至滿載狀態(tài)時(shí),DLC有助于防止電壓出現(xiàn)下沖或上沖現(xiàn)象,確保PDN及VRM模塊的運(yùn)行始終維持在容許誤差范圍內(nèi)。
OCP – 過流保護(hù)
OCP保護(hù)電源轉(zhuǎn)換器、母線以及下游設(shè)備免受短路或故障狀態(tài)等過流事件的損害。在AI服務(wù)器中,尤其是那些采用多相VRM架構(gòu)、輸出電流高達(dá)數(shù)百安培的系統(tǒng),快速且協(xié)同一致的OCP響應(yīng)機(jī)制至關(guān)重要,它是防止故障逐級擴(kuò)散、引發(fā)連鎖反應(yīng)的必要保障。
3.推動供電需求增長的AI、散熱和系統(tǒng)級趨勢前沿專項(xiàng)技術(shù)攻堅(jiān)探討
要針對AI工作負(fù)載設(shè)計(jì)電源系統(tǒng),工程師必須了解那些決定電氣設(shè)計(jì)極限的計(jì)算與散熱因素。這些系統(tǒng)級趨勢影響從瞬態(tài)特性到整機(jī)柜總功耗的每個(gè)環(huán)節(jié)。
LLM – 大語言模型
LLM是一種基于海量數(shù)據(jù)集進(jìn)行訓(xùn)練,專用于生成式或分析式語言任務(wù)的AI模型。LLM(例如GPT級模型)對計(jì)算資源有著極高的需求,因此也耗電巨大。其突發(fā)性強(qiáng)且高度并行的工作負(fù)載特性,直接決定了VRM、PDN以及本地儲能系統(tǒng)必須能夠應(yīng)對的瞬態(tài)特性。
xPU – CPU / GPU / TPU / NPU / IPU / FPGA
這是一個(gè)通用術(shù)語,涵蓋了現(xiàn)代AI系統(tǒng)中協(xié)同工作的所有類型計(jì)算加速器,包括CPU(中央處理器)、GPU(圖形處理器)、DPU(數(shù)據(jù)處理器)、TPU(張量處理器)、IPU(智能處理器)以及其他各類處理器。
HBM – 高帶寬存儲器
HBM是一種采用3D堆疊技術(shù)的存儲器,專為AI/HPC(高性能計(jì)算)加速器提供極高的帶寬。HBM會顯著提升xPU周邊的熱密度,并需要嚴(yán)格調(diào)控的低電壓供電軌。由于其在物理位置上靠近計(jì)算核心,因此會直接影響VRM的布局選址以及電源級組件的散熱設(shè)計(jì)約束。
D2C – 直達(dá)芯片式散熱
D2C將液冷直接輸送至處理器封裝上的冷板。這種散熱方式能夠大幅提升允許的TDP上限,進(jìn)而決定了VRM和PDN必須提供的電能總量,同時(shí)也決定了散熱設(shè)計(jì)與電氣設(shè)計(jì)之間耦合緊密度的要求。
CDU – 冷卻液分配單元
CDU調(diào)節(jié)冷卻回路內(nèi)的流量、壓力和溫度。其性能表現(xiàn)直接影響到系統(tǒng)允許的電氣負(fù)載上限、VRM的工作溫度以及整個(gè)系統(tǒng)的運(yùn)行效率。
PUE – 電源使用效率
PUE是衡量數(shù)據(jù)中心效率的核心指標(biāo),是設(shè)施總耗電量除以IT設(shè)備耗電量的值。轉(zhuǎn)換器效率、VRM設(shè)計(jì)、PDN優(yōu)化以及液冷技術(shù)的改進(jìn)均有助于在大規(guī)模應(yīng)用中提升PUE。
結(jié)論
AI革命建立了一個(gè)全新的環(huán)境,在其中電力電子、計(jì)算架構(gòu)、散熱技術(shù)以及系統(tǒng)級優(yōu)化已變得密不可分。掌握這20個(gè)基礎(chǔ)術(shù)語,能為工程師提供所需的知識儲備,幫助他們針對當(dāng)今日益嚴(yán)苛的AI工作負(fù)載設(shè)計(jì)并擴(kuò)展可靠、高效的電源系統(tǒng)。
隨著架構(gòu)的不斷演進(jìn),開始出現(xiàn)更高的TDP、更密集的PDN、更先進(jìn)的VRM和VPD、液冷技術(shù)以及HVDC配電方案,熟練掌握現(xiàn)代電源設(shè)計(jì)的專業(yè)術(shù)語已變得至關(guān)重要。
為了助您持續(xù)提升專業(yè)能力,我們編寫了業(yè)內(nèi)最全面且持續(xù)更新的技術(shù)術(shù)語表之一。您可以將Flex Power Modules提供的這份完整的技術(shù)縮略語表添加至?xí)炓员闳蘸蟛殚唴⒖迹瑥亩由罾斫猓⒕o跟新興電源設(shè)計(jì)趨勢的最前端。
-
轉(zhuǎn)換器
+關(guān)注
關(guān)注
27文章
9441瀏覽量
156816 -
AI
+關(guān)注
關(guān)注
91文章
40715瀏覽量
302372 -
電源系統(tǒng)
+關(guān)注
關(guān)注
3文章
811瀏覽量
39672
原文標(biāo)題:每個(gè)賦能AI革命的工程師都必須了解的20個(gè)術(shù)語
文章出處:【微信號:偉創(chuàng)力電源,微信公眾號:偉創(chuàng)力電源】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
別再被晶振術(shù)語繞暈!大白話版解讀來了
電源“免疫力”決定芯片穩(wěn)定性:PSRR測試為何越來越關(guān)鍵
淺析電源EMI產(chǎn)生機(jī)理
20KVA UPS電源全解:從中型數(shù)據(jù)中心到關(guān)鍵產(chǎn)線專業(yè)選型避坑指南
如何避免電能質(zhì)量在線監(jiān)測裝置的突跳異常數(shù)據(jù)對設(shè)備產(chǎn)生影響?
PicoScope示波器在電源軌噪聲測試中的應(yīng)用
直流濾波器 保障直流系統(tǒng)穩(wěn)定運(yùn)行的關(guān)鍵
環(huán)境干擾可能會對電能質(zhì)量在線監(jiān)測裝置的哪些數(shù)據(jù)產(chǎn)生影響?
時(shí)間同步問題可能會對裝置的哪些方面產(chǎn)生影響?
通俗易懂的晶振專業(yè)術(shù)語
3大UPS類型+4大核心場景,優(yōu)比施如何定義“關(guān)鍵電源系統(tǒng)”標(biāo)準(zhǔn)?
IEC 62353中常用的術(shù)語和定義
普源示波器DHO800系列電源噪聲測試的5個(gè)關(guān)鍵步驟
普源示波器DHO5108電源噪聲測試的5個(gè)關(guān)鍵步驟
技術(shù)干貨 | 從偏移誤差到電源抑制比,DAC核心術(shù)語全解析
對電源系統(tǒng)產(chǎn)生影響的20個(gè)關(guān)鍵術(shù)語
評論