2025年3月,英偉達發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強6性能核處理器,其中一款6776P被用作是DGX B300的主控CPU,這款處理器究竟有什么特殊之處呢?
AI加速系統(tǒng)為何看重CPU主控能力?

作為造價極高的AI加速系統(tǒng),DGX B300可以不計成本地選任何CPU,只要它能充分的發(fā)揮整套系統(tǒng)的性能。選擇英特爾至強6作為默認推薦的CPU配置,這意味著它能很好地滿足需求,也意味大量AI加速系統(tǒng)會搭載這款英特爾處理器。
在AI服務器中,CPU其實很重要,它不僅要運行操作系統(tǒng),還要負責協(xié)調(diào)GPU的工作、管理系統(tǒng)資源,支撐整個AI系統(tǒng)穩(wěn)定運行。此前,來自IDC的數(shù)據(jù)顯示,有73%的GPU加速服務器都在使用英特爾至強處理器作為主控CPU。
從技術細節(jié)看,主控CPU需要和GPU協(xié)同工作。因此,CPU在I/O、核心性能、內(nèi)存(容量和帶寬)、CPU上的預處理或卸載(offload)能力、RAS特性,以及對于多種形態(tài)的AI服務器架構的支持,都會影響整個AI系統(tǒng)的性能。
英特爾至強6:理想主控CPU的優(yōu)勢解析

首先,我們從產(chǎn)品角度來簡要介紹一下,為什么英偉達會選擇英特爾至強6處理器作為推薦配置?
首先,在I/O部分,英特爾至強6性能核處理器最多支持96個PCIe 5.0通道,相較于第五代至強可擴展處理器增加了20%。像DGX B300這種雙路服務器系統(tǒng),PCIe總數(shù)能來到192個。
在CPU核心部分,英特爾至強6支持最多128個性能核心,相較于上代直接翻倍。平均單核性能提升20%,平均每瓦性能提升高達1.6倍,同等性能水平下平均可以節(jié)省30%的TCO。并且還具備卓越的單線程能力。
在內(nèi)存部分,英特爾至強6支持DDR5-6400MT/s、最高達8800MT/s的MRDIMM內(nèi)存以及CXL技術,可提供更大內(nèi)存帶寬和更大內(nèi)存容量。其中,英特爾至強6性能核還將內(nèi)存通道數(shù)從8個提升到了12個,整體內(nèi)存帶寬和內(nèi)存容量都有了大幅提升。
英特爾至強6可以更好地支持在CPU上做預處理和卸載,這一部分會用到高級矩陣擴展(AMX)。因為現(xiàn)在的MoE模型越來越多,在CPU上做一些卸載工作現(xiàn)在變成了很熱點的話題,英特爾和很多合作伙伴也在進行積極探索。
英特爾至強6支持專門的RAS(Reliability, Availability, Serviceability)功能,它可以減少系統(tǒng)宕機時間。這次英偉達的DGX B300采用的是雙路服務器,豐富的RAS特性支持可以顯著減少宕機時間,提高系統(tǒng)資源的利用率。
因此,不管是英偉達的DGX(英偉達的一體化平臺)、MGX(英偉達開放給合作伙伴的模塊化服務器設計規(guī)范),還是DC-MHS全球標準(英特爾牽頭的模塊化標準架構),英特爾至強6都可以靈活支持。

2025年5月下旬,英特爾發(fā)布了三款新的性能核處理器,分別是6962P、6776P以及6774P。其中,6776P被用作英偉達的DGX B300系統(tǒng)的主控CPU,為什么要選擇這款處理器呢?
為什么選英特爾至強6776P做DGX B300的主控CPU?
此前,推薦作為英偉達DGX主控的CPU型號是6767P,這是一個64核的處理器,它的基礎頻率是2.4GHz,全核睿頻是3.6GHz,最大睿頻來到了3.9GHz。
6776P也是一塊64核的處理器,基礎頻率是2.3GHz,全核睿頻是3.6GHz,最大睿頻是3.9GHz。得益于英特爾創(chuàng)新的PCT技術,最高主頻提升到了4.6GHz,更高的主頻可以讓數(shù)據(jù)更快傳遞到GPU,從而提高GPU在高強度工作負載下的性能。
PCT指的是英特爾Priority Core Turbo技術,它讓部分核心成為高優(yōu)先級的核心,相應的,其他的核心就是低優(yōu)先級。搭配英特爾Speed Select睿頻頻率(Intel SST-TF)技術,讓高優(yōu)先級的核心以更高的主頻工作。
英特爾官方用這種方式把少數(shù)核心拉到更高頻率,意味著用戶可以不用額外考慮散熱等問題,還能保證可以長時間穩(wěn)定運行。

英特爾此次發(fā)布的3款支持PCT的至強處理器當中,6774P是單路CPU,6776P和6962P是雙路CPU。為了獲得更高的4.6GHz PCT頻率,又因為要支持雙路服務器,所以要選6776P。
雙路的DGX B300可以提供176條Gen 5.0通道。內(nèi)存部分,在DGX B300系統(tǒng)中,它只支持8個內(nèi)存通道,為了追求更大容量,這里采用了2 DPC的設置,每個通道配置2個DIMM,雙路理論最高容量為8TB,可以更好地應對未來更大數(shù)據(jù)規(guī)模。

上方在AI系統(tǒng)中使用至強6為主控CPU的示意圖中,有兩塊CPU帶著8塊GPU,8塊GPU之間通過NVLink互連,兩塊CPU之間通過UPI互連。
6776P最多支持8個PCT核心,也就是讓8個核心運行在高頻率,用戶可以根據(jù)需求選擇8個、6個、4個或2個。
PCT核心的設置也比較簡單,一種是在BIOS里進行設置,把一定數(shù)量的核心設定為PCT高核心。另外一種是通過SST的TF工具進行設置,在系統(tǒng)運行時可以動態(tài)配置調(diào)整,這種方式更便捷。
從英特爾專家的介紹中了解到,這三款處理器都是英特爾至強常規(guī)產(chǎn)品路線圖中的一部分,三款產(chǎn)品都是可以面向所有客戶開放的標準產(chǎn)品,而不是為特定用戶特定場景定制的特殊方案。
對于選擇DGX B300的用戶來說,6776P已是默認選項。如果是MGX用戶,則可以使用此前已發(fā)布的6767P。理論上,英特爾至強6的所有型號都支持作為AI加速計算系統(tǒng)的主控CPU,用戶在選用時可以根據(jù)實際需求作出選擇。
審核編輯 黃宇
-
英特爾
+關注
關注
61文章
10301瀏覽量
180412 -
cpu
+關注
關注
68文章
11277瀏覽量
224938 -
AI
+關注
關注
91文章
39755瀏覽量
301354
發(fā)布評論請先 登錄
探索DeepSeek多樣化技術路徑,英特爾架構師用至強CPU嘗鮮
英特爾至強6助力阿里云第九代企業(yè)級ECS實例100天贏得超萬家客戶青睞
英特爾銳炫Pro B系列,邊緣AI的“智能引擎”
英特爾發(fā)布全新GPU,AI和工作站迎來新選擇
英特爾2025年Q1營收127億美元,數(shù)據(jù)中心與AI業(yè)務可圈可點
1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越
英特爾酷睿Ultra處理器助力亦心AI閃繪本地功能上線
部署成本顯著降低!英特爾助陣高效AI算力一體機方案
英特爾先進封裝:助力AI芯片高效集成的技術力量
英特爾借助開放生態(tài)系統(tǒng),加速邊緣AI創(chuàng)新
英特爾至強6處理器助力數(shù)據(jù)中心整合升級
英特爾至強6:如何煉就數(shù)據(jù)中心“全能型選手”
主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉(zhuǎn)
評論