隨著云平臺(tái)虛擬化技術(shù)的發(fā)展,智能網(wǎng)卡的發(fā)展基本可以分為三個(gè)階段(如下圖所示):

圖 智能網(wǎng)卡發(fā)展的三個(gè)階段
第一階段:基礎(chǔ)功能網(wǎng)卡
基礎(chǔ)功能網(wǎng)卡(即普通網(wǎng)卡)提供2x10G或2x25G帶寬吞吐,具有較少的硬件卸載能力,主要是Checksum,LRO/LSO等,支持SR-IOV,以及有限的多隊(duì)列能力。在云平臺(tái)虛擬化網(wǎng)絡(luò)中,基礎(chǔ)功能網(wǎng)卡向虛擬機(jī)(VM)提供網(wǎng)絡(luò)接入的方式主要是有三種:由操作系統(tǒng)內(nèi)核驅(qū)動(dòng)接管網(wǎng)卡并向虛擬機(jī)(VM)分發(fā)網(wǎng)絡(luò)流量;由OVS-DPDK接管網(wǎng)卡并向虛擬機(jī)(VM)分發(fā)網(wǎng)絡(luò)流量;以及高性能場景下通過SR-IOV的方式向虛擬機(jī)(VM)提供網(wǎng)絡(luò)接入能力。
第二階段:硬件卸載網(wǎng)卡
可以認(rèn)為是第一代智能網(wǎng)卡,具有豐富的硬件卸載能力,比較典型的有OVS Fastpath硬件卸載,基于RoCEv1和RoCEv2的RDMA網(wǎng)絡(luò)硬件卸載,融合網(wǎng)絡(luò)中無損網(wǎng)絡(luò)能力(PFC,ECN,ETS等)的硬件卸載,存儲(chǔ)領(lǐng)域NVMe-oF的硬件卸載,以及安全傳輸?shù)臄?shù)據(jù)面卸載等。這個(gè)時(shí)期的智能網(wǎng)卡以數(shù)據(jù)平面的卸載為主。
第三階段:DPU智能網(wǎng)卡
可以認(rèn)為是第二代智能網(wǎng)卡,在第一代智能網(wǎng)卡基礎(chǔ)上加入CPU,可以用來卸載控制平面的任務(wù)和一些靈活復(fù)雜的數(shù)據(jù)平面任務(wù)。目前DPU智能網(wǎng)卡的特點(diǎn)首先是支持PCIe Root Complex模式和Endpoint模式,在配置為PCIe Root Complex模式時(shí),可以實(shí)現(xiàn)NVMe存儲(chǔ)控制器,與NVMe SSD磁盤一起構(gòu)建存儲(chǔ)服務(wù)器;另外,由于大規(guī)模的數(shù)據(jù)中心網(wǎng)絡(luò)的需要,對(duì)無損網(wǎng)絡(luò)的要求更加嚴(yán)格,需要解決數(shù)據(jù)中心網(wǎng)絡(luò)中Incast流量、“大象”流等帶來的網(wǎng)絡(luò)擁塞和時(shí)延問題,各大公有云廠商紛紛提出自己的應(yīng)對(duì)方法,比如阿里云的高精度擁塞控制(HPCC,High Precision Congestion Control),AWS的可擴(kuò)展可靠數(shù)據(jù)報(bào)(SRD,Scalable Reliable Datagram)等。DPU智能網(wǎng)卡在解決這類問題時(shí)將會(huì)引入更為先進(jìn)的方法,如Fungible的TrueFabric,就是在DPU智能網(wǎng)卡上的新式解決方案。還有,業(yè)界提出了Hypervisor中的網(wǎng)絡(luò),存儲(chǔ)和安全全棧卸載的發(fā)展方向,以Intel為代表提出了IPU,將基礎(chǔ)設(shè)施的功能全部卸載到智能網(wǎng)卡中,可以全面釋放之前用于Hypervisor管理的CPU算力。
未來的DPU智能網(wǎng)卡硬件形態(tài)
隨著越來越多的功能加入到智能網(wǎng)卡中,其功率將很難限制在75W之內(nèi),這樣就需要獨(dú)立的供電系統(tǒng)。所以,未來的智能網(wǎng)卡形態(tài)可能有三種形態(tài):
(1)獨(dú)立供電的智能網(wǎng)卡,需要考慮網(wǎng)卡狀態(tài)與計(jì)算服務(wù)之間低層信號(hào)識(shí)別,在計(jì)算系統(tǒng)啟動(dòng)的過程中或者啟動(dòng)之后,智能網(wǎng)卡是否已經(jīng)是進(jìn)入服務(wù)狀態(tài),這些都需要探索和解決。
(2)沒有PCIe接口的DPU智能網(wǎng)卡,可以組成DPU資源池,專門負(fù)責(zé)網(wǎng)絡(luò)功能,例如負(fù)載均衡,訪問控制,防火墻設(shè)備等。管理軟件可以直接通過智能網(wǎng)卡管理接口定義對(duì)應(yīng)的網(wǎng)絡(luò)功能,并作為虛擬化網(wǎng)絡(luò)功能集群提供對(duì)應(yīng)網(wǎng)絡(luò)能力,無需PCIe接口。
(3)多PCIe接口,多網(wǎng)口的DPU芯片。例如Fungible F1芯片,支持16個(gè)雙模PCIe控制器,可以配置為Root Complex模式或Endpoint模式,以及8x100G網(wǎng)絡(luò)接口。通過PCIeGen3 x8接口可以支撐8個(gè)Dual-Socket計(jì)算服務(wù)器,網(wǎng)絡(luò)側(cè)提供8x100G帶寬的網(wǎng)口。

圖未來智能網(wǎng)卡的硬件形態(tài)
DPU作為一種新型的專用處理器,隨著需求側(cè)的變化,必將在未來計(jì)算系統(tǒng)中成為一個(gè)重要組成部分,對(duì)于支撐下一代數(shù)據(jù)中心起到至關(guān)重要的作用。
來源:專用數(shù)據(jù)處理器(DPU)技術(shù)白皮書,中國科學(xué)院計(jì)算技術(shù)研究所,鄢貴海等
全文下載:https://www.yusur.tech/zkls/zkys/dpu_whitepaper.html
-
DPU
+關(guān)注
關(guān)注
0文章
414瀏覽量
26964
發(fā)布評(píng)論請(qǐng)先 登錄
中關(guān)村云計(jì)算產(chǎn)業(yè)聯(lián)盟黨建交流活動(dòng)在中科馭數(shù)圓滿舉辦
【「芯片設(shè)計(jì)基石——EDA產(chǎn)業(yè)全景與未來展望」閱讀體驗(yàn)】--EDA了解與發(fā)展概況
彰顯硬科技實(shí)力 中科馭數(shù)榮登VENTURE50硬科技榜 構(gòu)建DPU“運(yùn)力”底座
四方光電出席2025制冷節(jié)能降碳與制冷劑替代技術(shù)發(fā)展會(huì)議
NVIDIA推出全新BlueField-4 DPU
利用NVIDIA DPU重塑網(wǎng)絡(luò)安全格局
無刷雙饋電機(jī)專利技術(shù)發(fā)展
輪邊驅(qū)動(dòng)電機(jī)專利技術(shù)發(fā)展
第三屆NVIDIA DPU黑客松開啟報(bào)名
中科馭數(shù)攜DPU全棧產(chǎn)品亮相福州數(shù)博會(huì),賦能智算時(shí)代算力基建
DPU232—高度集成USB到UART橋接控制器 國產(chǎn)替代方案
中科馭數(shù)受邀參與華泰證券春季投資峰會(huì) 分享DPU在AI領(lǐng)域的應(yīng)用
集成電路和光子集成技術(shù)的發(fā)展歷程
DPU 技術(shù)發(fā)展概況系列(四)DPU發(fā)展歷程
評(píng)論