国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DPU特征結構系列(二)一種DPU參考設計

中科馭數(北京)科技有限公司 ? 2022-05-05 14:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了滿足“數據為中心”的設計理念,本節給出一個通用的DPU參考設計。目前DPU架構的演化比較快,DPU既可以呈現為一個被動設備作為CPU的協處理器,也可以作為一個主動設備,承接Hypervisor的一些功能。尤其是容器技術、虛擬化技術的廣泛采用,DPU的角色已經不僅僅是一個協處理器,而是呈現出更多的HOST的特征,比如運行Hypervisor,做跨節點的資源整合,為裸金屬和虛擬機提供虛擬網絡,數據安全,熱遷移等支撐。宏觀來看,DPU架構至少可以分為以下幾個核心組成部分:

poYBAGJzbASAIgqXAAq6Mgd8PGs685.png

圖DPU架構參考設計

一、控制平面

負責管理、配置,通常由通用處理器核來實現。控制平臺負責DPU設備運行管理,以及計算任務和計算資源的配置。運行管理通常包含設備的安全管理和實時監控兩個主要功能。在安全管理方面支持支持如信任根、安全啟動、安全固件升級以及基于身份驗證的容器和應用的生命周期管理等。在設備實時監控方面,對DPU各子系統、數據平面中各處理核動態監測,實時觀察設備是否可用、設備中流量是否正常,周期性生成報表,記錄設備訪問日志核配置修改日志。

計算任務和計算資源配置方面,根據計算任務實施配置數據平面中處理單元間的通路,以及各處理單元參數。根據資源利用情況實時進行任務調度以及在計算單元的映射和部署。同時DPU上層同時會支持多個虛擬機,控制平面在任務部署時還要進行虛擬設備的管理,考慮虛擬機間數據和資源隔離,記錄運行狀態協助虛擬機熱遷移。最后,當DPU集成第三方計算平臺,如GPUFPGA等,還需要參與部分卸載任務調度。

由于控制平面任務多樣,靈活性要求較高,算力要求較低,通常由通用處理器核來實現,比如ARM、MIPS等核心。為便于用戶統一管理和配置DPU設備,提供較好的可編程性,通常會運行標準Linux應用程序。并且控制平面與數據平面數據交互驅動程序需要進行深度優化,來提升控制平面與數據平面有效地交互,任務調度效率。

二、IO子系統

主要分為三個大類:

(1)系統IO,負責DPU和其他處理平臺(如X86、ARM處理器、GPU、FPGA等)或高速外部設備(如SSD)的集成。系統IO通常傳輸數據量較大對帶寬有著極高的要求,因此多基于PCIe來實現。系統IO接口分為兩大類:EP(Endpoint)類和RC(Root Complex)類。

EP類接口負責將DPU作為從設備與X86、ARM等處理平臺相連接。為了充分利用DPU上的內部資源,此類接口要支持強大的硬件設備虛擬化功能,比如SR-IOV和VirtIO。并且可以靈活地支持多種類型的設備,如NIC、Storage、Compute設備等。

RC類接口負責將DPU作為主設備與加速平臺(如GPU、FPGA)或外設(SSD)相連接。通過此種方式將部分數據處理卸載到第三方加速平臺GPU、FPGA中處理,通常數據量較大,需要支持較強的DMA方案。

(2)網絡IO,負責DPU與高速網絡相連接,主要是以太網或者FC為主。為了能應對急劇增加的網絡帶寬,DPU中通常輔以專門的網絡協議處理核來加速網絡包的處理。包括L2/L3/L4層的ARP/IP/TCP/UDP網絡協議處理、RDMA、數據包交換協議、基本網絡虛擬化協議等,可以實現100G以上的網絡包線速處理。

(3)主存IO,負責緩存網絡IO和系統IO輸入輸出數據,以及數據平面中間數據結果。也可作為共享內存,實現不同處理核之間的數據通信。目前主存IO主要包含DDR和HBM接口類型,兩類接口,DDR可以提供比較大的存儲容量,可以提供512GB以上的存儲容量;HBM可以提供比較大的存儲帶寬,可以提供500GB/s以上的帶寬。兩種存儲接口相結合可以滿足不同存儲容量和帶寬的需求,但是需要精細的數據管理,這塊也是DPU設計中比較有挑戰的。

三、數據平面

主要負責高速數據通路的功能單元的集成,通常集成多個處理核。數據平面的功能主要分為五類:

1)高速數據包處理,主要對接收到的網絡數據包進行如OvS(開放式虛擬交換機)解析、匹配和處理,以及RDMA遠程數據傳輸加速等操作,和之前的網絡處理器NP功能類似,但是在性能上有更高的要求,處理帶寬線速要達到100G、200G甚至400G。同時,在進行有狀態數據處理時也有著更高的要求,如TCP協議,要求硬件記錄各連接信息,并能實現多連接間無縫切換。

2)虛擬化協議加速,支持SR-IOV、VirtIO和PV(Para-Virtualization)等虛擬化。支持網絡虛擬化VxLAN、Geneve Overlay卸載和VTEP等協議卸載。

3)安全加密,在線IPSec和TLS加密加速,以及多種標準加解密算法和國密算法。并且對于安全算法的處理性能有較高的要求,要達到網絡線速,從而不影響其它正在運行的加速操作。

4)流量壓縮,對網絡數據包,或者要存儲的數據,進行實時地數據壓縮/解壓縮處理,壓縮過程中還要完成地址的轉換和重映射等操作。或者在線完成數據流變換處理,如面向多媒體流、CDN(內容分發網絡)和4K/8K IP視頻的“Packet Pacing”流量整形加速等。

5)其他算法加速。除了上述網絡、安全協議外還要支持NVMe等存儲協議,業務相關的處理卸載也呈增長趨勢,如大數據分析SQL加速。

四、DPU設計的關鍵

數據平面是整個DPU設計的關鍵,也是DPU設計中最有挑戰的模塊。主要面臨四個挑戰:

1)數據中心的工作負載復雜多樣,數據平面支持的處理核種類要足夠多,不僅包括網絡、存儲、安全和虛擬化等基礎設施服務,另外業務相關的處理也在加速向DPU平臺卸載。

2)高并發性數據處理,數據中心承載的業務多且復雜,多虛擬機多種類業務并發要求數據平面集成足夠數量的核心,規模要達到幾百個核心規模。隨著數據中心數據量的不斷增加,對處理性能提出越來越多的挑戰,DPU數據平面在處理核規模上要具有非常強的可擴展性。

3)復雜的片上互聯系統,隨著DPU數據平面處理核數量的增加,再加之高并發處理線程運行,同時還要兼顧好數據平面數據處理的靈活,這就要求處理核之間的數據交互既要靈活又要兼顧高帶寬。處理核之間的數據互聯,以及核間的數據一致性成為另一設計難題。

4)高效簡易的編程方式,數據中心業務的復雜多變決定了DPU數據平臺可編程性的硬性需求。一方面要兼顧計算效率,必須直觀表達出并發處理任務,充分利用計算資源。另一方面要兼顧DPU的易用性,盡量采用高級語言進行編程,易于設計、開發和維護。

總之,DPU數據平面需要一種大規模敏捷異構的計算架構。這一部分的實現也處在“百家爭鳴”的階段,各家的實現方式差別較大,有基于通用處理器核的方式,有基于可編程門陣列FPGA的方式,也有基于異構眾核的方式,還有待探索。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DPU
    DPU
    +關注

    關注

    0

    文章

    414

    瀏覽量

    26971
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DPU數據處理器的核心功能和應用領域

    DPU,全稱數據處理器(Data Processing Unit),是一種專門用于處理數據中心中數據流動與基礎設施任務的專用處理器。它既不像CPU那樣直接參與最終的業務決策,也不像GPU般負責圖形
    的頭像 發表于 02-02 13:52 ?559次閱讀
    <b class='flag-5'>DPU</b>數據處理器的核心功能和應用領域

    基于DPU的智能盤框方案,華為如何大幅提升AI推理的效率?

    DPU
    腦極體
    發布于 :2026年01月20日 12:53:10

    彰顯硬科技實力 中科馭數榮登VENTURE50硬科技榜 構建DPU“運力”底座

    近日,由清科控股、投資界發起的 2025 VENTURE50(簡稱 V50)評選結果正式揭曉,DPU 芯片研發領軍企業中科馭數憑借深厚的技術壁壘、成熟的商業化能力及突出的產業價值,成功榮登 “2025 VENTURE 50 硬科技” 榜單,成為中國科技創新 “深水區” 的標桿代表之
    的頭像 發表于 12-13 11:26 ?1062次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務為 AI 數據存儲、網絡和安全帶來突破性的加速。
    的頭像 發表于 11-03 14:48 ?981次閱讀

    RISC-V DPU,重塑數據中心算力格局?

    電子發燒友網綜合報道 在現代數據中心架構中,數據處理單元(DPU)正迅速崛起為繼 CPU 和 GPU 之后的第三顆核心芯片。DPU 專為數據密集型任務設計,通過卸載 CPU 的低效工作負載,如網絡
    的頭像 發表于 09-13 00:51 ?4724次閱讀

    基于NVIDIA BlueField DPU的5G UPF數據面加速方案

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 09-04 11:26 ?1215次閱讀

    NVIDIA助力Axio團隊打造全新DPU數據面開發框架

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 08-30 15:58 ?1458次閱讀

    利用NVIDIA DPU重塑網絡安全格局

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 08-20 14:31 ?1337次閱讀

    今日看點丨英特爾關閉汽車業務部門;傳國內DPU頭部公司芯啟源停發工資、暴力裁員

    區別對待員工等。 ? 資料顯示,芯啟源于2015年在浙江湖州成立,是家在集成電路領域具有國際領先水平的高科技公司,擁有高端EDA工具、USB IP、DPU和TCAM芯片等4大拳頭產品。芯啟源匯聚全球頂尖高科技人才,擁有支國際
    發表于 06-25 10:56 ?2632次閱讀

    DPU核心技術論文再次登陸體系結構領域旗艦期刊《IEEE Transactions on Computers》

    近期,鄢貴海團隊研究成果在計算機體系結構領域國際頂級期刊《IEEE Transactions on Computers》中發表。該研究主要圍繞KPU敏捷計算架構展開,KPU具有超強異構核集成和調度
    的頭像 發表于 06-11 18:11 ?654次閱讀
    <b class='flag-5'>DPU</b>核心技術論文再次登陸體系<b class='flag-5'>結構</b>領域旗艦期刊《IEEE Transactions on Computers》

    第三屆NVIDIA DPU黑客松開啟報名

    第三屆 NVIDIA DPU 中國虛擬黑客松(Hackathon)將于 6 月 28 日 - 6 月 30 日正式開啟!作為備受廣大開發者期待的年度賽事,它將提供與 NVIDIA 加速網絡技術深度
    的頭像 發表于 05-27 10:16 ?900次閱讀

    中科馭數攜DPU全棧產品亮相福州數博會,賦能智算時代算力基建

    會”)也拉開帷幕。共有150多家企業參展,展會吸引了八萬多名觀眾參觀。作為國內DPU領域領軍企業,中科馭數攜三大產品線亮相展會,其創新的DPU技術方案成為專業觀眾關注焦點。據大會報告的數據顯示,我國算力總規模已達280EFLOPS,數據中心綠色化率超80%。而
    的頭像 發表于 05-23 11:01 ?646次閱讀
    中科馭數攜<b class='flag-5'>DPU</b>全棧產品亮相福州數博會,賦能智算時代算力基建

    DPU232—高度集成USB到UART橋接控制器 國產替代方案

    DPU232是款高度集成的USB到UART橋接控制器,提供了一種簡單的解決方案,可以使用最少的元器件和PCB空間,將RS232接口轉換為USB接口。DPU232包括
    發表于 04-01 10:53

    中科馭數受邀參與華泰證券春季投資峰會 分享DPU在AI領域的應用

    華泰證券2025年春季投資峰會以“破局、重構、裂變”為主題,探討全球變局下的新趨勢。中科馭數高級副總裁張宇受邀參與,分享DPU的產業應用。
    的頭像 發表于 03-29 16:50 ?944次閱讀

    一種基于點、線和消失點特征的單目SLAM系統設計

    本文提出了一種穩健的單目視覺SLAM系統,該系統同時利用點、線和消失點特征來進行精確的相機位姿估計和地圖構建,有效解決了傳統基于點特征的SLAM的局限性。
    的頭像 發表于 03-21 17:07 ?1051次閱讀
    <b class='flag-5'>一種</b>基于點、線和消失點<b class='flag-5'>特征</b>的單目SLAM系統設計