国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA BlueField-2 DPU性能測試方法

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-01-04 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

查看文末海報,免費注冊成為 DOCA 開發者

DPU(數據處理器)將服務器和存儲之間的 IOPS 性能提升至 4100 萬以上,超過之前世界紀錄的四倍。

數據中心需要超高速存儲訪問,而目前還沒有哪個 DPU 的速度能比 NVIDIA BlueField-2 更快。

NVIDIA 近期測試顯示,兩個 BlueField-2 DPU(數據處理器)的每秒輸入/輸出(IOPS)性能達到 4150 萬次,超過任何其他 DPU 性能的 4 倍。

BlueField-2 DPU 使用標準網絡協議和開源軟件打破性能紀錄,使用業界常用的存儲介質訪問方法 NVMe over Fabrics(NVMe-oF)以及最通用的互聯網協議之一 TCP 網絡,其 4KB IOPS 性能超過 500 多萬,而 512B IOPS 則達到 700 萬至 2000 萬以上。

為了加速 AI、大數據和高性能計算應用,BlueField 還支持流行的 RoCE 網絡傳輸選項以提供更高的存儲性能。

在測試中,initiator 端和 target 端都部署了 BlueField,使用不同類型的存儲軟件庫和不同的應用來模擬真實世界的存儲配置,都展現出超強的性能。BlueField 在 InfiniBand 網絡上還支持快速存儲連接,而 InfiniBand 是許多 HPC 和 AI 應用的首選網絡架構。

測試方法

BlueField 所達到的 4150 萬 IOPS,是之前使用專有存儲產品創造的 1000 萬 IOPS 世界紀錄的 4 倍多。這一性能是通過連接兩臺快速 Hewlett Packard Enterprise Proliant DL380 Gen 10 Plus 服務器實現的,其中的一臺作為應用服務器(存儲 initiator),另一臺作為存儲系統(存儲 target)。

每臺服務器均配備兩個英特爾 “Ice Lake” 至強白金 2.3GHz 8380 處理器,支持 160 個超線程核以及 512GB 的 DRAM、120MB 的 L3 緩存(每個處理器60MB)和 PCIe Gen4 總線。

為了加速網絡和 NVMe-oF,每臺服務器均配備了兩塊 NVIDIA BlueField-2 P系列 DPU 卡,每塊卡帶有兩個 100Gb 以太網端口,在 initiator 和 target 之間有四個網絡端口合計 400Gb/s 線速帶寬,并通過 NVIDIA LinkX 100GbE Direct-Attach Copper(DAC)無源電纜背對背連接。兩臺服務器均安裝 Red Hat Enterprise Linux(RHEL)8.3 版本。

對于存儲系統軟件,測試 SPDK 和標準 upstream Linux 內核 target,使用默認內核 4.18 和最新內核之一 5.15。對三種不同的存儲 initiator 進行了基準測試,分別為 SPDK、標準內核存儲 initiator 和 SPDK FIO 插件。使用 FIO 和 SPDK 生成負載并進行測量,使用 4KB 和 512B 這兩種常見的中型和小型存儲 I/O 大小來測試。

在網絡傳輸層使用了 TCP 和 RoCE 兩種協議來測試 NVMe-oF 存儲,每種配置都在全雙向網絡的條件下以 100% 讀取、100% 寫入和 50/50 讀取/寫入負載模型進行測試。

測試顯示 BlueField DPU 還具有以下性能特點:

用較小的 512B I/O 大小測試,結果顯示 IOPS 更高,但吞吐量低于端口線速,而用 4KB I/O大小測試,結果顯示吞吐量很高,而 IOPS 有所降低。

100% 讀取和100% 寫入兩種負載的 IOPS 和吞吐量性能類似,而 50/50 讀/寫混合負載由于充分使用網絡連接的兩個方向產生了更高的性能。

使用 SPDK 測試,得出的性能高于內核軟件性能,但同時帶來了更高的服務器 CPU 利用率,這是因為 SPDK 在用戶空間中運行并不斷進行輪詢,因此這一情況在預期之內。

由于 Linux 社區會定期加入存儲改進,因此較新的 Linux 5.15 內核比 4.18 內核表現更好。

創紀錄的 DPU 存儲性能

為存儲安全提供了性能保障

在如今的存儲領域,絕大多數云和企業部署都需要快速、分布式、通過以太網或 InfiniBand 訪問的網絡閃存。更快的服務器、GPU、網絡和存儲介質都要求服務器的 CPU 能夠跟上,而最好的方法就是部署具有存儲功能的 DPU。

BlueField-2 DPU 所展現的驚人存儲性能,使整個數據中心的應用服務器和存儲設備都具有更高的性能和效率。

在快速存儲訪問的基礎上,BlueField 還支持對以太網存儲流量和存儲介質本身的硬件加速加密和解密,這有助于防止數據被盜或外泄。

它能以高達 100Gb/s 的速度卸載 IPsec(線上數據),以及高達 200Gb/s 的速度卸載 256 位 AES-XTS(靜態數據),能夠在對手入侵存儲網絡或者物理存儲驅動器被盜、被出售或被不當處置的情況下,減少數據被盜的風險。

客戶和領先的安全軟件廠商正在使用最近更新的 BlueField 的 NVIDIA DOCA 框架,以在 DPU 上運行分布式防火墻,或提供微分段的安全組等網絡安全應用,來進一步提高計算服務器的應用和網絡安全,降低服務器存儲的不當訪問或數據修改風險。

NVIDIA BlueField-2 DPU 測試結果細節如下圖:

使用 NMe-oF on TCP 測試 NVIDIA BlueField-2 DPU。測試結果是配置了兩個 BlueField-2 DPU 的合并性能。

使用 NVMe-oF RoCE 測試 NVIDIA BlueField-2 DPU。測試結果是配置了兩個 BlueField-2 DPU 的合并性能。

NVIDIA DOCA 現已開放接受申請,掃描下方海報二維碼,或點擊“閱讀原文”,即可注冊加入,搶先體驗,走在技術前沿!

原文標題:NVIDIA BlueField 再創 DPU 性能世界紀錄

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109732
  • DPU
    DPU
    +關注

    關注

    0

    文章

    414

    瀏覽量

    26971
  • 性能
    +關注

    關注

    0

    文章

    276

    瀏覽量

    19675

原文標題:NVIDIA BlueField 再創 DPU 性能世界紀錄

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發者學習 NVIDIA CUDA Tile 編程,掌握構建高性能 GPU 內核的方法,并以矩陣乘法作為核心示例。
    的頭像 發表于 01-22 16:43 ?4822次閱讀
    如何在<b class='flag-5'>NVIDIA</b> CUDA Tile中編寫高<b class='flag-5'>性能</b>矩陣乘法

    NVIDIA BlueField-4數據處理器重塑新型AI原生存儲基礎設施

    NVIDIA 宣布,NVIDIA BlueField?-4 數據處理器作為全棧 NVIDIA BlueField 平臺的一部分,為
    的頭像 發表于 01-09 10:33 ?471次閱讀

    NVIDIA在CES 2026發布新一代Rubin AI平臺

    通過跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交換機、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太網交換機的極致協同設計,大幅縮短訓練時間
    的頭像 發表于 01-09 10:23 ?617次閱讀

    NVIDIA RTX PRO 4000 Blackwell GPU性能測試

    作為 NVIDIA 專業顯卡產品線中單槽性能的巔峰之作,NVIDIA RTX PRO 4000 Blackwell 在各項核心指標上均實現對前代 NVIDIA RTX 4000 Ada
    的頭像 發表于 12-29 15:30 ?1347次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell GPU<b class='flag-5'>性能</b><b class='flag-5'>測試</b>

    NVIDIA RTX PRO 2000 Blackwell GPU性能測試

    越來越多的應用正在使用 AI 加速,而無論工作站的大小或形態如何,都有越來越多的用戶需要 AI 性能NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發表于 11-28 09:39 ?6302次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell GPU<b class='flag-5'>性能</b><b class='flag-5'>測試</b>

    NVIDIA在ISC 2025分享最新超級計算進展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網絡和量子技術實現了飛躍。在 SC25 上展示的加速系統突顯了全球超級計算和 AI 的進展
    的頭像 發表于 11-25 10:59 ?902次閱讀
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超級計算進展

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的頭像 發表于 11-03 14:48 ?980次閱讀

    利用NVIDIA DOCA GPUNetIO技術提升MoE模型推理性能

    在第三屆 NVIDIA DPU 中國黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 09-23 15:25 ?1028次閱讀

    基于NVIDIA BlueField DPU的5G UPF數據面加速方案

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 09-04 11:26 ?1214次閱讀

    NVIDIA助力Axio團隊打造全新DPU數據面開發框架

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 08-30 15:58 ?1458次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構 GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產品 NVIDIA RTX 450
    的頭像 發表于 08-28 11:02 ?3988次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell GPU<b class='flag-5'>測試</b>分析

    利用NVIDIA DPU重塑網絡安全格局

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 08-20 14:31 ?1337次閱讀

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發布,每個版本都擴展了 NVIDIA BlueField
    的頭像 發表于 07-04 14:27 ?1238次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點解析

    第三屆NVIDIA DPU黑客松開啟報名

    碰撞的絕佳機會。本次競賽采用開放式主題,參與者將通過 NVIDIA DOCA 軟件框架構建創新的加速應用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、網絡、存儲和
    的頭像 發表于 05-27 10:16 ?900次閱讀

    單晶硅納米力學性能測試方法

    在材料納米力學性能測試的眾多方法中,納米壓痕技術憑借其獨特的優勢脫穎而出,成為當前的主流測試手段。
    的頭像 發表于 03-25 14:38 ?1479次閱讀
    單晶硅納米力學<b class='flag-5'>性能</b><b class='flag-5'>測試</b><b class='flag-5'>方法</b>