国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA BlueField DPU提高HPC應用程序性能和可擴展性

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-10-12 10:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

超級計算機用于建模和模擬科學計算中最復雜的過程,通常是為了洞察新發現,否則這些新發現在物理上是不切實際的或不可能演示的。

NVIDIA BlueField DPU(數據處理器)正在將高性能計算(HPC)資源轉化為更高效的系統,同時在從數學建模和分子動力學到天氣預報、氣候研究,甚至可再生能源的廣泛科學研究中加速解決問題。

8d4e536e-4966-11ed-a3b6-dac502259ad0.jpg

BlueField 已經在云網絡、網絡安全、通信和邊緣計算領域產生了顯著影響。此外,在高性能計算的多個領域引發了應用程序性能和系統效率方面的創新。

NVIDIA BlueField-3 提供了強大的計算能力,其基于多個 Arm AArch64 內核、多線程數據路徑加速器、集成的 NVIDIA ConnectX-7 400Gb/s 網絡 ,以及 I/O 路徑中的各種可編程加速引擎。它配備了雙 DDR 6500MT / s DRAM 控制器,并配有高達 32 GB 的板載內存。BlueField-3 是第三代片上數據中心基礎設施,可實現從云到核心數據中心再到邊緣的、高效且強大的軟件定義、硬件加速基礎設施。

那么,這一切對高性能計算意味著什么呢?

提高 HPC 應用程序性能和可擴展性

HPC 就是為了提高性能和可擴展性。近二十年來,InfiniBand 網絡在性能和應用程序可擴展性方面一直處于領先地位,這有幾個原因。

從高層次來看,InfiniBand 只是最有效的數據移動方式:直接數據放置。在數據從網絡接口通過系統到達需要它的實際應用程序時,無需涉及 CPU操作系統,也無需制作數據的多個副本。

如果 InfiniBand 已經如此高效,BlueField 會帶來什么好處?

InfiniBand 多年來一直在解決的關鍵挑戰之一是將網絡通信開銷從 CPU 移開,使其能夠將時間集中在最擅長的事情上:應用程序計算和分支代碼。

當今主流服務器中的 CPU 過于通用,在數百或數千個與實際計算幾乎無關的進程中共享其計算周期、時間和資源。

BlueField 通過卸載、加速和隔離廣泛的高級網絡、存儲和安全服務,為超級計算帶來了前所未有的創新和效率。

為什么人工智能時代帶來了

對 BlueField DPU 的需求

人工智能研究領域作為一門學科于 1956 年成立。甚至在那之前的十年,科學家們就開始討論創造人工大腦的可能性。隨著現代計算機硬件和軟件的發展,這些概念很晚才成為現實。

2006 年,NVIDIA 推出了業界首個針對 GPU 的 C 編譯器開發環境 CUDA ,解決復雜計算問題的速度比傳統方法快 100 倍。今天,人工智能成果豐碩,幾乎推動了科學研究的每個領域,改變了我們的生活,塑造了工業格局。

同樣, 2006 年年中推出了用于非阻塞集合操作的首個提案。為消息傳遞接口(MPI)的集合組通信功能而提出的非阻塞接口在理論上肯定是成效斐然的。然而,它并沒有在許多應用程序中實現。也許這是因為,在引入 DPU 之前,無法實現全部好處。

今天,隨著 BlueField-3 的問世,這項技術已經提供了創新、性能和效率所需的基本要素。為了提高應用程序性能和可伸縮性,并消除操作系統抖動的影響,非阻塞集合操作重新引起了人們的興趣。

科學計算還有幾個領域,包括早期的例子,BlueField 正在展示其如何將 HPC 轉化為高效和可持續的計算。

通過網絡計算節省 CPU 周期

NVIDIA 的 Scalable Hierarchical Aggregation and Reduction Protocol(SHARP)技術通過將許多阻塞集體操作從 CPU 卸載到交換網絡,且無需在端點之間多次發送數據,從而提高了 MPI 操作的性能。這種創新的方法減少了到達聚合節點時穿越網絡的數據量,并大大減少了 MPI 操作時間。

BlueField 通過利用其 Arm 內核實現非阻塞操作,擴展了額外的網絡計算能力。這使系統主機 CPU 能夠執行峰值重疊計算。

圖 2 顯示了一個使用 MVAPICH2- DPU 庫的示例,該庫正在進行優化,以充分利用 BlueField 的全部潛力。它顯示了提取主機上發生的計算與 MPI_Ialltoall 通信之間的峰值重疊的能力。

8d74dd40-4966-11ed-a3b6-dac502259ad0.jpg

適用于 HPC 工作負載的計算存儲

計算存儲(或稱為存儲計算)為傳統存儲設備帶來了 HPC 功能。在計算存儲中,您可以在存儲設備內或旁邊執行選定的計算任務,從而減輕主機處理負擔并減少數據移動。BlueField 提供在單卡上結合存儲和網絡計算的能力。

BlueField 使存儲軟件堆棧能夠從計算節點卸載,同時還可作為網絡架構附加 NVMe 控制器,能夠加速關鍵存儲功能,如壓縮、校驗和計算以及奇偶校驗生成。此類服務在并行文件系統中提供。

整個存儲系統堆棧在 Linux 內核中透明卸載,同時在 NVMe 目標端由 NVIDIA DOCA 簡單實現標準存儲功能。

新一代開放存儲架構為加速、隔離和保護高性能存儲系統提供了一種新的范例。該系統采用硬件和軟件協同設計,使 DPU 對用戶來說非常高效和透明。

文件系統的加速意味著提高存儲系統中關鍵功能的性能,而存儲系統性能是基于深入學習的科學探究的關鍵促成因素。

將存儲客戶端和服務器完全卸載到 DPU 的能力帶來以前無法實現的安全和性能隔離級別。關鍵數據平面和控制平面功能移動到 DPU 上的單獨域。這樣可以免除服務器 CPU 的工作負擔,并在 CPU 或其軟件受損的情況下保護功能。

NVIDIA DOCA 軟件框架

NVIDIA DOCA SDK 是釋放 BlueField 潛力的關鍵。NVIDIA DOCA 和 BlueField DPU 通過一個全面、開放的開發平臺,共同實現了應用程序的開發,這些應用程序可以提供突破性的網絡、安全、存儲和應用程序性能。

NVIDIA DOCA 支持一系列操作系統和發行版,包括驅動程序、庫、工具、文檔和示例應用程序。即將發布的 NVIDIA DOCA 1.5 和 2.0 版本引入了廣泛的網絡、存儲、安全功能和增強功能,為 HPC 開發人員提供突破性的性能和高級編程能力:

全新的通信通道庫

快速訪問主機內存以實現 UCX 加速

存儲仿真(SNAP),包括存儲加密

全新的 NVIDIA DOCA 服務,包括 UCC 卸載服務和遙測服務

NVIDIA DOCA 安全 SDK

改變 HPC 領域的今天和明天

許多創新領域已經初露端倪,BlueField DPU 、NVIDIA DOCA 以及社區將繼續為 HPC 領域帶來改變。

有些想法已經實現了,例如在數據中心范圍內增強性能隔離,或增強作業調度程序以實現更智能的作業安排。

由于科學應用程序通常是高度同步的,因此系統噪聲對大型 HPC 系統的負面影響可能會對性能產生更大的影響。減少存儲等其他過程引起的系統噪音至關重要。

遙測信息功能強大。它不僅僅是收集有關路由器、交換機和網絡流量的信息。相反,可以通過工作負載和 I/O 特性收集和共享信息。

AI 框架精確地調整了 NVIDIA Quantum-2 InfiniBand 平臺中的性能隔離算法。共享公共數據中心資源(如網絡和存儲)的多應用程序環境可以確保能實現的最佳性能,就像應用程序作為單個實例在裸機上運行一樣。

BlueField DPU 完全有能力應對大規模計算帶來的挑戰。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109723
  • 超級計算機
    +關注

    關注

    2

    文章

    481

    瀏覽量

    43368
  • DPU
    DPU
    +關注

    關注

    0

    文章

    414

    瀏覽量

    26965
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA BlueField-4數據處理器重塑新型AI原生存儲基礎設施

    NVIDIA 宣布,NVIDIA BlueField?-4 數據處理器作為全棧 NVIDIA BlueField 平臺的一部分,為
    的頭像 發表于 01-09 10:33 ?469次閱讀

    NVIDIA在ISC 2025分享最新超級計算進展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代網絡和量子技術實現了飛躍。在 SC25 上展示的加速系統突顯了全球超級計算和 AI 的進展
    的頭像 發表于 11-25 10:59 ?901次閱讀
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超級計算進展

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的頭像 發表于 11-03 14:48 ?979次閱讀

    如何評估電能質量在線監測裝置的擴展性

    評估電能質量在線監測裝置的擴展性,需圍繞 “ 硬件擴展、軟件升級、協議兼容、場景適配 ”
    的頭像 發表于 10-22 16:35 ?581次閱讀

    電能質量在線監測裝置的兼容性和擴展性對其性能有何影響?

    電能質量在線監測裝置的兼容性和擴展性,是決定其 “能否融入現有系統、適應未來變化” 的核心屬性,直接影響裝置的 數據互通性、功能適配性、生命周期價值 ,進而間接作用于諧波源識別準確率、定位精度等核心性能
    的頭像 發表于 10-22 16:25 ?488次閱讀

    NetApp助力對象存儲現代化,提升速度、擴展性和安全性

    計。最新版本的StorageGRID將引入新功能,旨在推進人工智能計劃、提高數據安全性并實現企業數據基礎設施的現代化。 無論企業是處于數據湖現代化的早期階段,還是正在試驗高級人工智能應用程序,他們都需要管理并存儲激增的非結構化數據,例如文本、視頻、機器和傳感器數據、服務器
    的頭像 發表于 09-11 10:41 ?546次閱讀

    基于NVIDIA BlueField DPU的5G UPF數據面加速方案

    在第三屆 NVIDIA DPU 黑客松競賽中,我們見證了開發者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現了在 AI 網絡、存儲和安全等領域的創新突破。
    的頭像 發表于 09-04 11:26 ?1212次閱讀

    NVIDIA桌面GPU系列擴展新產品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,
    的頭像 發表于 08-18 11:50 ?1411次閱讀

    NVIDIA Jetson AGX Thor開發者套件概述

    NVIDIA Jetson AGX Thor 開發者套件為您提供出色的性能擴展性。它由 NVIDIA Blackwell GPU和128
    的頭像 發表于 08-11 15:03 ?1902次閱讀

    NVIDIA Dynamo新增對亞馬遜云科技服務的支持

    ) 和 AWS Elastic Fabric Adapter (EFA) 的現有集成。此次更新將大規模部署大語言模型 (LLM) 的性能擴展性和成本效益提升到了新的水平。
    的頭像 發表于 07-28 14:31 ?976次閱讀
    <b class='flag-5'>NVIDIA</b> Dynamo新增對亞馬遜云科技服務的支持

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發布,每個版本都擴展NVIDIA
    的頭像 發表于 07-04 14:27 ?1237次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮點解析

    瑞薩電子RA系列微控制器的擴展性強的配置軟件包 (FSP)安裝下載與使用指南

    瑞薩電子RA系列微控制器的擴展性強的配置軟件包 (FSP)安裝下載與使用指南
    的頭像 發表于 06-11 17:21 ?1858次閱讀

    第三屆NVIDIA DPU黑客松開啟報名

    碰撞的絕佳機會。本次競賽采用開放式主題,參與者將通過 NVIDIA DOCA 軟件框架構建創新的加速應用程序,充分挖掘 NVIDIA BlueField
    的頭像 發表于 05-27 10:16 ?900次閱讀

    瑞芯微RK3288解決方案:高性能、高擴展性的嵌入式系統設計理念與應用分析

    。本文將深入剖析基于RK3288的處理方案,重點闡述其在硬件架構、軟件平臺、擴展性設計以及應用場景等方面的優勢,并探討其所蘊含的嵌入式系統設計理念。一、RK328
    的頭像 發表于 05-08 15:39 ?1129次閱讀
    瑞芯微RK3288解決方案:高<b class='flag-5'>性能</b>、高<b class='flag-5'>擴展性</b>的嵌入式系統設計理念與應用分析

    IAR推動嵌入式開發:云就緒、擴展的CI/CD和持續自動化

    IAR正式發布全新云就緒平臺,為嵌入式開發團隊提供企業級的擴展性、安全性和自動化能力。
    的頭像 發表于 04-07 11:21 ?672次閱讀