国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用NVIDIA HGX H100加速計算數據中心平臺應用

星星科技指導員 ? 來源:NVIDIA ? 作者:William Tsu ? 2022-04-20 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA 的使命是加快我們的時代達芬奇和愛因斯坦的工作,并賦予他們解決社會的巨大挑戰(zhàn)。隨著 人工智能AI )、 高性能計算 ( HPC )和數據分析的復雜性呈指數級增長,科學家需要一個先進的計算平臺,能夠在一個十年內實現百萬次的加速,以解決這些非同尋常的挑戰(zhàn)。

為了回答這個需求,我們介紹了NVIDIA HGX H100 ,一個由 NVIDIA Hopper 架構 供電的密鑰 GPU 服務器構建塊。這一最先進的平臺安全地提供了低延遲的高性能,并集成了從網絡到數據中心級計算(新的計算單元)的全套功能。

在這篇文章中,我將討論NVIDIA HGX H100 是如何幫助我們加速計算數據中心平臺的下一個巨大飛躍。

HGX H100 8-GPU

HGX H100 8- GPU 是新一代 Hopper GPU 服務器的關鍵組成部分。它擁有八個 H100 張量核 GPU 和四個第三代 NV 交換機。每個 H100 GPU 都有多個第四代 NVLink 端口,并連接到所有四個 NVLink 交換機。每個 NVSwitch 都是一個完全無阻塞的交換機,完全連接所有八個 H100 Tensor Core GPU 。

The HGX H100 8-GPU represents the key building block of the new Hopper generation GPU server and hosts eight H100 Tensor Core GPUs and four third generation NVSwitch.

圖 1 。 HGX H100 8-GPU 的高級框圖

NVSwitch 的這種完全連接的拓撲結構使任何 H100 都可以同時與任何其他 H100 通話。值得注意的是,這種通信以每秒 900 千兆字節(jié)( GB / s )的 NVLink 雙向速度運行,這是當前 PCIe Gen4 x16 總線帶寬的 14 倍多。

第三代 NVSwitch 還為集體運營提供了新的硬件加速,多播和 NVIDIA 的網絡規(guī)模大幅縮減。結合更快的 NVLink 速度,像all-reduce這樣的普通人工智能集體操作的有效帶寬比 HGX A100 增加了 3 倍。集體的 NVSwitch 加速也顯著降低了 GPU 上的負載。

表 1 。將 HGX A100 8- GPU 與新的 HGX H100 8-GPU 進行比較

*注: FP 性能包括稀疏性

HGX H100 8- GPU 支持 NVLink 網絡

新興的 exascale HPC 和萬億參數人工智能模型(用于精確對話人工智能等任務)需要數月的訓練,即使是在超級計算機上。將其壓縮到業(yè)務速度并在數小時內完成培訓需要服務器集群中每個 GPU 之間的高速、無縫通信。

為了解決這些大的使用案例,新的 NVLink 和 NVSwitch 旨在使 HGX H100 8- GPU 能夠通過新的 NVLink 網絡擴展并支持更大的 NVLink 域。 HGX H100 8- GPU 的另一個版本具有這種新的 NVLink 網絡支持。

The HGX H100 8-GPU was designed to scale up to support a larger NVLink domain with the new NVLink-Network.

圖 2 。支持 NVLink 網絡的 HGX H100 8- GPU 的高級框圖

使用 HGX H100 8- GPU 和 NVLink 網絡支持構建的系統(tǒng)節(jié)點可以通過八進制小尺寸可插拔( OSFP ) LinkX 電纜和新的外部 NVLink 交換機完全連接到其他系統(tǒng)。此連接最多支持 256 個 GPU NVLink 域。圖 3 顯示了集群拓撲。

表 2 。比較 256 個 A100 GPU 吊艙和 256 個 H100 GPU 吊艙

*注: FP 性能包括稀疏性

目標用例和性能優(yōu)勢

隨著 HGX H100 計算和網絡能力的大幅增加, AI 和 HPC 應用程序的性能得到了極大的提高。

今天的主流 AI 和 HPC 模型可以完全駐留在單個節(jié)點的聚合 GPU 內存中。例如, BERT -Large 、 Mask R-CNN 和 HGX H100 是最高效的培訓解決方案。

對于更先進、更大的 AI 和 HPC 模型,該模型需要多個聚合 GPU 內存節(jié)點才能適應。例如,具有 TB 級嵌入式表的深度學習推薦模型( DLRM )、大量混合專家( MoE )自然語言處理模型,以及具有 NVLink 網絡的 HGX H100 加速了關鍵通信瓶頸,是此類工作負載的最佳解決方案。

圖 4 來自 NVIDIA H100 GPU 體系結構 白皮書顯示了 NVLink 網絡帶來的額外性能提升。

所有性能數據都是基于當前預期的初步數據,可能會隨著運輸產品的變化而變化。 A100 集群: HDR IB 網絡。 H100 集群: NDR IB 網絡和 NVLink 網絡,如圖所示。

# GPU :氣候建模 1K , LQCD 1K ,基因組學 8 , 3D-FFT 256 , MT-NLG 32 (批次大小: A100 為 4 , 1 秒 H100 為 60 , A100 為 8 , 1.5 和 2 秒 H100 為 64 ), MRCNN 8 (批次 32 ), GPT-3 16B 512 (批次 256 ), DLRM 128 (批次 64K ), GPT-3 16K (批次 512 ), MoE 8K (批次 512 ,每個 GPU 一名專家)?

HGX H100 4-GPU

除了 8- GPU 版本外, HGX 系列還具有一個 4-GPU 版本,該版本直接與第四代 NVLink 連接。

H100 對 H100 點對點對等 NVLink 帶寬為 300 GB / s 雙向,比今天的 PCIe Gen4 x16 總線快約 5 倍。

HGX H100 4- GPU 外形經過優(yōu)化,可用于密集 HPC 部署:

多個 HGX H100 4- GPU 可以裝在 1U 高液體冷卻系統(tǒng)中,以最大化每個機架的 GPU 密度。

帶有 HGX H100 4- GPU 的完全無 PCIe 交換機架構直接連接到 CPU ,降低了系統(tǒng)材料清單并節(jié)省了電源

對于 CPU 更密集的工作負載, HGX H100 4- GPU 可以與兩個 CPU 插槽配對,以提高 CPU 與 GPU 的比率,從而實現更平衡的系統(tǒng)配置。

人工智能和高性能計算的加速服務器平臺

NVIDIA 正與我們的生態(tài)系統(tǒng)密切合作,在今年晚些時候將基于 HGX H100 的服務器平臺推向市場。我們期待著把這個強大的計算工具交給你們,使你們能夠以人類歷史上最快的速度創(chuàng)新和完成你們一生的工作。

關于作者

William Tsu NVIDIA HGX 數據中心產品線的產品管理。他與客戶和合作伙伴合作,將世界上性能最高的人工智能、深度學習和 HPC 服務器平臺推向市場。威廉最初加入NVIDIA 是作為一名圖形處理器芯片設計師。他是最初的 PCI Express 行業(yè)標準規(guī)范的共同作者,也是 12 項專利的共同發(fā)明人。威廉獲得了他的學士學位,碩士學位在計算機科學和 MBA 從加利福尼亞大學,伯克利。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109720
  • 數據中心
    +關注

    關注

    18

    文章

    5647

    瀏覽量

    75009
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265298
  • H100
    +關注

    關注

    0

    文章

    33

    瀏覽量

    588
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    微軟Azure數據中心國際版全面對接NVIDIA Rubin平臺

    2026年CES大會見證了NVIDIA Rubin問世,而微軟Azure數據中心(國際版)憑借前瞻戰(zhàn)略已實現全面對接。通過在散熱與網絡領域的超前布局,Azure(國際版)將系統(tǒng)化方法與Rubin架構
    的頭像 發(fā)表于 03-03 09:56 ?229次閱讀

    1分鐘帶你了解數據中心供電架構 #電子元器件 #數據中心 #供電架構

    數據中心
    沛城芯動力
    發(fā)布于 :2026年02月03日 15:39:04

    48V電壓在數據中心計算平臺中至關重要

    引言 隨著AI和云計算對電力需求的加速增長,數據中心的設計也在以前所未有的速度發(fā)展演變。像±400V DC和800V DC等新的高壓直流輸電(HVDC)架構能夠帶來更高的功率密度、更低的傳輸損耗
    的頭像 發(fā)表于 12-05 14:03 ?640次閱讀

    科通技術亮相2025上海國際數據中心及云計算產業(yè)展覽會

    2025年11月18日至20日,CDCE國際數據中心及云計算展在上海新國際博覽中心成功舉辦。作為NVIDIA Networking及NVIDIA
    的頭像 發(fā)表于 12-02 10:21 ?812次閱讀

    Cadence 借助 NVIDIA DGX SuperPOD 模型擴展數字孿生平臺庫,加速 AI 數據中心部署與運營

    [1]? 利用搭載 DGX GB200 系統(tǒng)的 NVIDIA DGX SuperPOD[2]?數字孿生系統(tǒng)實現了庫的重大擴展 。借助 NVIDIA 高性能加速
    的頭像 發(fā)表于 09-15 15:19 ?1505次閱讀

    加速AI未來,睿海光電800G OSFP光模塊重構數據中心互聯標準

    定義數據中心互聯的新范式。 一、技術實力:800G OSFP光模塊的卓越性能表現 睿海光電800G OSFP光模塊系列采用行業(yè)領先的PAM4調制技術,具備以下核心優(yōu)勢: 超高速率 :單模傳輸速率達
    發(fā)表于 08-13 16:38

    借助美光9550高性能SSD提升AI工作負載

    推理將成為數據中心最常見的工作負載,這一點毋庸置疑。隨著數據中日益廣泛采用NVIDIA H100,以及非NVL72系統(tǒng)開始部署NVIDIA
    的頭像 發(fā)表于 07-14 15:58 ?1673次閱讀
    借助美光9550高性能SSD提升AI工作負載

    中型數據中心中的差分晶體振蕩器應用與匹配方案

    對時鐘源的穩(wěn)定性與抖動性能要求顯著提升,差分晶體振蕩器在其中扮演著核心角色。 中型數據中心典型案例 1. 大型制造企業(yè)工業(yè)數據中心 應用背景: 服務于制造集團的MES系統(tǒng)、IIoT平臺、設備監(jiān)控與調度
    發(fā)表于 07-01 16:33

    小型數據中心晶振選型關鍵參數全解

    邊緣計算數據中心 應用背景:該數據中心用于處理來自IoT設備和遠程傳感器的數據,具備快速數據傳輸和高效存儲能力。 使用設備:邊緣交換機、邊緣路由器、存儲設備(NAS)、無線接入點等。
    發(fā)表于 06-11 13:37

    磁懸浮冷站引領綠色革命,維諦技術(Vertiv)助力中國電信江西云計算數據中心制冷系統(tǒng)實現PUE1.2

    ,如何讓數據中心既當“最強大腦”又做“節(jié)能標兵”?在中國電信江西云計算數據中心,維諦技術(Vertiv)搭建的業(yè)界首個集成自然冷和余熱回收的磁懸浮集成冷站,正在上
    的頭像 發(fā)表于 05-22 14:18 ?921次閱讀
    磁懸浮冷站引領綠色革命,維諦技術(Vertiv)助力中國電信江西云<b class='flag-5'>計算數據中心</b>制冷系統(tǒng)實現PUE1.2

    利用NVIDIA技術構建從數據中心到邊緣的智慧醫(yī)院解決方案

    全球領先的電子制造商正在利用 NVIDIA 技術,構建從數據中心到邊緣的智慧醫(yī)院解決方案。
    的頭像 發(fā)表于 05-22 09:50 ?961次閱讀

    GPU 維修干貨 | 英偉達 GPU H100 常見故障有哪些?

    上漲,英偉達H100GPU憑借其強大的算力,成為AI訓練、高性能計算領域的核心硬件。然而,隨著使用場景的復雜化,H100服務器故障率也逐漸攀升,輕則影響業(yè)務進度,重
    的頭像 發(fā)表于 05-05 09:03 ?2989次閱讀
    GPU 維修干貨 | 英偉達 GPU <b class='flag-5'>H100</b> 常見故障有哪些?

    適用于數據中心和AI時代的800G網絡

    數據中心依賴數千甚至上萬個GPU集群進行高性能計算,對帶寬、延遲和數據交換效率提出極高要求。 AI云:以生成式AI為核心的云平臺,為多租戶環(huán)境提供推理服務。這類
    發(fā)表于 03-25 17:35

    NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

    隨著 NVIDIA 推出 Aether 項目,通過采用 NVIDIA 加速的 Apache Spark 企業(yè)得以自動加速數據中心規(guī)模的分析
    的頭像 發(fā)表于 03-25 15:09 ?1157次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>的Apache Spark助力企業(yè)節(jié)省大量成本

    優(yōu)化800G數據中心:高速線纜、有源光纜和光纖跳線解決方案

    隨著技術的飛速發(fā)展,數據中心正在從100G和400G演進到800G時代,對高速數據傳輸的需求與日俱增。因此,選擇高效且可靠的布線解決方案對于800G數據中心至關重要。本文將深入探討80
    發(fā)表于 03-24 14:20