獨家求證后獲知的信息。" />

国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

獨家解讀NVIDIA CUDA支持Arm——百萬兆級超算競爭再加劇?

張慧娟 ? 來源:電子發燒友網 ? 作者:張慧娟 ? 2019-06-18 03:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


在法蘭克福舉辦的全球超級計算大會上,重磅消息傳來,NVIDIA宣布CUDA支持Arm CPU,為高性能計算開辟全新途徑,以構建具有極高能效水平的百萬兆級AI超級計算機。北京時間6月17日下午四點,NVIDIA與媒體召開電話會議。下文將詳解雙方合作始末,以及<電子發燒友>獨家求證后獲知的信息。

NVIDIA攜手Arm意欲何在?

隨著傳統計算規模擴展步伐的停止,功率將成為所有超級計算機的限制因素。對于與Arm的攜手,NVIDIA創始人兼首席執行官黃仁勛表示:“NVIDIA CUDA加速的計算和Arm的高能效CPU架構的相結合,將助力HPC社區實現大幅提升,以達到百萬兆級。”

雙方合作的原因主要有兩方面:首先,客戶需要更多選擇,一旦完成堆棧優化,Nvidia將加速所有主要CPU架構,包括x86、Power和ARM;其次,通過將NVIDIA軟件棧引入Arm生態系統,將進一步助推在HPC服務器市場的創新。

年底前,NVIDIA將向Arm生態系統提供全堆棧的AI和HPC軟件,該堆棧為600多個HPC應用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發工具,如支持OpenACC的PGI編譯器和性能分析器。

NVIDIA解決方案架構與工程團隊副總裁Marc Hamilton透露,NVIDIA和Arm已為這個計劃準備了兩年左右,認為現在是最佳的發布時機。建立在雙方超過10年的合作基礎之上,此前,NVIDIA幾款用于便攜式游戲、自動駕駛汽車、機器人嵌入式AI計算的系統級芯片產品都采用了Arm。全球眾多涉及超級計算的項目或單位都在尋求Arm的加入,包括歐洲處理器計劃(European Processor Initiative)、日本先進情報項目中心 (RIKEN)、美國能源部的先鋒項目(DOE Vanguard project)等。

合作僅止于HPC軟件方面?還是會進一步影響到某些應用市場?NVIDIA表示,合作同時也是對于其他平臺的補充,例如Jetson Xavier,并將進一步拓展在數據中心和HPC平臺的合作。

超算競爭再加劇

在超級計算機中使用基于Arm的體系結構是值得注意的,和其他架構相比,Arm的一大特色在于出色的能效,能夠為超級計算提供開放式架構,用戶可以實現更為高度的集成。對于需要快速處理和分析大型數據集的研究密集型任務,能夠滿足內存容量和可擴展性需求。

Arm已經在世界各地的許多HPC中心獲得了越來越多的關注,NVIDIA支持Arm CPU后,將為研發超算的研究人員們提供了除英特爾和IBM外的第三種選擇,并使得研發者可以通過這種方式獲得更多的自主控制能力。對于已經選擇了Arm CPU的用戶來說,他們同時可以獲得NVIDIA GPU加速計算選項。CUDA強大的軟件能力,將能夠和Arm的軟件生態無縫銜接,強強聯合。

一直以來,Arm并沒有放棄將其處理器擴展至高性能計算領域的堅持。近年來大的舉動有:2016年8月宣布將與日本富士通公司合作,開發一個以64位ARMv8-A驅動的Post K超級計算機,并于當年12月宣布收購Allinea Software公司,后者主要為超級計算機提供性能分析工具。在2018年11月的TOP500列表上,首次出現了Arm的身影,而且是安裝在大名鼎鼎的美國桑迪亞國家實驗室。與此同時,Cray于2018年11月在英國氣象局交付了一臺基于Arm的超級計算機"Isambard",而日本的下一代超級計算機"Post-K"也同樣基于Arm架構。

超算未來將更為注重能耗

超算屆有兩個重要排名:TOP500和Green500。TOP500主要按照性能基準,提供通用高端應用的系統排名。而相比TOP500,Green500除了追求運算速度,更加重視超算的能耗問題。

根據今年剛剛發布的Green500排行榜,在全球最節能的25款超級計算機中,有22款都得益于NVIDIA的支持。關鍵因素在于:采用NVIDIA GPU的超級計算機能夠將繁重的處理作業卸載至更為節能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優化整體超級計算集群的處理;以及NVIDIA發明的SXM 3D封裝和可實現極密集型擴展節點的NVIDIA NVLink互連技術。

攜手打造超豪華“朋友圈”

包括超算中心和系統提供商以及系統級芯片制造商等在內的眾多HPC行業及Arm生態系統中的全球領先企業,都表達了其對于NVIDIA攜手Arm的支持。

對于超算百萬兆級時代的愿景,Cray認為主要在于將AI和分析與建模、仿真相結合的系統,這些系統能夠支持、也經常需要為科學、工程和數字化轉型所需的數據密集型工作負載構建的多種處理器架構和系統。Cray系統管理和編程環境(編譯器、庫和工具)已經能夠在XC和未來的Shasta超級計算機上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺,并將其與Cray系統管理和編程環境緊密集成,能夠助力其超級計算機實現最終愿景。

“歐洲處理器計劃(European Processor Initiative,EPI)總經理Philippe Notton則表示,打造歐盟自己的高端、低功耗、通用和加速器解決方案,EPI和其工業合作伙伴SiPearl非常看好NVIDIA所帶來的全新可能性。將EPI基于Arm的微處理器與NVIDIA加速器相結合,能夠匹配未來歐洲百萬兆級模塊化超級計算機中的構建模塊。”

考慮到未來幾年內百萬兆級系統和大規模AI計算的興起,Jülich超算中心負責人Thomas Lippert表示, NVIDIA對Arm處理器的支持是非常令人興奮的發展,對于實現未來超級計算機和可組合數據中心的真正模塊化至關重要。

在HPC網絡方面處于領先地位的Mellanox Technologies,其InfiniBand和以太網技術連接了全球多款大型的超級計算機,其中就包括第一代基于Arm的各系統。該公司創始人兼首席執行官Eyal Waldman希望通過持續合作,部署200Gb/s HDR和計算網絡技術,以優化HPC和AI工作負載,并實現新一代基于Arm的超級計算機的超級連接。

百萬兆級意義何在?

全球超級計算機競賽正朝著“百萬兆級計算”這個里程碑似的目標前進著。

百萬兆級意味著什么?一個百萬兆級的計算機一瞬間進行的計算量,相當于地球上所有人每天每秒都不停地計算四年。

這種非凡的力量將使研究人員能夠進行大規模復雜的模擬,從而在許多領域取得進展,從氣候科學到基因組學、可再生能源和人工智能。田納西大學的超級計算機專家Jack Dongarra曾說過:“百萬兆級的計算機是一項有力的科學工具,就像粒子對撞機或巨型望遠鏡一樣。”這些機器在工業上也很有用,它們可以被用于加速產品設計和識別新材料。軍方和情報機構也渴望這樣的超級計算機能夠將被用于維護國家安全。超級計算機是促進科學發現的重要工具,建立百萬兆級超級計算將能夠極大地擴展人類知識的邊界。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9553

    瀏覽量

    391883
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109731
  • 超級計算
    +關注

    關注

    1

    文章

    45

    瀏覽量

    11553
  • HPC
    HPC
    +關注

    關注

    0

    文章

    346

    瀏覽量

    24976
  • CUDA
    +關注

    關注

    0

    文章

    127

    瀏覽量

    14475
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
    的頭像 發表于 02-10 10:31 ?243次閱讀

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發者學習 NVIDIA CUDA Tile 編程,掌握構建高性能 GPU 內核的方法,并以矩陣乘法作為核心示例。
    的頭像 發表于 01-22 16:43 ?4821次閱讀
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile中編寫高性能矩陣乘法

    NVIDIA CUDA Tile的創新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA
    的頭像 發表于 12-24 10:17 ?466次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile的創新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發表于 12-13 10:12 ?1195次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile簡化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發明以來,規模最大、內容最全面的一次更新。
    的頭像 發表于 12-13 10:08 ?2207次閱讀

    NVIDIA在Hot Chips 2025大會展示創新技術

    本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會上,NVIDIA 專家詳細介紹了 NVIDIA NVLink 和Spectrum-X 以太網技術、Blackwell 以及 CUDA 如何為全球數
    的頭像 發表于 08-27 12:52 ?1922次閱讀

    AI MCU#易創新GD32H7系列MCU解讀

    易創新GD32H7系列MCU是中國首款基于Arm? Cortex?-M7內核的超高性能微控制器,主打高力與多場景適配能力,以下從核心特性應用場景及開發生態三方面深度解析: 一核心性能與架構
    的頭像 發表于 06-27 14:43 ?3517次閱讀

    軟通智完成A輪融資,加速AI力產業布局

    北京 2025年6月18日 /美通社/ -- 近日,軟通動力旗下軟通智科技(廣東)集團有限公司(以下簡稱"軟通智")完成A輪融資,本輪融資由盛景嘉成創投領投,廣發信德、毅達資
    的頭像 發表于 06-18 15:37 ?573次閱讀

    NVIDIA B30芯片的核心解讀

    以下是關于NVIDIA B30芯片的核心解讀,綜合最新行業信息與分析: 一、 產品定位:中國特供的“精準閹割版”? ? ? 設計目標 ? 專為中國市場定制,旨在規避美國出口管制(如H20芯片被禁
    的頭像 發表于 06-05 14:44 ?3429次閱讀

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    面向 PC 市場的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場推出的核心計算平臺,屬于其“平臺優先”戰略的關鍵布局。作為 ?
    的頭像 發表于 05-29 09:56 ?1635次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    面向汽車市場的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領域推出的核心計算平臺,屬于其“平臺優先”戰略的關鍵布局。作為
    的頭像 發表于 05-29 09:51 ?2465次閱讀

    華為全液冷充技術深度解讀

    一、華為全液冷充技術深度解讀 1. 技術定義與核心參數 華為全液冷
    的頭像 發表于 04-24 11:37 ?8913次閱讀
    華為全液冷<b class='flag-5'>兆</b>瓦<b class='flag-5'>級</b><b class='flag-5'>超</b>充技術深度<b class='flag-5'>解讀</b>

    充已來,40kW模塊急需升級

    電子發燒友網報道(文/梁浩斌)比亞迪的充,引爆了充電樁行業,1000kW充電功率的車型落地,將帶動充電樁加速導入市場。除了比亞迪之外,近期行業內其實也有不少
    的頭像 發表于 04-13 00:02 ?3208次閱讀

    TASKING編譯器全面支持易創新GD32A7x車規MCU

    近日,易創新 GD32A7x 車規 MCU 正式獲得 TASKING VX-toolset for Arm v7.1r1 的全面支持。作為業內領先的嵌入式開發工具,TASKING
    的頭像 發表于 04-12 14:31 ?1453次閱讀

    使用NVIDIA CUDA-X庫加速科學和工程發展

    NVIDIA GTC 全球 AI 大會上宣布,開發者現在可以通過 CUDA-X 與新一代超級芯片架構的協同,實現 CPU 和 GPU 資源間深度自動化整合與調度,相較于傳統加速計算架構,該技術可使計算工程工具運行速度提升至原來的 11 倍,計算規模增加至 5 倍。
    的頭像 發表于 03-25 15:11 ?1533次閱讀