国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大家都在爭相超過A100,無人對標的Grace Hopper性能幾何?

E4Life ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2023-09-06 01:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/周凱揚)作為英偉達CPUGPU技術開發上的集大成之作,Grace Hopper很大程度上象征著復雜計算領軍產品。盡管英偉達竭盡所能地去堆這一“超級芯片”的性能,但英偉達還是選擇將Grace Hopper(GH200)描述成了世界上最萬能的計算平臺,這也得益于它同時在AI計算和HPC計算領域展現的可怕性能。

AI計算性能

相信絕大多數人已經從市場瘋搶A100、H100的現狀,對Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作為一個異構計算平臺,在與傳統的x86 CPU與H100對比上,也有著不小的性能差距。

首要區別自然就是連接Grace CPU和Hopper GPU的NVLink-C2C,這一高帶寬低延遲的互聯技術可謂是目前唯一能發揮H100近乎全部實力的方案。支持最高144TB內存的同時,提供900GB/s的帶寬。

英偉達官方也對部分AI計算負載進行了測試,在終端應用上對比x86+Hopper與Grace Hopper的一體化方案有何異同。其性能差距可以說是巨大的,就拿最常見的大語言模型推理來說,GH200可以做到x86平臺的4.5倍性能表現,而DLRM(深度學習推薦模型)訓練與圖神經網絡(GNN)訓練的性能也可以分別達到3.5倍和1.9倍。

其實這里的差異還是體現在互聯方案的帶寬上,例如x86+Hopper的方案還是在使用PCIe方案,該方案在batch size較小時性能落后還不算明顯,一旦到了更大的batch size,PCIe的帶寬就成了瓶頸,而不斷以高帶寬輸送數據給H100的NVLink-C2C則可以實現比PCIe高出數倍的性能。

HPC計算性能

Grace Hopper的另一大應用領域自然就是HPC了。HPC主要集中在一些科學、工程的復雜計算上,比如天氣預測、生命科學、流體力學等。然而與此同時,不少商業相關的HPC計算也在進一步推動HPC的發展,甚至更早用上最新的芯片技術,比如油藏模擬等。

著名油藏模擬軟件ECHELON的開發商Stone Ridge,在最近獲得了早期訪問權,對英偉達的H100-PCIe、H100-NVL和Grace-Hopper來了場性能測試。早在Volta和Ampere架構時,Stone Ridge就對不同架構的GPU進行了測試,而如今的H100相較這些舊GPU已經在CUDA核心、內存容量和內存帶寬上有了數倍的提升。

這些還只是表面上的變化,英偉達還引入了諸多架構改進,提高了ML和HPC應用程序的性能。而Grace Hopper相較傳統的x86+GPU方案就更具優勢了,首先Grace本身就是一個強大的CPU,每個內核都有四個128位適量單元,超高的內存帶寬以及超大的L2+L3緩存。其次,NVLink的存在大大減少了CPU和GPU之間的通信時間。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架構不同版本的英偉達GPU在ECHELON模型上的性能對比 / Stone Ridge


Stone Ridge選擇了不同細胞規模的模型,從83000個細胞到670萬個細胞,其中Grace Hopper都展現出了不俗的性能,最高可達Volta架構的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架構,所以ECHELON必須重新編譯才能在系統上運行,不過對于ECHELON來說,重新編譯并不要花太多力氣,他們在不修改代碼的情況就成功重編譯在GH200上正常運行。如果對代碼進行進一步優化的話,還有機會獲得更高的性能表現。如此高的性能提升,意味著油藏勘探模擬的時間可以被大幅縮短,從而加快油藏評估的速度。

結語

可以說無論是A100還是H100,都只是英偉達在AI與HPC戰線擴大戰果的第一步棋,明年Q2交付到各大系統中的GH200才是最大的殺手锏,也很可能會成為更搶手的數據中心與超算中心硬件產品。這也恰好證明了英偉達給它的定位,世界上最萬能的計算平臺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    阿里神秘AI芯片正式官宣!GPGPU路線,性能超越A100

    電子發燒友網報道(文/梁浩斌)去年9月,我們曾報道過,阿里平頭哥一款未公開的AI算力芯片PPU登上央視《新聞聯播》節目,該產品性能參數在新聞背景畫面中被曝光。直到今年1月29日,在平頭哥半導體官網上
    的頭像 發表于 01-30 09:01 ?2764次閱讀
    阿里神秘AI芯片正式官宣!GPGPU路線,<b class='flag-5'>性能</b>超越<b class='flag-5'>A100</b>

    《當一個 MCU 原廠的型號超過 100 個,會發生什么?》

    當 MCU 型號只有幾十個時, 很多問題是感知不到的。 但一旦超過 100 個,變化會非常明顯。 第一件事:復制開始失效 簡單復制配置: 會帶來隱性差異 小問題逐漸累積 修一個型號,可能影響多個
    發表于 02-27 10:04

    R&amp;S羅德與施瓦茨SMBV100A SMC100A SMB100A信號發生器

    RS、 愛德萬Advantest、 艾法斯/馬可尼IFR/Marconi、 吉時利Keithley、 福祿克Fluke、 力科Lecroy、 萊特波特LitePoint、 等世界著名品牌。 ? R&S羅德與施瓦茨SMBV100A SMC100A SMB
    的頭像 發表于 01-28 14:53 ?155次閱讀
    R&amp;S羅德與施瓦茨SMBV<b class='flag-5'>100A</b> SMC<b class='flag-5'>100A</b> SMB<b class='flag-5'>100A</b>信號發生器

    R&amp;S羅德與施瓦茨SMC100A SMB100A SMA100A SMF100A信號發生器

    RS、 愛德萬Advantest、 艾法斯/馬可尼IFR/Marconi、 吉時利Keithley、 福祿克Fluke、 力科Lecroy、 萊特波特LitePoint、 等世界著名品牌。 R&S羅德與施瓦茨SMC100A SMB100A SMA
    的頭像 發表于 01-28 14:45 ?150次閱讀
    R&amp;S羅德與施瓦茨SMC<b class='flag-5'>100A</b> SMB<b class='flag-5'>100A</b> SMA<b class='flag-5'>100A</b> SMF<b class='flag-5'>100A</b>信號發生器

    TE Connectivity 2.0mm信號GRACE INERTIA連接器技術解析

    TE Connectivity (TE) 2.0mm信號GRACE INERTIA連接器采用緊湊、節省空間的設計,額定電壓為50V ~AC~ ,設有2至10位。這些連接器具有慣性鎖定機制(有助于防止
    的頭像 發表于 11-09 15:12 ?783次閱讀

    看點:OpenAI全球企業客戶數量超過100萬 ASML:半導體產業開放合作是主流

    大家帶來一些業界資訊: OpenAI全球企業客戶數量超過100萬 據外媒報道,OpenAI在當地時間周三宣布,全球已經有100萬家企業正在直接使用該公司的服務;其中包括所有主動為商業
    的頭像 發表于 11-06 16:17 ?755次閱讀

    ?TE Connectivity GRACE INERTIA多負載連接器技術解析與應用實踐

    TE Connectivity GRACE INERTIA多負載連接器為需要多功能線對板解決方案的印刷電路板(PCB) 制造商提供了設計靈活性。 這些連接器具有14.1mm的低插配高度,便于 PCB
    的頭像 發表于 11-02 16:55 ?1387次閱讀

    TE Connectivity GRACE INERTIA連接器技術解析:微型化SMT解決方案的設計實踐

    的設計、耐用性和高性能。TE 1.25mm和1.5mm信號型GRACE INERTIA連接器適合用于電源和信號應用,如電器、運輸和照明。
    的頭像 發表于 11-02 16:23 ?743次閱讀
    TE Connectivity <b class='flag-5'>GRACE</b> INERTIA連接器技術解析:微型化SMT解決方案的設計實踐

    新手小白必看!關于A100云主機租用,你想知道的一切都在這!

    “我想租一臺A100云主機來跑我的模型,但完全不知道從何下手。”——這是我們聽到最多的來自AI新手的聲音。A100,這個聽起來就“高大上”的名詞,背后其實是一套清晰、可操作的流程。今天,我們就用
    的頭像 發表于 10-31 19:24 ?1588次閱讀
    新手小白必看!關于<b class='flag-5'>A100</b>云主機租用,你想知道的一切<b class='flag-5'>都在</b>這!

    DGX A100服務器出故障?選對維修商,幫你省心又省錢!

    企業級GPU服務器已成為企業核心生產力的關鍵支撐。然而,這些高性能設備一旦出現故障,將對企業的業務運營造成重大影響。尤其是高端的DGXA100服務器,其復雜的技術架構和高昂的維修成本,讓許多企業在
    的頭像 發表于 10-24 19:05 ?352次閱讀
    DGX <b class='flag-5'>A100</b>服務器出故障?選對維修商,幫你省心又省錢!

    電動車GPS定位器電源芯片SL9486A性能100V/3A電流降壓IC

    電動車GPS定位器電源芯片SL9486A解析:高性能100V/3.5A降壓IC的三大優勢? 在電動車GPS定位器等車載電子設備中,電源管理芯片的穩定性和效率直接影響設備的可靠性。SL
    發表于 08-21 11:09

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?直接發個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、騰訊AI,哪個能用、好用?沒找到安裝包,都是在線搜索?想要Windows版本和IOS版本或者安卓版本
    發表于 07-09 18:30

    NVIDIA技術賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快超級計算機,其運行 HPC 和 AI 工作負載的速度是第二名的兩倍以上。
    的頭像 發表于 06-12 15:33 ?1426次閱讀

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點展示了其全新的 Grace CPU C1,并獲得多家主要原始設計制造商合作伙伴的大力支持。
    的頭像 發表于 05-22 10:01 ?793次閱讀

    SL9486A DCDC100V降壓恒壓芯片 優勢替代兼容MP9486A 國產替代

    SL9486A100V耐壓降壓恒壓電源芯片,全面升級替代MP9486A的最佳方案 在高壓電源管理領域,SL9486A憑借其卓越的性能與兼容
    發表于 04-12 10:59