国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

揭秘:英偉達H100最強替代者

智能計算芯世界 ? 來源:半導體行業觀察 ? 2023-11-13 16:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在撰寫本文時,NVIDIA H100 80GB PCIe 在 CDW 等在線零售商處的售價為 3.2 萬美元,并且缺貨了大約六個月。可以理解的是,NVIDIA 的高端(幾乎)萬能 GPU 的價格非常高,需求也是如此。NVIDIA 為許多人工智能用戶和那些在企業中運行混合工作負載的用戶提供了一種替代方案,但這種方案并不引人注目,但這是非常好的。NVIDIA L40S 是面向圖形的 L40 的變體,本文一起深入了解。

NVIDIA A100、NVIDIA L40S 和 NVIDIA H100

首先,我們首先要說的是,如果您現在想要訓練基礎模型(例如 ChatGPT),那么 NVIDIA H100 80GB SXM5 仍然是首選 GPU。一旦基礎模型經過訓練,通常可以在成本和功耗顯著降低的部件上根據特定領域的數據或推理來定制模型。

目前,用于高端推理的 GPU 主要有三種:NVIDIA A100、NVIDIA H100 和新的 NVIDIA L40S。我們將跳過NVIDIA L4 24GB,因為它更像是低端推理卡。

NVIDIA A100 和 H100 型號基于該公司各自代的旗艦 GPU。由于我們討論的是 PCIe 而不是 SXM 模塊,因此外形尺寸之間兩個最顯著的差異是 NVLink 和功耗。SXM 模塊專為更高功耗而設計(大約是 PCIe 版本的兩倍),并通過 NVLink 和多 GPU 組件中的 NVSwitch 拓撲進行互連。

NVIDIA A100 PCIe于 2020 年以 40GB 型號推出,然后在 2021 年中期,該公司將產品更新為A100 80GB PCIe 附加卡。多年后,這些卡仍然很受歡迎。

NVIDIA H100 PCIe是專為主流服務器設計的低功耗 H100。考慮 PCIe 卡的一種方法是,在電壓/頻率曲線的不同部分運行相似數量的芯片,旨在降低性能,但功耗也低得多。

即使在 H100 系列內也存在一些差異。NVIDIA H100 PCIe 仍然是 H100,但在 PCIe 外形規格中,它降低了性能、功耗和一些互連(例如 NVLink 速度)。

7e56ff88-81c2-11ee-939d-92fbcf53809c.png

L40S 則完全不同。NVIDIA 采用了基礎 L40(一款使用 NVIDIA 最新 Ada Lovelace 架構的數據中心可視化 GPU),并更改了調整,使其更多地針對 AI 而不是可視化進行調整。

NVIDIA L40S 是一款令人著迷的 GPU,因為它保留了 L40 的光線追蹤核心和 DisplayPort 輸出以及支持 AV1 的 NVENC / NVDEC 等功能。與此同時,NVIDIA 將更多的功率用于驅動 GPU 人工智能部分的時鐘

我們將其放在圖表上以便更容易可視化。NVIDIA 的規格有時甚至會根據 NVIDIA 來源單一視圖而有所不同,因此這是我們能找到的最好的規格,如果我們獲得規格更新,我們將對其進行更新。我們還包括雙卡H100 NVL,它有兩個增強型 H100,它們之間有一個 NVLink 橋,因此將其視為雙卡解決方案,而其余的都是單卡。

7ed15512-81c2-11ee-939d-92fbcf53809c.png

與 L40 相比,L40S 是一款在人工智能訓練和推理方面大幅改進的卡,但人們可以很容易地看到共同的傳統。

如果您需要絕對的內存容量、帶寬或 FP64 性能,則 L40 和 L40S 不適合。鑒于目前 AI 工作負載取代傳統 FP64 計算的相對份額,大多數人都會接受這種權衡。

L40S 的內存看起來可能比 NVIDIA A100 少得多,而且物理上確實如此,但這并不是故事的全部。NVIDIA L40S 支持NVIDIA Transformer Engine和 FP8。使用 FP8 可以極大地減小數據大小,因此,與 FP16 值相比,FP8 值可以使用更少的內存,并且需要更少的內存帶寬來移動。NVIDIA 正在推動 Transformer Engine,因為 H100 也支持它,有助于降低其 AI 部件的成本或提高其性能。

7f060334-81c2-11ee-939d-92fbcf53809c.png

L40S 有一組更注重可視化的視頻編碼/解碼,而 H100 則專注于解碼方面。

NVIDIA H100 速度更快。它還花費更多。從某種意義上說,在我們撰寫本文時,在列出公開價格的 CDW 上,H100 的價格約為 L40S 價格的 2.6 倍。

另一個重要問題是可用性。如今,獲得 NVIDIA L40S 比排隊等待 NVIDIA H100 快得多。

秘密在于,在 AI 硬件方面取得領先的一種新的常見方法是不使用 H100 進行模型定制和推理。相反,我們又回到了我們多年前介紹過的熟悉的架構,即密集 PCIe 服務器。2017 年,當我們進行DeepLearning11 時,將 NVIDIA GeForce GTX 1080 Ti 塞進服務器中的 10 倍 NVIDIA GTX 1080 Ti 單根深度學習服務器甚至是大公司(例如世界某些地區的搜索/網絡超大規模企業)的首選架構駕駛公司。

NVIDIA 更改了其 EULA,禁止此類配置,并且使其軟件更加關注用于 AI 推理和訓練的數據中心部分,因此現在情況有所不同。

到 2023 年,考慮同樣的概念,但采用 NVIDIA L40S 技術(并且沒有服務器“humping”。)

通過購買 L40S 服務器并獲得比使用 H100 更低成本的 GPU,人們可以獲得類似的性能,而且價格可能更低。

NVIDIA L40S 與 H100 的其他考慮因素

L40S 還有其他幾個方面需要考慮。一是它支持NVIDIA Virtual GPU vGPU 16.1,而 H100 仍然只支持 vGPU 15。NVIDIA 正在將其 AI 芯片從 vGPU 支持方面進行一些拆分。

7fa385b4-81c2-11ee-939d-92fbcf53809c.png

對于那些想要部署一種 GPU 機器然后能夠運行不同類型的工作負載的人來說,像 L40S 這樣的東西是有意義的。鑒于其可視化根源,它還擁有支持 AV1 和 RT 內核的 NVIDIA 視頻編碼引擎。

L40S 不支持一項功能,那就是 MIG。我們之前已經研究過 MIG,但它允許將 H100 分成最多 7 個不同大小的分區。這對于在公共云中拆分 H100 GPU 非常有用,以便可以在客戶之間共享 GPU 資源。對于企業來說,這通常是一個較低興奮度的功能。

此外,部署 L40S 的功耗較低,僅為 SXM5 系統功耗的一半。這對于那些想要橫向擴展但每個機架可能沒有大量電力預算的人來說非常有吸引力。

最重要的是,L40S 的速度不如 H100,但憑借 NVIDIA 的 FP8 和 Transformer Engine 支持,對于許多人來說,它比 H100 更可用、更容易部署,而且通常價格更低。

最后的話

關于 NVIDIA H100 PCIe 與 L40S 以及為什么人們會使用任一版本,目前有很多非常糟糕的信息。希望這有助于在更大程度上澄清這一點。對我們來說,L40S 并不便宜,但它讓我們想起 6 多年前,當時人工智能領域的做法是在服務器中使用成本較低的 NVIDIA GPU,然后使用更多的 GPU。NVIDIA 再次推出該型號,使用 L40S 和官方認可的架構,支持多達數千個GPU。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109719
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135431
  • 英偉達
    +關注

    關注

    23

    文章

    4086

    瀏覽量

    99169

原文標題:揭秘:英偉達H100最強替代者

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英偉達官宣H20恢復中國供應,新款GPU震撼來襲

    電子發燒友原創 章鷹 今天,命運多舛的英偉H20芯片迎來了新轉機。4月,美國政府決定禁止英偉向中國市場銷售
    的頭像 發表于 07-16 02:01 ?9789次閱讀
    <b class='flag-5'>英偉</b>達官宣<b class='flag-5'>H</b>20恢復中國供應,新款GPU震撼來襲

    突發!特朗普批準英偉H200芯片對華出口,抽成25%

    據最新消息,美國總統特朗普已批準英偉向中國出口其H200人工智能芯片,但要求從銷售額中抽取25%作為分成。這意味著英偉在游說美國政府放寬
    的頭像 發表于 12-09 17:58 ?1591次閱讀

    英偉 Q3 狂攬 308 億

    廠商季度合計 500 億美元資本支出中,約 30% 流向了英偉。 新一代 Blackwell 芯片已全面投產,Q3 交付 1.3 萬個 GPU 樣品,H200 GPU 理論性能較 H100
    的頭像 發表于 11-20 18:11 ?1244次閱讀

    英偉 H100 GPU 掉卡?做好這五點,讓算力穩如泰山!

    H100服務器停工一天損失的算力成本可能比維修費還高。今天,我們給大家總結一套“防掉卡秘籍”,從日常管理到環境把控,手把手教你把掉卡風險壓到最低。一、供電是“生命線”,這3點必須盯緊H100滿載功耗
    的頭像 發表于 09-05 11:03 ?1149次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b> <b class='flag-5'>H100</b> GPU 掉卡?做好這五點,讓算力穩如泰山!

    英偉被傳暫停生產H20芯片 外交部回應

    據外媒《the Information》在當地時間的8月21日下午爆料稱,英偉可能已經暫停生產H20芯片。據稱,英偉已正式下達指示給到供
    的頭像 發表于 08-22 15:58 ?2825次閱讀

    搞定英偉 H100 ECC 報錯:從原理到維修,一步到位解煩憂

    最近,捷智算GPU維修室收到了不少H100服務器需要維修,故障問題集中為ECC報錯。為了幫大家更好地認識和了解情況,下面就詳細分享一下ECC報錯系統化排查方法和維修流程。一、ECC報錯
    的頭像 發表于 08-14 18:05 ?2229次閱讀
    搞定<b class='flag-5'>英偉</b><b class='flag-5'>達</b> <b class='flag-5'>H100</b> ECC 報錯:從原理到維修,一步到位解煩憂

    國家網信辦約談英偉

    用戶網絡安全、數據安全,依據《網絡安全法》《數據安全法》《個人信息保護法》有關規定,國家互聯網信息辦公室于2025年7月31日約談了英偉公司,要求英偉公司就對華銷售的
    的頭像 發表于 07-31 13:56 ?2706次閱讀
    國家網信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達</b>

    H20中國區賣爆!英偉緊急向臺積電加訂30萬塊

    ,性能上相當于英偉另一款主流GPU芯片H100的20%左右。 ? 盡管如此,在美國解禁對H20芯片的出口后,需求仍然超出了想象。據路透社報道,中國市場的需求比預想中藥強勁得多。因此
    的頭像 發表于 07-30 08:08 ?3304次閱讀

    英偉獲美批準恢復H20在華銷售,同步推出全新兼容GPU

    7月15日上午,央廣財經記者從英偉方面確認,英偉已經獲得美國批準,將恢復 H20 在中國的銷售,并推出面向中國市場的全新且完全兼容的 G
    的頭像 發表于 07-16 17:49 ?812次閱讀

    中方回應英偉將對華銷售H20芯片 反對將科技和經貿問題政治化

    對于英偉將對華銷售H20芯片我們怎么回應的?來看看外交部發言人的表述。 在15日的例行記者會上,有記者就英偉黃仁勛表示
    的頭像 發表于 07-15 16:22 ?2201次閱讀

    英偉黃仁勛:將向中國市場銷售H20芯片 中國市場至關重要

    英偉CEO黃仁勛在北京訪問期間發表聲明稱,將恢復在中國銷售其H20 GPU芯片,并根據美國出口限制為中國市場推出一款新的GPU。英偉
    的頭像 發表于 07-15 14:32 ?1296次閱讀

    GPU 維修干貨 | 英偉 GPU H100 常見故障有哪些?

    ABSTRACT摘要本文主要介紹英偉H100常見的故障類型和問題。JAEALOT2025年5月5日今年,國家政府報告提出要持續推進“人工智能+”行動,大力發展人工智能行業,市場上對算力的需求持續
    的頭像 發表于 05-05 09:03 ?2989次閱讀
    GPU 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達</b> GPU <b class='flag-5'>H100</b> 常見故障有哪些?

    美國限制英偉向華出售H20芯片

    出口H20芯片,以及任何其他性能達到H20內存帶寬、互連帶寬或其組合的芯片,都必須獲得出口許可。 公告披露,美國政府稱,這旨在解決相關產品可能被用于或被轉用于中國超級計算機的風險。4月14日,美國政府通知英偉
    的頭像 發表于 04-16 17:28 ?1035次閱讀

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉公司為符合美國出口規定專門為中國市場開發的定制芯片,H20芯片在訓練AI模型方面不如英偉其他芯片速度
    的頭像 發表于 04-16 16:59 ?2083次閱讀