国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)發(fā)布最新AI芯片H200:性能提升2倍,成本下降50%

jf_WZTOguxH ? 來(lái)源:AI前線 ? 2023-11-22 17:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

周一,半導(dǎo)體行業(yè)巨頭英偉達(dá)發(fā)布了新一代人工智能芯片 H200,旨在為各種 AI 模型提供訓(xùn)練和部署支持。

H200 芯片是目前用于訓(xùn)練最先進(jìn)的大型語(yǔ)言模型 H100 芯片的升級(jí)版,搭載了 141GB 的內(nèi)存,專(zhuān)注于執(zhí)行“推理”任務(wù)。在進(jìn)行推理或生成問(wèn)題答案時(shí),H200 的性能相比 H100 提升了 1.4 至 1.9 倍不等。

性能拉升無(wú)極限?

據(jù)英偉達(dá)官網(wǎng)消息,基于英偉達(dá)的“Hopper”架構(gòu),H200 是該公司首款采用 HBM3e 內(nèi)存的芯片。這種內(nèi)存速度更快、容量更大,使其更適用于大語(yǔ)言模型。相信過(guò)去一年來(lái)花大價(jià)錢(qián)購(gòu)買(mǎi)過(guò) Hopper H100 加速器的朋友都會(huì)為自己的沖動(dòng)而后悔。為了防止囤積了大量 H100 的客戶(hù)們當(dāng)場(chǎng)掀桿而起,英偉達(dá)似乎只有一種辦法:把配備 141 GB HBM3e 內(nèi)存 Hopper 的價(jià)格,定為 80 GB 或 96 GB HBM3 內(nèi)存版本的 1.5 到 2 倍。只有這樣,才能讓之前的“冤種”們稍微平衡一點(diǎn)。

fcab4cb4-82d4-11ee-939d-92fbcf53809c.png

下圖所示,為 H100 與 H200 在一系列 AI 推理工作負(fù)載上的相對(duì)性能比較:

fcb94800-82d4-11ee-939d-92fbcf53809c.png

可以看到,相較于 H100,H200 的性能提升最主要體現(xiàn)在大模型的推理性能表現(xiàn)上。在處理 Llama 2 等大語(yǔ)言模型時(shí),H200 的推理速度比 H100 提高了接近 2 倍。 很明顯,如果能在相同的功率范圍之內(nèi)實(shí)現(xiàn) 2 倍的性能提升,就意味著實(shí)際能耗和總體擁有成本降低了 50%。所以從理論上講,英偉達(dá)似乎可以讓 H200 GPU 的價(jià)格與 H100 持平。

fcc142da-82d4-11ee-939d-92fbcf53809c.png

得益于 Tansformer 引擎、浮點(diǎn)運(yùn)算精度的下降以及更快的 HBM3 內(nèi)存,今年起全面出貨的 H100 在 GPT-3 175B 模型的推理性能方面已經(jīng)較 A100 提升至 11 倍。而憑借更大、更快的 HBM3e 內(nèi)存,無(wú)需任何硬件或代碼變更的 H200 則直接把性能拉升至 18 倍。 哪怕是與 H100 相比,H200 的性能也提高至 1.64 倍,而這一切都純粹源自?xún)?nèi)存容量和帶寬的增長(zhǎng)。

fcd61bd8-82d4-11ee-939d-92fbcf53809c.png

想象一下,如果未來(lái)的設(shè)備擁有 512 GB HBM 內(nèi)存和 10 TB/ 秒帶寬,性能又會(huì)來(lái)到怎樣的水平?大家愿意為這款能夠全力施為的 GPU 支付多高的價(jià)錢(qián)?最終產(chǎn)品很可能要賣(mài)到 6 萬(wàn)甚至是 9 萬(wàn)美元,畢竟很多朋友已經(jīng)愿意為目前未能充分發(fā)揮潛力的產(chǎn)品掏出 3 萬(wàn)美元了。

英偉達(dá)需要順應(yīng) 大內(nèi)存的發(fā)展趨勢(shì)

出于種種技術(shù)和經(jīng)濟(jì)方面的權(quán)衡,幾十年來(lái)各種處理器在算力方面往往配置過(guò)剩,但相應(yīng)的內(nèi)存帶寬卻相對(duì)不足。實(shí)際內(nèi)存容量,往往要視設(shè)備和工作負(fù)載需求而定。

Web 基礎(chǔ)設(shè)施類(lèi)負(fù)載和那些相對(duì)簡(jiǎn)單的分析 / 數(shù)據(jù)庫(kù)工作負(fù)載大多能在擁有十幾條 DDR 內(nèi)存通道的現(xiàn)代 CPU 上運(yùn)行良好,但到了 HPC 模擬 / 建模乃至 AI 訓(xùn)練 / 推理這邊,即使是最先進(jìn) GPU 的內(nèi)存帶寬和內(nèi)存容量也相對(duì)不足,因此無(wú)法實(shí)質(zhì)性提升芯片上既有向量與矩陣引擎的利用率。于是乎,這些 GPU 只能耗費(fèi)大量時(shí)間等待數(shù)據(jù)交付,無(wú)法全力施展自身所長(zhǎng)。

所以答案就很明確了:應(yīng)該在這些芯片上放置更多內(nèi)存!但遺憾的是,高級(jí)計(jì)算引擎上的 HBM 內(nèi)存成本往往比芯片本身還要高,因此添加更多內(nèi)存自然面臨很大的阻力。特別是如果添加內(nèi)存就能讓性能翻倍,那同樣的 HPC 或 AI 應(yīng)用性能將只需要一半的設(shè)備即可達(dá)成,這樣的主意顯然沒(méi)法在董事會(huì)那邊得到支持。這種主動(dòng)壓縮利潤(rùn)的思路,恐怕只能在市場(chǎng)供過(guò)于求,三、四家廠商爭(zhēng)奪客戶(hù)預(yù)算的時(shí)候才會(huì)發(fā)生。但很明顯,現(xiàn)狀并非如此。

好在最終理性還是占據(jù)了上風(fēng),所以英特爾才推出了“Sapphire Rapids”至強(qiáng) SP 芯片變體,配備有 64 GB HBM2e 內(nèi)存。雖然每核分配到的內(nèi)存才剛剛超過(guò) 1 GB,但總和內(nèi)存帶寬卻可達(dá)到每秒 1 TB 以上。對(duì)于各類(lèi)對(duì)內(nèi)存容量要求較低的工作負(fù)載,以及主要受帶寬限制、而非容量限制的工作負(fù)載(主要體現(xiàn)在 HPC 類(lèi)應(yīng)用當(dāng)中),只需轉(zhuǎn)向 HBM2e 即可將性能提升 1.8 至 1.9 倍。于是乎,Sapphire Rapids 的 HBM 變體自然成為 1 月份產(chǎn)品發(fā)布中最受關(guān)注、也最具現(xiàn)實(shí)意義的內(nèi)容之一。英特爾還很有可能在接下來(lái)推出的“Granite Rapids”芯片中發(fā)布 HBM 變體,雖然號(hào)稱(chēng)是以多路復(fù)用器組合列(MCR)DDR5 內(nèi)存為賣(mài)點(diǎn),但這種內(nèi)存擴(kuò)容的整體思路必將成為 Granite Rapids 架構(gòu)中的重要部分。

英偉達(dá)之前在丹佛舉行的 SC23 超級(jí)計(jì)算大會(huì)上宣布推出新的“Hopper”H200 GPU 加速器,AMD 則將于 12 月 6 日發(fā)布面向數(shù)據(jù)中心的“Antares”GPU 加速器系列——包括搭載 192 GB HBM3 內(nèi)存的 Instinct MI300X,以及擁有 128 GB HBM3 內(nèi)存的 CPU-GPU 混合 MI300A。很明顯,英偉達(dá)也必須順應(yīng)這波趨勢(shì),至少也要為 Hopper GPU 配備更大的內(nèi)存。

fce14724-82d4-11ee-939d-92fbcf53809c.png

英偉達(dá)在一個(gè)月前的財(cái)務(wù)會(huì)議上放出技術(shù)路線圖時(shí),我們都知道 GH200 GPU 和 H200 GPU 加速器將成為“Blackwell”GB100 GPU 及 B100 GPU 之前的過(guò)渡性產(chǎn)品,而后者計(jì)劃在 2024 年內(nèi)發(fā)布。人們普遍認(rèn)為 H200 套件將擁有更大的內(nèi)存,但我們認(rèn)為英偉達(dá)應(yīng)該想辦法提升 GPU 引擎本身的性能。事實(shí)證明,通過(guò)擴(kuò)大 HBM 內(nèi)存并轉(zhuǎn)向速度更快的 HBM3e 內(nèi)存,英偉達(dá)完全可以在現(xiàn)有 Hopper GPU 的設(shè)計(jì)之上帶來(lái)顯著的性能提升,無(wú)需添加更多 CUDA 核心或者對(duì) GPU 超頻。 明年還有新的大冤種?

身處摩爾定律末期,在計(jì)算引擎中集成 HBM 內(nèi)存所帶來(lái)的高昂成本已經(jīng)嚴(yán)重限制了性能擴(kuò)展。英偉達(dá)和英特爾在 Sapphire Rapids 至強(qiáng) Max CPU 上都公布了相應(yīng)的統(tǒng)計(jì)數(shù)字。而無(wú)論英偉達(dá)接下來(lái)的 Blackwell B100 GPU 加速器具體表現(xiàn)如何,都基本可以斷定會(huì)帶來(lái)更強(qiáng)大的推理性能,而且這種性能提升很可能來(lái)自?xún)?nèi)存方面的突破、而非計(jì)算層面的升級(jí)。下面來(lái)看 B100 GPU 在 GPT-3 175B 參數(shù)模型上的推理能力提升:

fced9696-82d4-11ee-939d-92fbcf53809c.png

因此,從現(xiàn)在到明年夏季之間砸錢(qián)購(gòu)買(mǎi)英偉達(dá) Hopper G200 的朋友,肯定又要被再割一波“韭菜”(當(dāng)然,這也是數(shù)據(jù)中心持續(xù)發(fā)展下的常態(tài))。

最后:H200 GPU 加速器和 Grace-Hopper 超級(jí)芯片將采用更新的 Hopper GPU,配備更大、更快的內(nèi)存,且計(jì)劃于明年年中正式上市。也正因?yàn)槿绱?,我們才認(rèn)定 Blackwell B100 加速器雖然會(huì)在明年 3 月的 GTC 2024 大會(huì)上首次亮相,但實(shí)際出貨恐怕要等到 2024 年底。當(dāng)然,無(wú)論大家決定為自己的系統(tǒng)選擇哪款產(chǎn)品,最好現(xiàn)在就提交訂單,否則到時(shí)候肯定會(huì)一無(wú)所獲。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50095

    瀏覽量

    265306
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4086

    瀏覽量

    99173
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2126

    瀏覽量

    36771

原文標(biāo)題:囤H100的都成了大冤種!英偉達(dá)發(fā)布最新AI芯片H200:性能提升2倍,成本下降50%

文章出處:【微信號(hào):AI前線,微信公眾號(hào):AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    H200 解禁!預(yù)交付8萬(wàn)顆,傳阿里砸數(shù)億抄底對(duì)手

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近日,有多方消息傳出,英偉達(dá)計(jì)劃在2026年2月中旬在中國(guó)交付H200芯片,這意味著此前特朗普發(fā)文表示允許
    的頭像 發(fā)表于 12-25 09:33 ?7266次閱讀

    堪稱(chēng)史上最強(qiáng)推理芯片!英偉達(dá)發(fā)布 Rubin CPX,實(shí)現(xiàn)50ROI

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)近日,英偉達(dá)AI infra峰會(huì)上發(fā)布了專(zhuān)為大規(guī)模上下文推理設(shè)計(jì)的全新GPU系列Rubin CPX,性能堪稱(chēng)
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱(chēng)史上最強(qiáng)推理<b class='flag-5'>芯片</b>!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>發(fā)布</b> Rubin CPX,實(shí)現(xiàn)<b class='flag-5'>50</b><b class='flag-5'>倍</b>ROI

    H200解禁了個(gè)寂寞?2個(gè)月0銷(xiāo)售,審查層層加碼!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)“解禁”2個(gè)月,0銷(xiāo)量?近日美國(guó)商務(wù)部出口執(zhí)法助理部長(zhǎng)David Peters透露,目前英偉達(dá)H200芯片獲批
    的頭像 發(fā)表于 02-26 09:24 ?2326次閱讀

    美國(guó)政府正式批準(zhǔn)英偉達(dá)H200芯片對(duì)華出口

    1月13日,美國(guó)正式放行英偉達(dá)面向中國(guó)的第二強(qiáng)人工智能芯片H200出口,在華盛頓對(duì)華強(qiáng)硬派的強(qiáng)烈憂慮聲中,為這款芯片對(duì)華出貨打開(kāi)通道。
    的頭像 發(fā)表于 01-16 16:11 ?654次閱讀

    再加25%關(guān)稅!鎖定對(duì)華AI芯片,點(diǎn)名英偉達(dá)、AMD

    電子發(fā)燒友網(wǎng)綜合報(bào)道,1月14日,美國(guó)總統(tǒng)特朗普簽署行政令,宣布對(duì)部分先進(jìn)人工智能(AI芯片及衍生產(chǎn)品加征25%的從價(jià)關(guān)稅。以“國(guó)家安全”為名,加速重構(gòu)其芯片產(chǎn)業(yè)政策。在公告中明確提到A英偉
    的頭像 發(fā)表于 01-16 09:20 ?1504次閱讀
    再加25%關(guān)稅!鎖定對(duì)華<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,點(diǎn)名<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>、AMD

    美國(guó)將允許英偉達(dá)H200對(duì)華出口,但要抽成25%

    。 ? 據(jù)《紐約時(shí)報(bào)》信息,H200芯片目前為英偉達(dá)性能第二強(qiáng)”的芯片,特朗普方面表示,美國(guó)商
    的頭像 發(fā)表于 12-10 11:07 ?1122次閱讀

    突發(fā)!特朗普批準(zhǔn)英偉達(dá)H200芯片對(duì)華出口,抽成25%

    一種“妥協(xié)”。此前,英偉達(dá)一直希望向中國(guó)銷(xiāo)售其更先進(jìn)的Blackwell系列芯片,但美政府目前仍明確表示不贊成。H200芯片
    的頭像 發(fā)表于 12-09 17:58 ?1591次閱讀

    今日看點(diǎn):特朗普允許英偉達(dá)對(duì)華出口H200芯片,但要抽成25%;眾擎完成 A1+ 輪與 A2 輪融資

    特朗普允許英偉達(dá)對(duì)華出口H200芯片,但要抽成25% 12月8日,美國(guó)總統(tǒng)特朗普宣布,將允許英偉達(dá)
    發(fā)表于 12-09 11:00 ?1074次閱讀

    亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4

    Trainium 4的開(kāi)發(fā)計(jì)劃。亞馬遜表示,這款芯片能夠比英偉達(dá)市場(chǎng)領(lǐng)先的圖形處理單元(GPU)更便宜、更高效地驅(qū)動(dòng)AI模型背后的密集計(jì)算。 ? ? 作為亞馬遜首款3納米工藝
    的頭像 發(fā)表于 12-09 08:37 ?8558次閱讀
    亞馬遜<b class='flag-5'>發(fā)布</b>新一代<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>Trainium3,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    今日看點(diǎn):馬斯克:特斯拉已部署超百萬(wàn)顆 AI 芯片;長(zhǎng)鑫存儲(chǔ)發(fā)布全新 DDR5 內(nèi)存新品

    美國(guó)考慮允許英偉達(dá)對(duì)華出售H200芯片 ? 據(jù)外媒報(bào)道,特朗普政府正考慮批準(zhǔn)向中國(guó)出口美國(guó)芯片制造商英偉
    發(fā)表于 11-24 11:10 ?915次閱讀

    英偉達(dá) Q3 狂攬 308 億

    廠商季度合計(jì) 500 億美元資本支出中,約 30% 流向了英偉達(dá)。 新一代 Blackwell 芯片已全面投產(chǎn),Q3 交付 1.3 萬(wàn)個(gè) GPU 樣品,H200 GPU 理論
    的頭像 發(fā)表于 11-20 18:11 ?1246次閱讀

    英偉達(dá)被傳暫停生產(chǎn)H20芯片 外交部回應(yīng)

    韓國(guó)三星電子、美國(guó)安靠科技、富士康等關(guān)鍵零部件供應(yīng)商。 據(jù)悉,美國(guó)安靠科技(Amkor)負(fù)責(zé)H20芯片的封裝,而三星電子負(fù)責(zé)提供高帶寬的內(nèi)存芯片。 業(yè)界人士分析稱(chēng),一方面英偉
    的頭像 發(fā)表于 08-22 15:58 ?2828次閱讀

    特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元

    是“中國(guó)特供版”人工智能芯片;是英偉達(dá)公司為符合美國(guó)出口規(guī)定專(zhuān)門(mén)為中國(guó)市場(chǎng)開(kāi)發(fā)的定制芯片,H20芯片
    的頭像 發(fā)表于 04-16 16:59 ?2084次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動(dòng)化效率

    解決方案在英偉達(dá) GPU和英偉達(dá) CUDA-X庫(kù)上所實(shí)現(xiàn)的加速 基于英偉達(dá) GB
    發(fā)表于 03-19 17:59 ?493次閱讀