国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不只是GPU,內(nèi)存廠商們的AI野望

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2023-09-01 00:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)在諸多云服務(wù)廠商或互聯(lián)網(wǎng)廠商一頭扎進GPU的瘋搶潮后,不少公司也發(fā)現(xiàn)了限制AI大模型性能或是成本消耗的除了GPU以外,還有內(nèi)存。內(nèi)存墻作為橫亙在AI計算和HPC更進一步的阻礙之一,在計算量井噴的今天,已經(jīng)變得愈發(fā)難以忽視。所以,在今年的HotChips大會上,內(nèi)存廠商們也競相展示自己的內(nèi)存技術(shù)在AI計算上的優(yōu)勢。

三星

三星作為最早一批開始跟進存內(nèi)計算的公司,早在兩年前的HotChips33上,就展示了HBM2-PIM的技術(shù)Aquabolt-XL。三星在去年底展示了用PIM內(nèi)存和96個AMD Instinct MI100 GPU組建的大規(guī)模計算系統(tǒng),并宣稱這一配置將AI訓練的速度提高了近2.5倍。

而今年的HotChips上,三星也著重點明了PIM和PNM技術(shù)在生成式AI這類熱門應(yīng)用上的優(yōu)勢。三星認為在ChatGPT、GPT-3之類的應(yīng)用中,主要瓶頸出現(xiàn)在生成階段的線性層上,這是因為GPU受到了內(nèi)存限制且整個過程是線性順序進行的。

在三星對GPT的分析中,其主要由概括和生成兩大負載組成,其中概括考驗的是計算單元的性能,而生成則考驗的是內(nèi)存的性能。而生成占據(jù)了絕大多數(shù)的運算次數(shù)和耗時,其中占據(jù)了60%到80%延遲的GEMV(矩陣向量操作)也就成了三星試圖用PIM和PNM攻克的目標。

根據(jù)三星的說法,像GPT這類Transformer架構(gòu)的模型,都可以將多頭注意力(MHA)和前饋神經(jīng)網(wǎng)絡(luò)(FFN)完全交給PIM或PNM,完全利用他們的所有帶寬,從而減少在推理上所花費的時間和能耗。三星也在單個AMD MI100-PIM的GPU上進行了試驗,得出運行GPT模型時,在HBM-PIM的輔助下,能效是GPU搭配傳統(tǒng)HBM的兩倍,性能同樣提升至兩倍以上。

wKgZomTwaRqAN2Y0AAEQ1l7kLeE723.jpg
LPDDR-PIM概念 / 三星

除了HBM-PIM外,這次三星還展示了最新的LPPDR-PIM概念。除了云端生成式AI需要存內(nèi)計算的輔助外,諸如智能手機這樣的端側(cè)生成式AI概念也被炒起來,所以LPPDR-PIM這樣的存內(nèi)計算技術(shù),可以進一步保證續(xù)航的同時,也不會出現(xiàn)為了帶寬內(nèi)存使用超量的情況。

SK海力士

另一大韓國內(nèi)存巨頭SK海力士也沒有閑著,在本次HotChips大會上,他們展示了自己的AiM存內(nèi)加速器方案。相較三星而言,他們?yōu)樯墒紸I的推理負載準備的是基于GDDR6的存內(nèi)計算方案。

GDDR6-AiM采用了1y的制造工藝,具備512GB/s內(nèi)部帶寬的同時,也具備32GB/s的外部帶寬。且GDDR6-AiM具備頻率高達1GHz的處理單元,算力可達512GFLOPS。GDDR6-AiM的出現(xiàn),為存內(nèi)進行GEMV計算提供了端到端的加速方案,比如乘法累加和激活函數(shù)等操作都可以在內(nèi)存bank內(nèi)同時進行,單條指令實現(xiàn)全bank操作提供更高的計算效率。

同時,SK海力士也已經(jīng)考慮到了AiM的擴展性問題,比如單個AiM卡中集成了8個AiM封裝,也就是8GB的容量和256個處理單元。但這類擴展方案最大的問題還是在軟件映射、硬件架構(gòu)和接口上,這也是絕大多數(shù)集成存內(nèi)計算的新式內(nèi)存面臨的問題。

wKgaomTwaSaAfbrEAAGKrRvOuwQ093.jpg
AiM系統(tǒng)擴展性驗證Demo / SK海力士


而SK海力士已經(jīng)給出了這方面的解決方案,比如專門針對AiM的Tiling、基于AiM架構(gòu)的控制器、路由和ALU等等。他們還展示了在兩個FPGA上結(jié)合GDDR6-AiM的Demo,以及用于LLM推理的軟件棧。與此同時,他們也還在探索AiM的下一代設(shè)計,比如如何實現(xiàn)更高的內(nèi)存容量,用于應(yīng)對更加龐大的模型。

寫在最后

無論是三星還是SK海力士都已經(jīng)在存內(nèi)計算領(lǐng)域耕耘多年,此次AI熱來勢洶洶,也令他們研發(fā)速度進一步提快。畢竟如今能夠解決大模型訓練與推理的耗時與TCO的硬件持續(xù)大賣,如果存內(nèi)計算產(chǎn)品商業(yè)化量產(chǎn)落地進展順利,且確實能為AI計算帶來助力的話,很可能會小幅提振如今略微萎縮的內(nèi)存市場。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135453
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    南亞科技3D堆疊AI內(nèi)存UltraWIO技術(shù)

    UltraWIO(Ultra Wide I/O,超寬輸入輸出介面)架構(gòu)內(nèi)存。該架構(gòu)并非JEDEC標準的DRAM產(chǎn)品,而是與客戶的AI運算引擎(AI Engine)緊密整合的客制化方案。其概念類似于高帶寬
    的頭像 發(fā)表于 03-06 14:10 ?365次閱讀

    Fluke 773毫安鉗形表讓暖通自控調(diào)試效率翻倍

    不只是個鉗表,更是為你量身定制的集成式診斷平臺,專治各種暖通空調(diào)與樓宇自控系統(tǒng)“疑難雜癥”。
    的頭像 發(fā)表于 02-28 09:38 ?418次閱讀

    世強硬創(chuàng)車規(guī)級視覺方案賦能機器人突破技術(shù)難題

    當這樣的基因被注入機器人視覺,帶來的不只是參數(shù)的提升,更是從可用到可信的跨越。它不只是一顆攝像頭,而是一套完整的視覺引擎。
    的頭像 發(fā)表于 02-04 17:24 ?1132次閱讀

    恩智浦MCX N系列MCU在數(shù)據(jù)中心和AI服務(wù)器領(lǐng)域表現(xiàn)優(yōu)異

    AI技術(shù)逐漸融入我們生活的每個角落,它正以潛移默化的方式重塑整個時代。我們見證著AI帶來的突破,如模型創(chuàng)新、應(yīng)用場景的演進,但隨著AI發(fā)展進入深水區(qū),真正決定其發(fā)展規(guī)模潛力的,早已不只是
    的頭像 發(fā)表于 01-26 09:22 ?1834次閱讀
    恩智浦MCX N系列MCU在數(shù)據(jù)中心和<b class='flag-5'>AI</b>服務(wù)器領(lǐng)域表現(xiàn)優(yōu)異

    為啥 AI 計算速度這么驚人?—— 聊聊 GPU內(nèi)存與并行計算

    提到AI,大家常說它“算得快”,其實是指AI能在眨眼間處理海量數(shù)據(jù)。可它為啥有這本事?答案就藏在“GPU+高速內(nèi)存+并行計算”這trio(組合)里。咱們可以把
    的頭像 發(fā)表于 12-05 14:35 ?854次閱讀
    為啥 <b class='flag-5'>AI</b> 計算速度這么驚人?—— 聊聊 <b class='flag-5'>GPU</b>、<b class='flag-5'>內(nèi)存</b>與并行計算

    不只是備用電池!讀懂UPS工作原理,才知道如何保護貴重電器。

    UPS
    上海優(yōu)比施電子科技有限公司
    發(fā)布于 :2025年11月25日 09:08:12

    淺談研華iEMS.AI Agent能源智能體管理平臺

    近日,研華 iEMS.AI Agent能源智能體專題直播圓滿落幕!這場聚焦工業(yè)級智能升級的分享,帶大家解鎖了 AI 驅(qū)動的全新可能 —— 它不只是一套能碳AI管理工具,更是一個具備強大
    的頭像 發(fā)表于 11-24 15:31 ?755次閱讀
    淺談研華iEMS.<b class='flag-5'>AI</b> Agent能源智能體管理平臺

    開創(chuàng)視覺方案新范式!INDEMIND四目空間智能方案讓導航從追求“精準”邁向“智能協(xié)同”

    導航的終點,不只是“精準移動”,而是空間理解與決策。
    的頭像 發(fā)表于 11-07 17:09 ?2303次閱讀
    開創(chuàng)視覺方案新范式!INDEMIND四目空間智能方案讓導航從追求“精準”邁向“智能協(xié)同”

    儲能,不只是存電那么簡單

    一、到底啥是儲能? 一句話概括:儲能,就是把能量先存起來,等到需要的時候再拿出來用的技術(shù)。 您可以把它想象成一個超級“能量銀行”或“能量充電寶”。 充電(儲存能量):當能量充足、便宜甚至免費時(比如陽光明媚、風力強勁的白天,或者深夜用電低谷期),把多余的電能或其他形式的能量儲存起來。 放電(釋放能量):當能量短缺、昂貴或急需時(比如陰天無風、夜晚用電高峰期,或者突然停電),把儲存的能量釋放出來使用。 這個
    的頭像 發(fā)表于 11-06 16:49 ?1317次閱讀
    儲能,<b class='flag-5'>不只是</b>存電那么簡單

    《哪吒2》與國產(chǎn)超高清標準突圍

    這已經(jīng)不只是技術(shù)的一小步,而是中國影像標準走向更廣闊市場的一次切實嘗試
    的頭像 發(fā)表于 10-29 16:08 ?1667次閱讀
    《哪吒2》與國產(chǎn)超高清標準突圍

    設(shè)備突然停機虧哭?智能系統(tǒng)實時監(jiān)測 + AI 預(yù)警,把故障掐在萌芽里

    過去設(shè)備管理是 “人跟著設(shè)備轉(zhuǎn)”,現(xiàn)在靠智能系統(tǒng) “系統(tǒng)跟著數(shù)據(jù)轉(zhuǎn)”—— 實時監(jiān)測讓異常無處藏,AI 預(yù)警讓故障不突襲。對企業(yè)來說,省下的不只是維修費,更是寶貴的生產(chǎn)時間。
    的頭像 發(fā)表于 10-09 10:39 ?368次閱讀
    設(shè)備突然停機虧哭?智能系統(tǒng)實時監(jiān)測 + <b class='flag-5'>AI</b> 預(yù)警,把故障掐在萌芽里

    科普:什么AI 內(nèi)存技術(shù)

    問題。 為什么 AI 內(nèi)存很重要? 在 AI 模型訓練和推理過程中,大量的數(shù)據(jù)需要從內(nèi)存傳輸?shù)教幚砥鳎ㄈ?GPU 或 TPU)進行計算。傳統(tǒng)
    的頭像 發(fā)表于 09-03 15:44 ?1395次閱讀

    一顆 M12,見工業(yè)人心:從選型到價值的思考

    一個小小的 M12,可能只是機器上的一個零件,但它承擔著數(shù)據(jù)、信號、動力的流通。 工程師的責任,不只是把它做對,更是讓它在各種環(huán)境里都能“活得長久”。 這背后,不只是技術(shù),還有對客戶、對產(chǎn)業(yè)、對社會的那份責任。
    的頭像 發(fā)表于 08-12 15:34 ?711次閱讀
    一顆 M12,見工業(yè)人心:從選型到價值的思考

    AI的未來,屬于那些既能寫代碼,又能焊電路的“雙棲人才”

    工程師”的每一步我們相信,未來的AI系統(tǒng),不只是云端模型的勝利,更是每一個工程細節(jié)的勝利。每一個能調(diào)硬件、懂系統(tǒng)、會部署的工程師,都是這個AI時代的“產(chǎn)品設(shè)計師”。AI的未來,屬于那些
    發(fā)表于 07-30 16:15

    既是工具人也是情緒搭子,INDEMIND助力打造陪伴機器人新范式!

    陪伴機器人,不只是玩具!
    的頭像 發(fā)表于 06-20 16:39 ?508次閱讀