国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

什么是AI芯片“存儲墻”的解決方案?

SSDFans ? 來源:yxw ? 2019-06-18 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近剛剛看了唐杉博士的《AI芯片的“冷”與“熱”》,第一句就是“ 參加過去年硅谷的AI Hardware Summit的朋友,普遍反映這次在北京的會議沒有那么火了”。記得,自己在2016年威海參加中國體系結構年會的時候,孫所也說了一句調(diào)侃的話:“現(xiàn)在的AI很火,大家都往那邊去,沒有人太關心體系結構了,我要告訴那些追AI熱點的,它都死了三回了!” 的確,作為從小學馬列的中國人,我們最熟悉螺旋式上升的概念。對于計算和I/O來講,和中國經(jīng)濟調(diào)控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發(fā)布了TPU V1之后,現(xiàn)在已經(jīng)有越來越多的AI startup的芯片出現(xiàn),大家基本上都是用標準的Resnet50,Googlenetv3 等網(wǎng)絡為benchmark, 一次一次地刷新性能和功耗比,個人覺得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務上超過人腦,現(xiàn)在AI在準確率和性能上都超過了。對于AI的芯片來講,有一個指標也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來FLOP/s來表示,現(xiàn)在新出的AI ASIC往往在FLOP/s并不發(fā)力,因為從功耗比的角度上,算力肯定不是越高越好,而且大家都很難高過老黃的核彈。

代表了一個特定的計算平臺的peak performance,就是最大算力。

就是特定的計算平臺的I內(nèi)存/O帶寬,這個和該計算平臺使用的DDR類型有關。

X軸是I,代表計算強度,就是在一個Byte上的計算量。因為對于一個特定的平臺,我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計算強度。

因此,和圖上顯示的一樣,在點(Imax,),這個計算平臺達到了完美。在它的左邊,說明memory受限,在它的右邊說明計算受限。

因為對于每一次訪存都是32位的Float Point,因此整個內(nèi)存的占用就是 260MB左右,而計算量是724MFLOPs,因此Alexnet的計算強度就是724/260=2.7 operation/byte。

對于一個特定的平臺,比如老黃家的新的GTX2080Ti 系列來講:

對于計算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來講,他是100TLOP/s,

它的內(nèi)存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個,就可以看出,對于Alex的2.7 來講,遠遠沒有達到2080ti的計算強度,主要是受限于內(nèi)存帶寬了。

在Google的TPU中,有一個圖經(jīng)常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒有什么網(wǎng)絡可以完全用滿TPU的peak performance。

怎么辦,內(nèi)存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認為目前應該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計算應該是下一個方向。

這個就引出了在Memory+會議上來自平頭哥的段立德博士的topic,”Processing Near or In memory for deep learning".

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54010

    瀏覽量

    466166
  • 存儲
    +關注

    關注

    13

    文章

    4791

    瀏覽量

    90066
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301454
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何突破AI存儲?深度解析ONFI 6.0高速接口與Chiplet解耦架構

    1. 行業(yè)核心痛點:AI存儲”危機在大模型訓練與推理場景中,算力演進速度遠超存儲帶寬,計算與存儲之間的性能鴻溝(
    發(fā)表于 01-29 17:32

    國內(nèi)分布式AI存儲方案商港股IPO!

    據(jù)港交所1月27日披露,北京星辰天合科技股份有限公司(簡稱“星辰天合”)向港交所主板遞交上市申請書。 ? 星辰天合專注于提供企業(yè)級AI存儲解決方案,助力企業(yè)大規(guī)模高效整合數(shù)據(jù)、決策及運營。兩類主要
    的頭像 發(fā)表于 01-29 13:44 ?7770次閱讀
    國內(nèi)分布式<b class='flag-5'>AI</b><b class='flag-5'>存儲</b><b class='flag-5'>方案</b>商港股IPO!

    推薦高性能存儲psram芯片

    智能穿戴、物聯(lián)網(wǎng)設備和端側AI應用快速發(fā)展,PSRAM偽靜態(tài)隨機存儲器,正成為越來越多嵌入式系統(tǒng)的優(yōu)選方案,如何選擇一個高性能、小尺寸與低功耗的psram芯片是一個值得思考的問題。由E
    的頭像 發(fā)表于 11-18 17:24 ?476次閱讀

    VS680 HDMI AI分析解決方案 #目標識別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導體
    發(fā)布于 :2025年11月12日 10:29:33

    雷軍都喊貴!存儲芯片漲價風暴,手機電腦集體漲價#芯片#存儲芯片#AI

    存儲芯片
    jf_15747056
    發(fā)布于 :2025年10月28日 19:07:52

    佰維存儲AI時代的存儲解決方案

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)在GMIF2025大會上,佰維存儲CEO何瀚表示,端側AI存儲的尺寸和功耗有著更為極致的要求。隨著在端側部署更大參數(shù)規(guī)模的AI模型成為趨勢,需要更大容量
    的頭像 發(fā)表于 09-30 08:40 ?1.2w次閱讀
    佰維<b class='flag-5'>存儲</b>:<b class='flag-5'>AI</b>時代的<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    AI 芯片浪潮下,職場晉升新契機?

    、新架構不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動 AI 芯片性能、功耗、成本等關鍵指標的優(yōu)化,將極大提升在職稱評審中的競爭力。例如,在芯片設計中引入新的計算范式,如存算一體技術
    發(fā)表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    :科技探索與 AGI 愿景》。 這本新書針對大模型技術浪潮,詳細講解了AI芯片的主流技術、挑戰(zhàn)與創(chuàng)新解決方案,并介紹了下一代芯片工藝和顛覆性AI
    發(fā)表于 07-28 13:54

    XMOS基于邊緣AI+DSP+MCU+I/O智算芯片的音頻解決方案矩陣引領行業(yè)創(chuàng)新潮流

    XMOS作為全球領先的數(shù)字音頻及多媒體AI處理芯片解決方案提供商,與自己的技術伙伴及生態(tài)伙伴一起,攜一系列重量級的由邊緣AI技術驅動的音頻技術解決
    的頭像 發(fā)表于 06-19 17:26 ?1033次閱讀
    XMOS基于邊緣<b class='flag-5'>AI</b>+DSP+MCU+I/O智算<b class='flag-5'>芯片</b>的音頻<b class='flag-5'>解決方案</b>矩陣引領行業(yè)創(chuàng)新潮流

    佰維存儲亮相COMPUTEX 2025,全場景存儲方案賦能“AI +”未來生態(tài)

    近日,臺北國際電腦展(COMPUTEX 2025)以“AI NEXT”為主題啟幕,作為領先的存儲與內(nèi)存解決方案廠商,佰維存儲展示了其涵蓋消費級、嵌入式
    的頭像 發(fā)表于 05-26 09:43 ?1205次閱讀
    佰維<b class='flag-5'>存儲</b>亮相COMPUTEX 2025,全場景<b class='flag-5'>存儲</b><b class='flag-5'>方案</b>賦能“<b class='flag-5'>AI</b> +”未來生態(tài)

    華為加速AI時代數(shù)據(jù)存儲產(chǎn)業(yè)發(fā)展

    近日,在華為中國合作伙伴大會2025上,華為數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰發(fā)表“共筑數(shù)智解決方案,共享數(shù)據(jù)存儲產(chǎn)業(yè)大發(fā)展”主題演講,深入探討如何加速AI行業(yè)化落地,并分享
    的頭像 發(fā)表于 04-01 15:35 ?1182次閱讀

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓練、
    的頭像 發(fā)表于 03-31 11:27 ?1346次閱讀

    STM32L431RCT6主芯片 搭配 SD NAND-動態(tài)心電圖設備存儲解決方案

    貼片式SD卡存儲解決方案,通過硬件與軟件的深度協(xié)同,全面提升了動態(tài)心電圖設備的性能。 1)大容量存儲,滿足數(shù)據(jù)需求 MKDV08GCL-STPA存儲芯片提供了8Gb的
    發(fā)表于 03-27 10:56

    AI眼鏡定制_AI眼鏡_ai智能眼鏡主板PCBA方案

    AI智能眼鏡的硬件結構主要包括攝像頭、電池、PCBA、存儲器以及芯片等。其中,芯片方案是決定眼鏡性能和成本的核心。目前主流的
    的頭像 發(fā)表于 03-19 20:11 ?1608次閱讀
    <b class='flag-5'>AI</b>眼鏡定制_<b class='flag-5'>AI</b>眼鏡_<b class='flag-5'>ai</b>智能眼鏡主板PCBA<b class='flag-5'>方案</b>

    Sandisk閃迪攜UFS 4.1存儲解決方案亮相CFMS MemoryS 2025

    、汽車、移動端及消費端的全方位創(chuàng)新閃存解決方案,助力用戶應對人工智能(AI)發(fā)展浪潮下日益復雜的工作負載。在此次峰會上,閃迪詳細介紹了UFS 4.1存儲解決方案——iNAND MC E
    的頭像 發(fā)表于 03-12 12:48 ?1403次閱讀
    Sandisk閃迪攜UFS 4.1<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>亮相CFMS  MemoryS 2025