国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦 | 什么是AI芯片“存儲(chǔ)墻”的解決方案?

SSDFans ? 來(lái)源:YXQ ? 2019-06-18 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在2016年威海參加中國(guó)體系結(jié)構(gòu)年會(huì)的時(shí)候,孫所也說(shuō)了一句調(diào)侃的話(huà):“現(xiàn)在的AI很火,大家都往那邊去,沒(méi)有人太關(guān)心體系結(jié)構(gòu)了,我要告訴那些追AI熱點(diǎn)的,它都死了三回了!” 的確,作為從小學(xué)馬列的中國(guó)人,我們最熟悉螺旋式上升的概念。對(duì)于計(jì)算和I/O來(lái)講,和中國(guó)經(jīng)濟(jì)調(diào)控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發(fā)布了TPU V1之后,現(xiàn)在已經(jīng)有越來(lái)越多的AI startup的芯片出現(xiàn),大家基本上都是用標(biāo)準(zhǔn)的Resnet50,Googlenetv3 等網(wǎng)絡(luò)為benchmark, 一次一次地刷新性能和功耗比,個(gè)人覺(jué)得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務(wù)上超過(guò)人腦,現(xiàn)在AI在準(zhǔn)確率和性能上都超過(guò)了。對(duì)于AI的芯片來(lái)講,有一個(gè)指標(biāo)也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來(lái)FLOP/s來(lái)表示,現(xiàn)在新出的AI ASIC往往在FLOP/s并不發(fā)力,因?yàn)閺墓谋鹊慕嵌壬希懔隙ú皇窃礁咴胶茫掖蠹叶己茈y高過(guò)老黃的核彈。

代表了一個(gè)特定的計(jì)算平臺(tái)的peak performance,就是最大算力。

就是特定的計(jì)算平臺(tái)的I內(nèi)存/O帶寬,這個(gè)和該計(jì)算平臺(tái)使用的DDR類(lèi)型有關(guān)。

X軸是I,代表計(jì)算強(qiáng)度,就是在一個(gè)Byte上的計(jì)算量。因?yàn)閷?duì)于一個(gè)特定的平臺(tái),我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計(jì)算強(qiáng)度。

因此,和圖上顯示的一樣,在點(diǎn)(Imax,),這個(gè)計(jì)算平臺(tái)達(dá)到了完美。在它的左邊,說(shuō)明memory受限,在它的右邊說(shuō)明計(jì)算受限。

因此,對(duì)于我們之前分析的Alexnet這個(gè)網(wǎng)絡(luò),我們就知道了它的總的計(jì)算量就是:

內(nèi)存訪問(wèn)量 計(jì)算量
Conv1 770235 105415200
Maxpool1 430368
Conv2 1057632 223948800
Maxpool2 273152
Conv3 1057792 149520384
Conv4 1521792 112140288
Conv5 1036160 74760192
Maxpool3 61696
FC1 37766144 37748736
FC2 16789504 16777216
FC3 4102096 4096000
SUM 65021158 724406816

因?yàn)閷?duì)于每一次訪存都是32位的Float Point,因此整個(gè)內(nèi)存的占用就是 260MB左右,而計(jì)算量是724MFLOPs,因此Alexnet的計(jì)算強(qiáng)度就是724/260=2.7 operation/byte。

對(duì)于一個(gè)特定的平臺(tái),比如老黃家的新的GTX2080Ti 系列來(lái)講:

對(duì)于計(jì)算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來(lái)講,他是100TLOP/s,

它的內(nèi)存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個(gè),就可以看出,對(duì)于Alex的2.7 來(lái)講,遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到2080ti的計(jì)算強(qiáng)度,主要是受限于內(nèi)存帶寬了。

在Google的TPU中,有一個(gè)圖經(jīng)常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒(méi)有什么網(wǎng)絡(luò)可以完全用滿(mǎn)TPU的peak performance。

怎么辦,內(nèi)存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認(rèn)為目前應(yīng)該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計(jì)算應(yīng)該是下一個(gè)方向。

這個(gè)就引出了在Memory+會(huì)議上來(lái)自平頭哥的段立德博士的topic,”P(pán)rocessing Near or In memory for deep learning".

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54010

    瀏覽量

    466182
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301456

原文標(biāo)題:什么是AI芯片“存儲(chǔ)墻”的解決方案?

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何突破AI存儲(chǔ)?深度解析ONFI 6.0高速接口與Chiplet解耦架構(gòu)

    1. 行業(yè)核心痛點(diǎn):AI存儲(chǔ)”危機(jī)在大模型訓(xùn)練與推理場(chǎng)景中,算力演進(jìn)速度遠(yuǎn)超存儲(chǔ)帶寬,計(jì)算與存儲(chǔ)之間的性能鴻溝(
    發(fā)表于 01-29 17:32

    國(guó)內(nèi)分布式AI存儲(chǔ)方案商港股IPO!

    據(jù)港交所1月27日披露,北京星辰天合科技股份有限公司(簡(jiǎn)稱(chēng)“星辰天合”)向港交所主板遞交上市申請(qǐng)書(shū)。 ? 星辰天合專(zhuān)注于提供企業(yè)級(jí)AI存儲(chǔ)解決方案,助力企業(yè)大規(guī)模高效整合數(shù)據(jù)、決策及運(yùn)營(yíng)。兩類(lèi)主要
    的頭像 發(fā)表于 01-29 13:44 ?7776次閱讀
    國(guó)內(nèi)分布式<b class='flag-5'>AI</b><b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>方案</b>商港股IPO!

    推薦高性能存儲(chǔ)psram芯片

    智能穿戴、物聯(lián)網(wǎng)設(shè)備和端側(cè)AI應(yīng)用快速發(fā)展,PSRAM偽靜態(tài)隨機(jī)存儲(chǔ)器,正成為越來(lái)越多嵌入式系統(tǒng)的優(yōu)選方案,如何選擇一個(gè)高性能、小尺寸與低功耗的psram芯片是一個(gè)值得思考的問(wèn)題。由E
    的頭像 發(fā)表于 11-18 17:24 ?476次閱讀

    VS680 HDMI AI分析解決方案 #目標(biāo)識(shí)別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    佰維存儲(chǔ)AI時(shí)代的存儲(chǔ)解決方案

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在GMIF2025大會(huì)上,佰維存儲(chǔ)CEO何瀚表示,端側(cè)AI對(duì)存儲(chǔ)的尺寸和功耗有著更為極致的要求。隨著在端側(cè)部署更大參數(shù)規(guī)模的AI模型成為趨勢(shì),需要更大容量
    的頭像 發(fā)表于 09-30 08:40 ?1.2w次閱讀
    佰維<b class='flag-5'>存儲(chǔ)</b>:<b class='flag-5'>AI</b>時(shí)代的<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>解決方案</b>

    聚焦AI挑戰(zhàn)!MPS、安謀科技、Imagination及長(zhǎng)江存儲(chǔ)分享創(chuàng)新解決方案

    計(jì)算需求、能效優(yōu)化及技術(shù)快速迭代成為行業(yè)面臨的主要挑戰(zhàn)。在會(huì)上,MPS、安謀科技、Imagination Technologies以及長(zhǎng)江存儲(chǔ)等企業(yè)從不同角度分享了他們的創(chuàng)新解決方案。 ? MPS:高密度電源模塊,AI算力的隱形
    的頭像 發(fā)表于 08-26 21:39 ?5407次閱讀
    <b class='flag-5'>聚焦</b><b class='flag-5'>AI</b>挑戰(zhàn)!MPS、安謀科技、Imagination及長(zhǎng)江<b class='flag-5'>存儲(chǔ)</b>分享創(chuàng)新<b class='flag-5'>解決方案</b>

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動(dòng) AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,將極大提升在職稱(chēng)評(píng)審中的競(jìng)爭(zhēng)力。例如,在芯片設(shè)計(jì)中引入新的計(jì)算范式,如存算一體技術(shù)
    發(fā)表于 08-19 08:58

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    :科技探索與 AGI 愿景》。 這本新書(shū)針對(duì)大模型技術(shù)浪潮,詳細(xì)講解了AI芯片的主流技術(shù)、挑戰(zhàn)與創(chuàng)新解決方案,并介紹了下一代芯片工藝和顛覆性AI
    發(fā)表于 07-28 13:54

    佰維存儲(chǔ)亮相COMPUTEX 2025,全場(chǎng)景存儲(chǔ)方案賦能“AI +”未來(lái)生態(tài)

    近日,臺(tái)北國(guó)際電腦展(COMPUTEX 2025)以“AI NEXT”為主題啟幕,作為領(lǐng)先的存儲(chǔ)與內(nèi)存解決方案廠商,佰維存儲(chǔ)展示了其涵蓋消費(fèi)級(jí)、嵌入式
    的頭像 發(fā)表于 05-26 09:43 ?1205次閱讀
    佰維<b class='flag-5'>存儲(chǔ)</b>亮相COMPUTEX 2025,全場(chǎng)景<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>方案</b>賦能“<b class='flag-5'>AI</b> +”未來(lái)生態(tài)

    華為加速AI時(shí)代數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)發(fā)展

    近日,在華為中國(guó)合作伙伴大會(huì)2025上,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰發(fā)表“共筑數(shù)智解決方案,共享數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)大發(fā)展”主題演講,深入探討如何加速AI行業(yè)化落地,并分享
    的頭像 發(fā)表于 04-01 15:35 ?1182次閱讀

    曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案

    近日,曙光存儲(chǔ)全新升級(jí)AI存儲(chǔ)方案,秉持“AI加速”理念,面向AI訓(xùn)練、
    的頭像 發(fā)表于 03-31 11:27 ?1346次閱讀

    STM32L431RCT6主芯片 搭配 SD NAND-動(dòng)態(tài)心電圖設(shè)備存儲(chǔ)解決方案

    貼片式SD卡存儲(chǔ)解決方案,通過(guò)硬件與軟件的深度協(xié)同,全面提升了動(dòng)態(tài)心電圖設(shè)備的性能。 1)大容量存儲(chǔ),滿(mǎn)足數(shù)據(jù)需求 MKDV08GCL-STPA存儲(chǔ)芯片提供了8Gb的
    發(fā)表于 03-27 10:56

    KOWIN存儲(chǔ)亮相2025亞洲AI眼鏡大會(huì)

    、直接的合作與交流。 KOWIN存儲(chǔ)芯亮相 2025?亞洲AI眼鏡大會(huì) KOWIN康盈半導(dǎo)體作為超可靠存儲(chǔ)創(chuàng)新解決方案商攜AI智能眼鏡應(yīng)用的
    的頭像 發(fā)表于 03-22 10:19 ?1581次閱讀
    KOWIN<b class='flag-5'>存儲(chǔ)</b>亮相2025亞洲<b class='flag-5'>AI</b>眼鏡大會(huì)

    AI眼鏡定制_AI眼鏡_ai智能眼鏡主板PCBA方案

    AI智能眼鏡的硬件結(jié)構(gòu)主要包括攝像頭、電池、PCBA、存儲(chǔ)器以及芯片等。其中,芯片方案是決定眼鏡性能和成本的核心。目前主流的
    的頭像 發(fā)表于 03-19 20:11 ?1608次閱讀
    <b class='flag-5'>AI</b>眼鏡定制_<b class='flag-5'>AI</b>眼鏡_<b class='flag-5'>ai</b>智能眼鏡主板PCBA<b class='flag-5'>方案</b>

    Sandisk閃迪攜UFS 4.1存儲(chǔ)解決方案亮相CFMS MemoryS 2025

    、汽車(chē)、移動(dòng)端及消費(fèi)端的全方位創(chuàng)新閃存解決方案,助力用戶(hù)應(yīng)對(duì)人工智能(AI)發(fā)展浪潮下日益復(fù)雜的工作負(fù)載。在此次峰會(huì)上,閃迪詳細(xì)介紹了UFS 4.1存儲(chǔ)解決方案——iNAND MC E
    的頭像 發(fā)表于 03-12 12:48 ?1403次閱讀
    Sandisk閃迪攜UFS 4.1<b class='flag-5'>存儲(chǔ)</b><b class='flag-5'>解決方案</b>亮相CFMS  MemoryS 2025