国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

有效解決內存墻問題 存算一體正處在快速發展階段

lPCU_elecfans ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2021-10-29 10:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/李彎彎)隨著技術的發展,現在計算的任務越來越復雜,需要的數據也越來越多,而在馮諾依曼架構中,數據需要在存儲、內存、緩存、計算單元中不斷搬運,造成大部分時間、帶寬、緩存、功耗都消耗在數據搬運上,而不是計算上,因此內存墻都成了一個越來越嚴重的問題。

這種問題在人工智能計算中尤為明顯,知存科技創始人兼CEO王紹迪近日在某論壇分享到:“這種數據搬運消耗的功耗超過95%以上,帶寬也會達到80%以上,比如片上緩存,1MB的SRAM和8KB的SRAM在數據搬運上消耗的功耗相差10倍。”因此業界都在思考減少內存墻問題。

存算一體有效解決內存墻問題

存算一體主要有近存計算和存內計算。近存計算可以理解為通過先進封裝拉近存儲、內存和計算單元的距離,比如SRAM,在馮諾依曼架構中,很多時候SRAM用作緩存,多核共同使用,這樣緩存到每個核都有一定距離,數據搬運、訪問時間、功耗都會增加,王紹迪介紹:“近緩存計算把SRAM與計算單元合在一起,這個SRAM只供本地計算單元使用,數據訪問時間和帶寬都有很大提升。”

存內計算比近存計算更高效,同時也更難以實現,存內計算一般是使用存儲的參數去完成計算,比如SRAM存內計算,Flash存內計算、以及RRAM存內計算。存內計算實際上是一個計算的模塊,而不再是存儲的模塊,實踐的方式是用存儲的參數去完成運算,從存儲器中讀出的數據是運算的結果,而不是存儲的數據。

在馮諾依曼架構中,不管是做加法運算還是乘法運算,都需要把數據從存儲架構中讀出來,包括緩存、內存、以及片外的存儲,最終將數據讀到計算單元中完成運算。從緩存中讀取數據,要消耗運算幾倍、幾十倍、甚至幾百倍的功耗,從內存讀取數據,搬運功耗是運算的近千倍,從外部的存儲讀取,達到上萬倍。

因此在數據量很大的計算中,馮諾依曼架構的效率就會非常低,而存內計算,存儲器中存儲了參數,被處理的數據作為輸入信號,被處理的信號流過存儲器中所有的參數,從存儲器中輸出的數據就是運算的結果。

王紹迪表示,“存內計算的優勢在于,能夠將存儲器中眾多的存儲單元轉化為運算單元,這樣能計算的并行度就會大幅提高,從原來幾十、幾百個并行,到存內計算幾百萬、幾千萬、甚至幾億個乘加法的并行度,運算效率很高。”

除了可以大規模并行運算,還可以很大程度節省數據帶寬。簡單來說,一個傳統的存儲器,多行多列,一次至多激活一行,讀取出一行的數據,而要把多行數據讀取出來,需要進行多個存儲器周期,分別激活每一行,讀出每一行的數據。而存內計算可以同時把輸入數據給多行,同時多行的輸入數據與每一行的參數做乘法運算,在列的方向直接把運算的結果讀取出來,它是同時多行多列并行激活的方法。

現在的存內計算可以做到千行千列同時開啟,使用效率比傳統存儲器提高近千倍,王紹迪談到:“整體來看,包括輸入輸出,存內計算運算效率一般會有幾十倍的提升,而且提升倍數還一直在增加,存內計算的發展速度很快,最近處于早期的快速發展階段,每年都有數倍性能的提升。”

知存科技WTM2101智能解決方案

知存科技目前在存內計算領域較為領先,公司成立于2017年底,目前已經推出兩款存算一體芯片,其中WTM1001已經批量量產,WTM2101處于小批量階段,知存科技目前已經完成五輪融資。

WTM2101是一款尺寸很小的SOC芯片,包括一個1.8MB存內計算的Flash,該存儲模塊除了用于存內計算,也可以用于普通的存儲。王紹迪介紹:“這款芯片的封裝很小,可以用在可穿戴設備中,目前計算的功耗非常低,比如如果做連續100個詞到300個詞的識別,功耗可以控制在1mA以內,其中100個詞可以功耗可以到60微安。該芯片在運行語音識別、語音增強、物體識別、智能健康,以及其他的一些AI算法上,可以把算力和效率提升20倍到50倍。”

另外WTM2101首次用了獨有的專利HPU,它是一個混合計算單元,實際上是把數字計算和模擬計算結合在一起,因為模擬計算有精度上限,為了提高精度,加了一個稀疏的計算單元,可以把存內計算的精度進一步提高,最高提高4比特。

存內計算未來的發展趨勢

隨著存內計算的發展,未來的應用場景也會越來越廣,當前存內計算主要應用在端側,一是受精度的限制,8比特,二是受容量限制,在幾兆的級別,三是算力,基本在0.1T到1T的范圍。

不過未來一兩年將會發展到邊側,精度會提高到12比特,容量會達到16兆到64兆,算力也可以提升到最大32T,這樣可以覆蓋很多邊緣側的應用需求。未來還會向云端發展,存內計算精度會達到到16比特,容量會超過1000M,算力會達到256T到1024T。

存內計算在云側、邊側、端側,優勢各不相同,在端側,存內計算在功耗的限制下可以提供大的算力,在邊緣側,在功耗、體積限制下也有很強的算力,在云端,可以提供更低成本的解決方案。

存內計算現在處于一個很快的發展階段,未來幾年,每年都會有很快的迭代速度。早期,產業界對存內計算的關注不多,投入也很少,最近存內計算逐漸得到越來越多的關注,王紹迪認為,未來五年存內計算都會在處在非常快速的發展階段,在各種各樣的場景中,進行規模化的落地應用。

聲明:本文由電子發燒友原創,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱huangjingjing@elecfans.com。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    39

    文章

    7739

    瀏覽量

    171679
  • SoC芯片
    +關注

    關注

    2

    文章

    669

    瀏覽量

    37170
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265416
  • 存算一體
    +關注

    關注

    1

    文章

    121

    瀏覽量

    5136

原文標題:有效解決內存墻問題 存算一體正處在快速發展階段

文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    力革命下的隱形基石:一體時代呼喚更精準的“時間心跳”

    正在浮現:決定系統最終效率與可靠性的,往往并非峰值力本身,而是數據在存儲與計算單元之間反復搬運所產生的巨大功耗與延遲瓶頸。為了突破這“存儲”,產業界正將目光投
    的頭像 發表于 01-21 08:44 ?759次閱讀
    <b class='flag-5'>算</b>力革命下的隱形基石:<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>時代呼喚更精準的“時間心跳”

    AI一體,這家ReRAM新型存儲受關注

    及相關芯片產品的研發,涵蓋AI一體(Computing in Memory, CIM)IP及大模型加速方案、高性
    的頭像 發表于 12-25 09:43 ?1909次閱讀
    AI<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>,這家ReRAM新型存儲受關注

    科技王紹迪:AI可穿戴需求爆發,一體成主流AI芯片架構

    集中在AI驅動的細分場景需求釋放,知科技聚焦的一體芯片具備高技術壁壘,同時在AI發展需求下具備天然的架構優勢和
    的頭像 發表于 12-23 09:34 ?9579次閱讀
    知<b class='flag-5'>存</b>科技王紹迪:AI可穿戴需求爆發,<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>成主流AI芯片架構

    載譽而歸 | 蘋芯科技斬獲AABI火炬技術轉移獎,一體技術探索跨境創新合作

    (PimchipTechnology)憑借在一體芯片領域的技術突破與跨境技術轉化成果,成功斬獲2025年AABI火炬技術轉移獎。這榮譽不僅是對蘋芯團隊技術實力的高度認可,也將進
    的頭像 發表于 11-04 10:03 ?767次閱讀
    載譽而歸 | 蘋芯科技斬獲AABI火炬技術轉移獎,<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>技術探索跨境創新合作

    Nullmax艙駕一體域控解決方案完成實車部署

    在智能輔助駕駛的快速發展中,艙駕一體成為當下主流趨勢。不久前,Nullmax發布了基于高通SA8775 CCCC 芯片(48TOPS力)的艙駕一體
    的頭像 發表于 10-11 15:33 ?959次閱讀

    一體AI芯片公司九天睿芯完成超億元B輪融資

    全球領先的一體AI芯片公司九天睿芯(英文:Reexen Technology)近日宣布,公司已完成B輪融資,規模超億元人民幣。
    的頭像 發表于 10-10 11:41 ?1190次閱讀

    后摩爾定律時代,3D-CIM+RISC-V打造國產一體新范式

    力、能效與帶寬瓶頸成為行業前行的關鍵阻礙,而美西方的技術禁運更讓中國芯片產業面臨嚴峻挑戰。 ? 在這大背景下,一體成為國產
    發表于 09-17 09:31 ?5901次閱讀
    后摩爾定律時代,3D-CIM+RISC-V打造國產<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>新范式

    科技榮獲2025半導體市場創新表現獎

    8月26日,第22屆深圳國際電子展(elexcon2025)現場正式揭曉聚焦行業技術突破與價值創造的“2025半導體市場創新表現獎” ,知科技憑借WTM系列一體芯片的核心技術創新
    的頭像 發表于 08-28 17:09 ?1589次閱讀

    在TR組件優化與一體架構中構建技術話語權

    電磁兼容性、熱管理在內的12項專業能力評估。\"這種評估體系,正是行業對技術人才的分級認證標準。 1.2 異構計算架構下的能力矩陣 一體架構的普及正在重構工程師的知識體系: 近內存
    發表于 08-26 10:40

    文看懂“一體

    今天這篇文章,我們來聊個最近幾年很火的概念——一體。為什么會提出“
    的頭像 發表于 08-18 12:15 ?1446次閱讀
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>”

    一體技術加持!后摩智能 160TOPS 端邊大模型AI芯片正式發布

    ,同步推出力擎?系列M.2卡、力謀?系列加速卡及計算盒子等硬件組合,形成覆蓋移動終端與邊緣場景的完整產品矩陣。這系列動作標志著后摩智能在一體技術領域的突破性進展,更預示著端邊智能
    的頭像 發表于 07-30 07:57 ?8355次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>技術加持!后摩智能 160TOPS 端邊大模型AI芯片正式發布

    緩解高性能一體芯片IR-drop問題的軟硬件協同設計

    在高性能計算與AI芯片領域,基于SRAM的一體(Processing-In-Memory, PIM)架構因兼具計算密度、能效和精度優勢成為主流方案。隨著
    的頭像 發表于 07-11 15:11 ?1334次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片IR-drop問題的軟硬件協同設計

    國際首創新突破!中國團隊以一體排序架構攻克智能硬件加速難題

    2025 年 6 月 25 日,北京大學團隊在智能計算硬件方面取得領先突破,國際上首次實現了基于一體技術的高效排序硬件架構 (A fast and reconfigurable
    的頭像 發表于 07-02 16:50 ?840次閱讀
    國際首創新突破!中國團隊以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>排序架構攻克智能硬件加速難題

    蘋芯科技 N300 一體 NPU,開啟端側 AI 新征程

    隨著端側人工智能技術的爆發式增長,智能設備對本地力與能效的需求日益提高。而傳統馮·諾依曼架構在數據處理效率上存在瓶頸,“內存”問題成為制約端側AI性能突破的關鍵掣肘。在這背景下,
    的頭像 發表于 05-06 17:01 ?1114次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側 AI 新征程

    PIMCHIP S300 全球首款28nm節點實現存一體產品化AI芯片

    PIMCHIP-S300 芯片是蘋芯科技基于一體技術打造的多模態智慧感知決策 AI 芯片。其搭載基于靜態隨機存取存儲器(SRAM)的
    的頭像 發表于 03-28 17:06 ?2625次閱讀
    PIMCHIP S300 全球首款28nm節點實現存<b class='flag-5'>算</b><b class='flag-5'>一體</b>產品化AI芯片