国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

神經形態芯片作為AI加速器正式神經形態基準鋪平道路

454398 ? 來源:eetimes ? 作者:Sally Ward-Foxton ? 2020-12-13 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英特爾首次展示了將神經形態芯片Loihi與經典計算和主流深度學習加速器進行比較的性能結果摘要。結果表明,盡管Loihi可能無法提供比其他前饋神經網絡方法更多的優勢,但對于其他工作負載(例如遞歸神經網絡)卻可以實現較大的延遲和功率效率增益。英特爾希望第一組定量結果將為開發適用于所有類型神經形態硬件的正式神經形態基準鋪平道路。

英特爾已經將其Loihi芯片與其他計算架構進行了基準測試(圖片來源:英特爾)

“經過數十年的神經形態研究,人們對令人驚嘆的AI功能,效率的巨大突破做出了許多承諾,但是很少有公開的定量結果來表明這是否是真實的,如果是的話,我們到底從哪里得到這些信息?有收獲嗎?”英特爾神經形態研究主管Mike Davies告訴EE Times。

他繼續說:“這是我們研究計劃中的任務,在我們試圖將技術迅速推向商業應用之前,我們正在采取一種有條不紊的,有條不紊的研究方法,在此我們首先要了解許多不同方向中的哪一個。就神經科學的啟發而言,這實際上可以產生最令人信服的結果。”

深度學習比較
真的有可能在神經形態芯片和其他計算硬件的結果之間進行有意義的比較嗎?通常會演示神經形態硬件運行諸如尖峰神經網絡之類的“外來”算法,這與深度學習中發現的算法類型非常不同。

戴維斯說:“關于神經形態研究存在困惑,因為我們可以在像Loihi這樣的神經形態芯片上運行的東西與這些深度學習模型的作用之間存在重疊。”“在多個方面,我們有多種方法可以從深度學習社區中提取學習內容,并將其導入神經形態世界。”

英特爾神經形態研究社區(INRC)是一個由100多家使用英特爾Loihi硬件探索神經形態計算的公司組成的社區,作為這項工作的一部分,它能夠在Loihi上運行深度學習算法。算法可能是現有的以常規方式訓練的深度學習網絡,然后轉換為Loihi可以使用的格式,因此可以對其進行基準測試。這是一種方法,但是實際上可以在Loihi上運行深度學習算法的其他幾種方法(下圖中的區域1)。

一種是使用反向傳播,它是使深度學習取得成功的一種算法技術,因為它可以在訓練過程中對權重進行微調。經常由神經形態芯片(尖峰神經網絡)運行的網絡類型可以配制成數學上可微分的形式,允許應用反向傳播以優化結果。

另一個選擇是嘗試在芯片上執行反向傳播,這相當于當今(離線)訓練神經網絡的方式,但是用于基于采集的數據在現場進行增量訓練。

神經科學啟發的方法與機器學習之間的算法交叉。區域1代表深度學習。區域2是神經形態算法,例如尖峰神經網絡。區域3是目標-基于來自區域1和2的實驗方法的算法,這些算法已經數學上形式化,因此可以應用于其他類型的問題。圖片:英特爾)

基準測試結果結果
英特爾在INRC成員發表的論文(以下)上繪制了性能(潛伏期和功耗)結果圖表,其中包括Loihi與CPUGPU,Movidius神經計算棒或IBM的Truemorph North Neuromorphic技術之間的量化比較。所有結果均適用于數據樣本一一到達(批大小為1)的應用,類似于實時生物系統。

Loihi系統與其他類型計算的實驗結果。標記的大小代表神經網絡的相對大小(圖片來源:英特爾)

戴維斯說:“這些[數據點]中的每一個都需要大量的工作,這就是為什么迄今為止在神經形態領域還沒有完成太多工作的原因。”“要獲得這些測量值,找到正確的基線比較點并真正完成這項嚴格的工作非常困難。但是我們一直在敦促合作者做到這一點,因為擁有這樣的情節非常令人興奮。”

圖上每個點的大小代表網絡的大小;較大的標記使用更多的Loihi籌碼,最大的代表500多個籌碼)。將這些Loihi系統與單個計算子系統(單個CPU / GPU加上內存)進行了比較。Davies說,要進行蘋果之間的比較并不容易,因為CPU可以添加DRAM來幫助擴展,而Loihi只能添加更多的Loihi芯片。

每個系統中是否可以有更多的計算芯片來改善CPU和GPU的性能?

戴維斯說:“對于這種規模的網絡,這是不可能的。”“按常規標準,支配該圖的小數據點都是很小的網絡……總的來說,對于我們正在研究的問題類型,它們并不能很好地并行化。Loihi實現能夠很好??地擴展的原因是因為存在非常精細的規模并行性,并且神經元之間的通信發生在微微秒的規模上,并且體系結構能夠對此進行處理。”

高度精細的并行通信是Loihi架構的基礎。常規體系結構將粗粒度的工作塊分開,以使工作負載并行化。對于深度學習,這通常是通過分批完成的。Davies說,這種技術在這里無濟于事,因為關鍵指標是處理單個數據樣本的延遲。

到目前為止獲得的結果的關鍵見解是,Loihi對于前饋網絡幾乎沒有提供性能優勢,前饋網絡是一種廣泛用于主流深度學習的神經網絡,因為它們更容易在常規深度學習加速器硬件上進行訓練(見圖)下面)。

戴維斯說:“非常值得注意的是,數據點如此干凈地分離,前饋網絡提供的吸引力最小,在某些情況下,Loihi更糟。”

在Loihi系統上運行遞歸神經網絡可獲得最大的收益,在該系統中,性能降低了1000到10,000倍,解決時間提高了100倍。

Loihi系統與其他類型的計算的實驗結果,突出顯示了哪些工作負載是前饋網絡。標記的大小代表神經網絡的相對大小(圖片來源:英特爾)

未來的基準測試
英特爾宣布打算將其用于此類工作的軟件開源,從而邁出了邁向神經形態基準測試的第一步。將此代碼開源,將允許其他人在其神經形態平臺上運行相同的工作負載,并降低進入神經形態計算和INRC的障礙。

戴維斯說:“我們很高興能夠開始比較不同組的神經形態芯片得到的結果。”“但是對我們而言,最初的工作重點是針對常規體系結構進行基準測試,以了解我們應將什么放入神經形態基準套件中,然后再用于推動神經形態領域的進步。”

未來神經形態基準測試的很大一部分是了解應包括哪些類型的算法。對于深度學習,候選人更為明顯– ResNet-50的使用如此廣泛,以至于它已成為事實上的基準。在神經形態空間中沒有等效項,因為它更加分散,并且硬件更具算法特定性。

“我認為重要的是,我們要從這類新興的工作負載中建立實際的方法,正式的基準測試,在這些工作負載中,我們可以看到神經形態硬件的好處,并在那里進行標準化。但是我認為這是下一步。”戴維斯說。“我們當然希望在這個方向上領導這一領域。為了使之成為可能,還需要進行進一步的融合,尤其是在軟件方面。”

通過這些結果,英特爾希望證明Loihi可以在一系列復雜的,困難的,以大腦為靈感的工作負載上提供巨大的性能提升,即使它尚不知道這些工作負載的外觀如何。

戴維斯說:“在英特爾,我們的目標比其他任何事情都重要,要確保這是各種各樣的工作負載。”“我們不打算制造用于約束滿足解決方案的點加速器,也不是機器人手臂操縱器。我們希望這是一種類似于CPU或GPU的新型計算機體系結構,但是如果優化得當,它將固有地很好地運行各種大腦啟發的智能工作負載。”
編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10301

    瀏覽量

    180437
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107758
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124398
  • AI加速器
    +關注

    關注

    1

    文章

    73

    瀏覽量

    9488
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    脈沖神經元模型的硬件實現

    實現。所以現有的大部分 SNN 加速器的硬件實現上都采用LIF模型。 如圖所示,設計的 SNN 神經核整體架構如圖所示。 神經核主要由 LIF 神經元模塊(LIF_neuron)、控
    發表于 10-24 08:27

    SNN加速器內部神經元數據連接方式

    的數量級,而且生物軸突的延遲和神經元的時間常數比數字電路的傳播和轉換延遲要大得多,AER 的工作方式和神經網絡的特點相吻合,所以受生物啟發的神經形態處理
    發表于 10-24 07:34

    CICC2033神經網絡部署相關操作

    在完成神經網絡量化后,需要將神經網絡部署到硬件加速器上。首先需要將所有權重數據以及輸入數據導入到存儲內。 在仿真環境下,可將其存于一個文件,并在 Verilog 代碼中通過 read
    發表于 10-20 08:00

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    智能技術的關鍵要求: 1、基于憶阻的感存算一體化技術 牛。都可以情感生成了。 2、具身智能的執行控制 目前,AI運動控制的研究主要集中在: 將成熟的機器人控制轉化為可以在神經形態設備
    發表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經形態計算、類腦芯片

    AI芯片不僅包括深度學細AI加速器,還有另外一個主要列別:類腦芯片。類腦芯片是模擬人腦
    發表于 09-17 16:43

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+化學或生物方法實現AI

    柔韌性的復合材料,可進行熱電轉換,并具有化學敏感性和生物適應性。 ②用電解質溶液實現MAC計算單元 ③具有神經形態功能的流體憶阻 ④用電化學實現的液體存儲 膠體存儲
    發表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    本章節作者分析了下AI的未來在哪里,就目前而言有來那個兩種思想:①繼續增加大模型②將大模型改為小模型,并將之優化使之與大模型性能不不相上下。 一、大模型是一條不可持續發展的道路 大模型的不可
    發表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創新方法與架構

    、Transformer 模型的后繼者 二、用創新方法實現深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優勢如下: ①模
    發表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內容總覽

    、集成芯片、分子器件與分子憶阻,以及打印類腦芯片等。 第五章至第八章分別探討用化學或生物方法實現AIAI在科學發現中創新應用、實現
    發表于 09-05 15:10

    Andes晶心科技推出新一代深度學習加速器

    高效能、低功耗 32/64 位 RISC-V 處理核與 AI 加速解決方案的領導供貨商—Andes晶心科技(Andes Technology)今日正式發表最新深度學習加速器 Ande
    的頭像 發表于 08-20 17:43 ?2330次閱讀

    Arm神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,移動設備上實現PC級別的AI圖形性能

    Arm 神經技術是業界首創在 Arm GPU 上增添專用神經加速器的技術,首次在移動設備上實現 PC 級別的 AI 圖形性能,為未來的端側 AI
    的頭像 發表于 08-14 17:59 ?2760次閱讀

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    》,講述了AI芯片的基礎知識,包括原理、種類、廠商、產業等概況,展望新技術與研究應用。 《AI芯片:前沿技術與創新未來》出版后獲得了“憶阻
    發表于 07-28 13:54

    革命性神經形態微控制 ?**Pulsar**? 的深度技術解讀

    以下是對荷蘭公司Innatera推出的革命性神經形態微控制 ? Pulsar ? 的深度技術解讀,結合其架構設計、性能突破、應用場景及產業意義進行綜合分析: 一、核心技術原理:神經
    的頭像 發表于 06-07 13:06 ?1673次閱讀
    革命性<b class='flag-5'>神經</b><b class='flag-5'>形態</b>微控制<b class='flag-5'>器</b> ?**Pulsar**? 的深度技術解讀

    時識科技推出XyloAudio 3神經形態開發套件

    時識科技(SynSense)推出的XyloAudio 3神經形態開發套件,為邊緣AI音頻處理樹立全新能效標桿!基于類腦計算技術,XyloAudio 3專為實時聲音檢測與分類場景打造,以超低功耗(<1毫瓦)和毫秒級響應速度賦能下一
    的頭像 發表于 05-15 15:07 ?1307次閱讀
    時識科技推出XyloAudio 3<b class='flag-5'>神經</b><b class='flag-5'>形態</b>開發套件

    MAX78002帶有低功耗卷積神經網絡加速器的人工智能微控制技術手冊

    的Maxim超低功耗微控制相結合。通過這款基于硬件的卷積神經網絡(CNN)加速器,即使是電池供電的應用也可執行AI推理,同時功耗僅為微焦耳級。
    的頭像 發表于 05-08 10:16 ?844次閱讀
    MAX78002帶有低功耗卷積<b class='flag-5'>神經</b>網絡<b class='flag-5'>加速器</b>的人工智能微控制<b class='flag-5'>器</b>技術手冊