国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Flex Logix公司稱它解決了深度學習的DRAM問題

IEEE電氣電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-11-08 14:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學習有一個DRAM問題。設計用來實時處理復雜任務(比如,在汽車的備份攝像頭視頻流中分辨貓和孩子)的系統,不斷地將構成神經網絡內容的數據從存儲器傳送到處理器

根據初創公司Flex Logix的說法,問題并不是缺乏存儲這些數據的空間,而是處理器和存儲器之間缺乏帶寬。為了將數百千兆比特的數據提供給處理器,有些系統需要4個甚至8個DRAM芯片,這既使占用的空間增加了不少,又消耗了大量的電能。Flex Logix表示,它為可重構芯片開發的互連技術和tile-based架構將使AI系統只需要1個DRAM芯片的帶寬,且功耗僅為十分之一。

圖片來源:Flex Logix

NMAX512tile的架構。

位于加州山景城的Flex Logix公司已經開始將一種新的嵌入式現場可編程門陣列(eFPGA)架構商業化。但經過一番探索后,其創始人之一Cheng C. Wang意識到,這項技術可以加快神經網絡的速度。

神經網絡由連接和表示連接強度的“權重”組成。另一位創始人Geoff Tate解釋說,一個好的AI芯片需要兩樣東西。一種是一些做關鍵“推斷”計算(即乘法和累加)的電路。“但更困難的是,你必須非常擅長引入所有這些權重,以便其乘法器總能得到它們需要的數據,從而進行所需的數學運算。Wang意識到我們在FPGA的互連方面所擁有的技術,他可以對它做適應性改造,來創建一種非常擅長快速高效地加載權重、高性能和低功耗的架構。”

需要快速連續地將數百萬個權重加載到網絡中,這就是每秒要做數萬億次到數十萬億次運算的AI系統為什么需要那么多DRAM芯片的原因。DRAM芯片上的每個引腳每秒最多可以傳輸4Gb數據,因此要達到所需的每秒數百Gb的數據傳輸速度,就需要多個芯片。

在為FPGA開發最初的技術時,Wang注意到,這些芯片有約80%的面積互連,因此他尋求一種能夠縮小互連面積并考慮到更多邏輯的架構。他和他在加州大學洛杉磯分校的同事對一種稱為folded-Bene?網絡的電信架構做了適應性改造來完成這項工作。這使得FPGA架構看起來像一堆邏輯和SRAM的瓦片(tile)。

圖片來源:Flex Logix

Flex Logix公司表示,在芯片中構建分布式SRAM可加快計算速度并降低功耗。

Tate說,在這種專用互連方案中使用分布式SRAM最終會對深度學習的DRAM帶寬問題產生重大影響。“我們正在用芯片上的SRAM取代DRAM帶寬。”

圖片來源:Flex Logix

若干NMAXtile可以置于一個芯片上并連在一起,以擴大計算能力。

用于Flex Logix的AI產品的tile稱為NMAX,采用了臺積電的16納米技術,面積不到2平方毫米。每個tile都由一組核心組成,這些核心這些核心負責關鍵的乘法和累加計算、控制數據的處理和流動的可編程邏輯以及SRAM。這涉及三種不同類型的互連技術。一種tile上的所有零件連接在一起。另一種將tile與位于tile之間的附加SRAM及外部的DRAM相連接。第三種將相鄰的tile連接在一起。

在深度學習領域,很難進行真正的橫向比較。但Flex Logix的分析顯示,將使用1個DRAM芯片的模擬的6×6tile的NMAX512陣列與使用8個DRAM的Nvidia Tesla T4進行比較,結果是新架構每秒能識別4,600張圖像,而Nvidia每秒識別3,920張圖像。在一項名為YOLOv3的實時視頻處理測試中,同樣大小的NMAX陣列可達到每秒22萬億次運算,而使用的DRAM帶寬是其他系統的十分之一。

Tate表示,首批NMAX芯片的設計將于2019年下半年送至代工廠以便進行制造。

Flex Logix將波音公司視作其高吞吐量嵌入式FPGA產品的客戶之一。但Tate承認,與神經網絡相比,嵌入式FPGA是個很難賣的產品。“嵌入式FPGA是一項很好的業務,但是推理可能很快就會超越它。”Tate說。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DRAM
    +關注

    關注

    41

    文章

    2394

    瀏覽量

    189162
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107800
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124400

原文標題:Flex Logix公司稱它解決了深度學習的DRAM問題

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Debian flex-installer 無法下載引導映像怎么解決?

    flex-installer 似乎不處理重定向,而是失敗。 Can someone from NXP 請提供直接下載這些文件以及瀏覽目錄以查看哪些文件實際上可供下載的能力,關于 Debian 安裝過程以及任何其他固件內容
    發表于 03-03 08:15

    人工智能與機器學習在這些行業的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業賦予競爭優勢,而在線行業正是受其影響最為顯著的領域。人工智能(AI)與機器學習(ML)的
    的頭像 發表于 02-04 14:44 ?484次閱讀

    機器學習深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?194次閱讀
    機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    創新的高帶寬DRAM解決方案

    AI(人工智能)極大地增加了物聯網邊緣的需求。為了滿足這種需求,Etron公司推出了世界上第一款扇入式晶圓級封裝的DRAM——RPC DRAM?支持高帶寬和更小的尺寸。憑借RPC DRAM
    的頭像 發表于 01-05 14:29 ?185次閱讀

    穿孔機頂頭檢測儀 機器視覺深度學習

    穿孔機頂頭檢測儀采用深度學習技術,通過不斷的學習功能,越用越準確,為高質量生產保駕護航。 網站名稱:保定市藍鵬測控科技有限公司 可根據客戶需求提供解決方案,定制產品。 QQ咨詢:208
    發表于 12-22 14:33

    Flex Power Modules將產品制造擴展至歐洲

    Flex Power Modules已將其產品制造擴展到歐洲,在奧地利阿爾特霍芬的Flex工廠設立新的生產基地。此舉將提高Flex Power Modules的電源模塊產能,助力其更快速、更高效地響應AI數據中心客戶快速增長的需
    的頭像 發表于 12-16 13:51 ?628次閱讀

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業制造領域 復雜缺陷檢測:處理傳統算法難以描述的非標準化缺陷模式 非標產品分類:對形狀、顏色、紋理多變的產品進行智能分類 外觀質量評估:基于學習的外觀質量標準判定 精密
    的頭像 發表于 11-27 10:19 ?222次閱讀

    DRAM和SRAM、SDRAM相比有什么特點?

    DRAM利用電容存儲數據,由于電容存在漏電現象,必須通過周期性刷新來維持數據。此外,DRAM采用行列地址復用設計,提高了存儲密度,但增加了控制復雜性。廣泛用于大容量、低成本存儲場景,如計算機內存。
    的頭像 發表于 11-18 11:49 ?715次閱讀

    PSRAM融合SRAM與DRAM優勢的存儲解決方案

    PSRAM(偽靜態隨機存儲器)是一種兼具SRAM接口協議與DRAM內核架構的特殊存儲器。既保留了SRAM無需復雜刷新控制的易用特性,又繼承DRAM的高密度低成本優勢。這種獨特的設計
    的頭像 發表于 11-11 11:39 ?745次閱讀

    如何在機器視覺中部署深度學習神經網絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視該技術為機器視覺(乃至生產自動化)帶來的潛力,因為深度學習并非只屬于計算機科學家或程序員。 從頭開始:什么
    的頭像 發表于 09-10 17:38 ?902次閱讀
    如何在機器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b>神經網絡

    深度學習對工業物聯網有哪些幫助

    深度學習作為人工智能的核心分支,通過模擬人腦神經網絡的層級結構,能夠自動從海量工業數據中提取復雜特征,為工業物聯網(IIoT)提供從數據感知到智能決策的全鏈路升級能力。以下從技術賦能、場景突破
    的頭像 發表于 08-20 14:56 ?1030次閱讀

    自動駕駛中Transformer大模型會取代深度學習嗎?

    [首發于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領域的驚艷表現,“Transformer架構是否正在取代傳統深度學習”這一話題一直被
    的頭像 發表于 08-13 09:15 ?4186次閱讀
    自動駕駛中Transformer大模型會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    嵌入式AI技術之深度學習:數據樣本預處理過程中使用合適的特征變換對深度學習的意義

    ? 作者:蘇勇Andrew 使用神經網絡實現機器學習,網絡的每個層都將對輸入的數據做一次抽象,多層神經網絡構成深度學習的框架,可以深度理解數據中所要表示的規律。從原理上看,使用
    的頭像 發表于 04-02 18:21 ?1519次閱讀

    如何使用flex-builder構建aruco庫?

    我正在嘗試構建 libopencv-aruco,通常附帶新版本的 OpenCV。當我運行 bld -c opencv 時,我沒有看到正在構建此庫。 誰能提供一些關于如何使用 flex-builder 構建 aruco 庫的指導?
    發表于 03-31 06:13

    用樹莓派搞深度學習?TensorFlow啟動!

    介紹本頁面將指導您在搭載64位Bullseye操作系統的RaspberryPi4上安裝TensorFlow。TensorFlow是一個專為深度學習開發的大型軟件庫,消耗大量資源。您可以在
    的頭像 發表于 03-25 09:33 ?1210次閱讀
    用樹莓派搞<b class='flag-5'>深度</b><b class='flag-5'>學習</b>?TensorFlow啟動!