伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習推斷應用為什么應該考慮專用硬件?

YCqV_FPGA_EETre ? 來源:賽靈思 ? 作者:Quenton Hall ? 2021-03-10 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2014 年,斯坦福大學教授 Mark Horowitz 發表了一篇題目為“計算的能源問題(以及我們該怎么辦)”的論文。這篇具有深遠意義的論文,討論了當前半導體行業所面臨的最熱門的、與登納德縮放比例定律 (Dennard Scaling )和摩爾定律 (Moore’s Law) 失效相關的挑戰。

如果可以的話,我想借用并改編一下 Mark 的論文標題,這樣我就可以就機器學習推斷應用為什么應該考慮專用硬件,分享一下我的一些觀點。

專用硬件加速實在必行

首先,讓我們考慮一下問題的癥結所在。大約在2005 年,處理器內核時鐘頻率的增長進入了瓶頸??s小工藝尺寸和降低內核電壓不再像以前一樣能夠為我們帶來優勢。其根本的問題,就是計算已經達到了功率密度(W/mm2)的極限。

如果我們在同一個裸片上放置更多的內核,我們就可以在相同的功耗預算下增加運算數量,但其前提是我們還還要在一定程度上降低時鐘頻率,以抵消額外內核所消耗的能量。AMD英特爾都是在 2005-2006 年期間發布了他們的首個雙核處理器,這并不是巧合。然而,隨著我們繼續嘗試增加內核的數量,我們必須考慮每個運算所消耗的能量和每個運算所需的芯片面積。此外,我們還需要確保我們能夠通過 N 來有效地實現并行算法,其中 N 是內核的數量。對于所有的算法來說,這一問題的通用解決方案,或者說“計算飽和的靈丹妙藥”仍然是一個難以捉摸的問題,現在最好的解決方法就是應用“自適應硬件”。

事實證明,無論您的處理器設計是使用多核 CPUGPU 還是 SoC 實現的,在處理器級的總體功耗分布都將大致相同。

所以假若我們估算出以下的情況便較為接近真實情況:

內核 = 30%

內部存儲器(L1、L2、L3)= 30%

外部存儲器(DDR)= 40%

在上面的分析中,我們沒有考慮的是還存在另外一個總體優化的方式,那就是專用硬件加速器優化的實現方式。我們可以對專用硬件進行優化以極高效地執行特定的功能。通常情況下,這種硬件是為了減少外部存儲器訪問而設計的,其同時減少了時延與功耗。我們可以對專用硬件進行優化,以便給定算法的數據運動部分使用本地化存儲器 (BlockRAM、UltraRAM) 來進行中間結果的存儲。

設計高效的加速器是多維度的設計問題:

我們如何實現硬件優化來處理我們的特定算法?(Mark 很好地回答了這一問題,即必須將算法從“所有算法的空間”移動到“受限空間”。)

我們如何保持攜帶數據的加速器,以確保我們的計算加速器在每個時鐘周期都是飽和的?

我們如何最大限度地減少通信開銷?

我們如何優化正在處理的運算符的動態范圍?

我們如何最大限度地減少外部存儲器,甚至是本地存儲器的使用?

我們如何消除指令處理管道開銷?

我們如何安排操作以確保數據重用,從而使存儲器流量最小化,并且使存儲器訪問相關的運算數量最大化?

自適應硬件的戰略優勢這里,我們將討論和評估賽靈思的自適應硬件及 DNNDK 如何應對上述這些尖銳的問題和挑戰,特別是當它涉及到機器學習推斷時。在進行下一次設計之前,我建議您回顧一下 Mark 有關這個主題的精彩演講,然后再考慮如何在您的下一次設計中使用自適應硬件來實現您的戰略優勢。

在這篇文章的第 2 部分中,我們將討論和評估賽靈思的自適應硬件及 DNNDK (現在已經發布Vitis AI 統一軟件平臺) 如何應對這些挑戰,特別是當它涉及到機器學習推斷時。

原文標題:人工智能引發能源問題,我們該怎么辦?(一)

文章出處:【微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40316

    瀏覽量

    301887
  • 人工智能
    +關注

    關注

    1819

    文章

    50170

    瀏覽量

    266049

原文標題:人工智能引發能源問題,我們該怎么辦?(一)

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能與機器學習在這些行業的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業賦予了競爭優勢,而在線行業正是受其影響最為顯著的領域。人工智能(AI)與機器學習
    的頭像 發表于 02-04 14:44 ?569次閱讀

    SWD端口復用為GPIO功能

    使用庫函數把SWD下載端口PA13 PA14 分別復用為UART0_RXD UART0_TXD的方法 SWD一般用于MCU的調試,用戶使用Keil MDK或IAR等開發工具時,可使用該調試接口進行
    發表于 01-29 06:56

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?256次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    NPB 2.0:網絡可視化告別“專用硬件”?

    傳統的基于專用硬件的實現方案,例如使用TAP交換機/分流器等采集設備,其初期購置和維護成本顯而易見,并且隨著網絡規模的擴大,采購和運維費用都將繼續增長。NPB 2.0是基于 SONiC 的開放網絡技術棧的前沿實踐。
    的頭像 發表于 11-24 16:45 ?1631次閱讀
    NPB 2.0:網絡可視化告別“<b class='flag-5'>專用</b><b class='flag-5'>硬件</b>”?

    risc-v中浮點運算單元的使用及其設計考慮

    RISC-V浮點運算單元(floating-point unit,簡稱FPU)是一種專門用于執行浮點運算的硬件加速器,其作用是提高浮點運算速度,在科學計算、圖像處理和機器學習等應用領域有著廣泛
    發表于 10-21 14:46

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2967次閱讀

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發展離不開高性能計算硬件的支持,而傳統CPU由于架構限制,難以高效處理AI任務中的大規模并行計算需求。因此,專為AI優化的芯片應運而生,成為推動深度學習、計算機視覺、自然語言
    的頭像 發表于 07-09 15:59 ?1757次閱讀

    大模型在半導體行業的應用可行性分析

    的應用,比如使用機器學習分析數據,提升良率。 這一些大模型是否真的有幫助 能夠在解決工程師的知識斷層問題 本人純小白,不知道如何涉足這方面 應該問什么大模型比較好,或者是看什么視頻能夠涉足這個行業
    發表于 06-24 15:10

    電子硬件工程師如何從零開始學習?(文末免費分享從零開始學習資料)

    經常有用戶咨詢,如何學習和提升電子硬件能力,有沒有適合小白學習的資料等等;電子硬件工程師是一個結合理論、實踐和創新能力的職業,需要掌握電路設計、元器件選型、PCB設計、嵌入式系統、測試
    的頭像 發表于 06-04 07:36 ?2384次閱讀
    電子<b class='flag-5'>硬件</b>工程師如何從零開始<b class='flag-5'>學習</b>?(文末免費分享從零開始<b class='flag-5'>學習</b>資料)

    使用MATLAB進行無監督學習

    無監督學習是一種根據未標注數據進行推斷機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?1507次閱讀
    使用MATLAB進行無監督<b class='flag-5'>學習</b>

    硬件原理圖學習筆記

    這一個星期認真學習硬件原理圖的知識,做了一些筆記,方便以后查找。硬件原理圖分為三類1.管腳類(gpio)和門電路類輸入輸出引腳,上拉電阻,三極管與門,或門,非門上拉電阻:正向標志作用,給懸空的引腳
    的頭像 發表于 04-30 18:40 ?1513次閱讀
    <b class='flag-5'>硬件</b>原理圖<b class='flag-5'>學習</b>筆記

    全志科技機器專用芯片MR527與MR813特性概述

    全志科技機器專用芯片MR527是八核高性能機器專用芯片; MR527系列芯片集成了8核Arm??Cortex?-A55 CPU、NPU、-GPU、MCU等多個高性能計算單元,具有強
    的頭像 發表于 04-24 14:58 ?3970次閱讀
    全志科技<b class='flag-5'>機器</b>人<b class='flag-5'>專用</b>芯片MR527與MR813特性概述

    硬件工程師學習路線,不吹牛規劃

    心理,才能觸發你的好奇心,去學下去,這也是成為工程師的首要條件,但這是遠遠不夠,還需要一條可供參考的學習路線,再加上99%的汗水和1%的靈感才可以。硬件設計,可以
    的頭像 發表于 04-16 19:33 ?2006次閱讀
    <b class='flag-5'>硬件</b>工程師<b class='flag-5'>學習</b>路線,不吹牛規劃

    擁有一顆熱愛學習硬件開發的決心!

    有沒有大佬能教教硬件開發設計和pcb,目前轉行在,想學習硬件工程師這塊!
    發表于 04-02 14:46

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    和更多外設接口。無論是運行還是休眠狀態,功耗表現都非常出色! 3. 在傳感器數據采集與AI機器學習中的優勢? 答:主頻高、功耗低,內置專用核處理數據采集,還配備AI加速器,讓AI算法運行更高效! 4.
    發表于 04-01 00:00