国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺論深層卷積神經網絡的剪枝優化

電子工程師 ? 來源:電子技術應用第12期 ? 作者:馬治楠 韓云杰 彭 ? 2021-04-28 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要: 隨著近幾年來深度學習的興起,其在目標檢測、圖像分類、語音識別、自然語言處理等機器學習領域都取得了重大的突破,其中以卷積神經網絡在深度學習中的運用較多。自VGGNet出現以來,深度學習逐漸向深層的網絡發展,網絡越來越深,這不僅增大了對硬件平臺存儲、運行內存的需求,還大大增加了計算量,對硬件平臺資源的要求越來越高。

因此將深度學習應用于嵌入式平臺尤為困難。對此,通過對模型進行剪枝的方法將訓練好的網絡模型壓縮處理,在基本保證準確率的情況下去除不重要的參數,縮減模型,減小網絡的計算復雜度,將深度學習應用于嵌入式平臺。

0 引言

深度學習起源于人工神經網絡,后來LECUN Y提出了卷積神經網絡LeNet-5[1],用于手寫數字識別,并取得了較好的成績,但當時并沒有引起人們足夠的注意。隨后BP算法被指出梯度消失的問題,當網絡反向傳播時,誤差梯度傳遞到前面的網絡層基本接近于0,導致無法進行有效的學習。

2006年HINTON G E提出多隱層的網絡可以通過逐層預訓練來克服深層神經網絡在訓練上的困難[2],隨后深度學習迎來了高速發展期。一些新型的網絡結構不斷被提出(如AlexNet、VGGNet、GoogleNet、ResNet等),網絡結構不斷被優化,性能不斷提升,用于圖像識別可以達到很好的效果。然而這些網絡大都具有更多的網絡層,對計算機處理圖像的能力要求很高,需要更多的計算資源,一般使用較好的GPU來提高訓練速度,不利于在硬件資源(內存、處理器、存儲)較低的設備運行,具有局限性。

深度學習發展到目前階段,其研究大體可以分為兩個方向:(1)設計復雜的網絡結構,提高網絡的性能;(2)對網絡模型進行壓縮,減少計算復雜度。在本文將討論第二種情況,去除模型中冗余的參數,減少計算量,提高程序運行速度。

目前很多網絡都具有更復雜的架構設計,這就造成網絡模型中存在很多的參數冗余,增加了計算復雜度,造成不必要的計算資源浪費。模型壓縮大體有以下幾個研究方向:(1)設計更為精細的網絡結構,讓網絡的性能更為簡潔高效,如MobileNet網絡[3];(2)對模型進行裁剪,越是結構復雜的網絡越存在大量參數冗余,因此可以尋找一種有效的評判方法,對訓練好的模型進行裁剪;

(3)為了保持數據的精度,一般常見的網絡模型的權重,通常將其保存為32 bit長度的浮點類型,這就大大增加了數據的存儲和計算復雜度。因此,可以將數據進行量化,或者對數據二值化,通過數據的量化或二值化從而大大降低數據的存儲。除此之外,還可以對卷積核進行核的稀疏化,將卷積核的一部分誘導為0,從而減少計算量[4]。

本文著重討論第二種方法,對模型的剪枝,通過對無用權重參數的裁剪,減少計算量。

1 CNN卷積神經網絡

卷積神經網絡是一種前饋式網絡,網絡結構由卷積層、池化層、全連接層組成[5]。卷積層的作用是從輸入層提取特征圖,給定訓練集:

6368160324185828021761918.gif

在卷積層后面一般會加一個池化層,池化又稱為降采樣,池化層可以用來降低輸入矩陣的緯度,而保存顯著的特征,池化分為最大池化和平均池化,最大池化即給出相鄰矩陣區域的最大值。池化層具有減小網絡規模和參數冗余的作用。

2 卷積神經網絡剪枝

6368160326517124681388836.gif

6368160328756254815269472.gif

2.1 模型壓縮的方法

本文用以下方法修剪模型:(1)首先使用遷移學習的方法對網絡訓練,然后對網絡進行微調,使網絡收斂并達到最優,保存模型;(2)對保存的模型進行修剪,并再次訓練,對修剪后的模型參數通過訓練進行微調,如此反復進行,直到檢測不到可供裁剪的卷積核;(3)對上一步裁剪后的模型再次訓練,直到訓練的次數達到設定的標準為止。具體的流程如圖2所示。

6368160330249990105358372.gif

上述的處理流程比較簡單,重點是如何評判網絡模型中神經元的重要性。本文用價值函數C(W)作為評判重要性的工具。對于數據集D,經訓練后得到網絡模型Model,其中的權重參數為:

6368160333748393145490252.gif

6368160334423386497570206.gif

2.2 參數評估

網絡參數的評估在模型壓縮中有著非常重要的作用。一般采用下面的這種方法,通過比較權重參數的l2范數的大小,刪除l2范數較小的卷積核[8]。除此之外,還可以通過激活驗證的方法對參數進行評判,將數據集通過網絡前向傳播,對于某個網絡節點,若有大量通過激活函數后的數值為0或者小于一定的閾值,則將其舍去。

2.2.1 最小化l2范數

6368160338676043048249929.gif

3 實驗結果

3.1 訓練和剪枝結果

本設計在Ubuntu16.04系統,搭載1080Ti顯卡的高性能服務器上進行實驗,使用Pytorch深度學習框架進行訓練和測試。本設計使用VGG16網絡,對16類常見的路面障礙物圖片進行訓練,其中數據集中的訓練集有24 000張圖片,訓練集12 000張圖片。在VGG16網絡中有16個卷積網絡層,共4 224個卷積核。采用遷移學習的方法對其進行訓練,設置epoch為30,訓練的結果如圖3所示。

6368160341543245505133610.gif

圖3縱軸表示訓練的準確率,橫軸表示迭代次數,最后的訓練準確率為97.97%。

將上面的訓練參數保存為模型,對其進行剪枝,分5次對其修剪,首先會根據l2范數最小值篩選出要修剪的網絡層中的卷積核,每次去除512個卷積核,修剪后模型中剩余的卷積核數量如圖4所示。

6368160344351030337201847.gif

圖4中縱軸表示模型中保留的卷積核的數量,從最初的4 224降到1 664,裁剪率達到60.6%。5次迭代修剪后的準確率如圖5所示。

6368160346057263738960776.gif

對修剪后的網絡重新訓練得到最終的修剪模型,訓練過程如圖6所示。

6368160347963495239166655.gif

最后達到98.7%的準確率。剪枝前模型大小為512 MB,剪枝后模型可以縮小到162 MB,將模型的內存占用降低了68.35%。

3.2 嵌入式平臺下的移植測試

在嵌入式平臺樹莓派3代B型上移植Pytorch框架,樹莓派3b擁有1.2 GHz的四核BCM2837 64位ARM A53處理器,1 GB運行內存,板載BCM43143WiFi。由于樹莓派運行內存有限,故增加2 GB的swap虛擬內存,用于編譯Pytorch框架源碼。將在GPU服務器上訓練好的網絡模型移植到嵌入式平臺,對其進行測試。

對123張測試圖片進行檢測分類,載入裁剪前的原始模型,用時109.47 s,準確率為95.08%。載入剪枝后的模型,同樣對123張圖片進行測試,用時41.85 s,準確率達到96.72%。結果如圖7所示,可以看到對模型裁剪后時間上減少了61%,速度有了很大提升。

6368160351333774869500050.gif

4 結論

目前深度學習是一個熱門的研究方向,在圖像檢測、分類、語音識別等方面取得了前所未有的成功,但這些依賴于高性能高配置的計算機,也出現了各種深度學習框架以及網絡模型,但是可以預見深度學習即將邁入一個發展平緩期,如果不能有一個寬闊的應用領域,深度學習的發展將很快被擱淺。誠然,將其應用于嵌入式平臺將會是一個非常好的發展方向。相信未來深度學習在嵌入式領域會有一個更大的突破,部署于移動平臺將不再是一個難題。

作者:馬治楠 韓云杰 彭琳鈺 周進凡 林付春 劉宇紅

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4798

    瀏覽量

    90084
  • 函數
    +關注

    關注

    3

    文章

    4417

    瀏覽量

    67554
  • 卷積神經網絡

    關注

    4

    文章

    372

    瀏覽量

    12878
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經網絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經網絡的實現。什么是神經網絡神經網絡的核心思想是模仿生物神經系統的結構,特別是大腦中神經
    的頭像 發表于 12-17 15:05 ?338次閱讀
    <b class='flag-5'>神經網絡</b>的初步認識

    自動駕駛中常提的卷積神經網絡是個啥?

    在自動駕駛領域,經常會聽到卷積神經網絡技術。卷積神經網絡,簡稱為CNN,是一種專門用來處理網格狀數據(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像
    的頭像 發表于 11-19 18:15 ?2086次閱讀
    自動駕駛中常提的<b class='flag-5'>卷積</b><b class='flag-5'>神經網絡</b>是個啥?

    CNN卷積神經網絡設計原理及在MCU200T上仿真測試

    數的提出很大程度的解決了BP算法在優化深層神經網絡時的梯度耗散問題。當x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當x&lt;0 時,該層的輸出為0。 CNN
    發表于 10-29 07:49

    NMSIS神經網絡庫使用介紹

    :   神經網絡卷積函數   神經網絡激活函數   全連接層函數   神經網絡池化函數   Softmax 函數   神經網絡支持功能
    發表于 10-29 06:08

    構建CNN網絡模型并優化的一般化建議

    通過實踐,本文總結了構建CNN網絡模型并優化的一般化建議,這些建議將會在構建高準確率輕量級CNN神經網絡模型方面提供幫助。 1)避免單層神經網絡:我們清楚
    發表于 10-28 08:02

    卷積運算分析

    的數據,故設計了ConvUnit模塊實現單個感受域規模的卷積運算. 卷積運算:不同于數學當中提及到的卷積概念,CNN神經網絡中的卷積嚴格意義
    發表于 10-28 07:31

    在Ubuntu20.04系統中訓練神經網絡模型的一些經驗

    , batch_size=512, epochs=20)總結 這個核心算法中的卷積神經網絡結構和訓練過程,是用來對MNIST手寫數字圖像進行分類的。模型將圖像作為輸入,通過卷積和池化層提取圖像的特征,然后通過全連接層進行分類預
    發表于 10-22 07:03

    CICC2033神經網絡部署相關操作

    讀取。接下來需要使用擴展指令,完成神經網絡的部署,此處僅對第一層卷積+池化的部署進行說明,其余層與之類似。 1.使用 Custom_Dtrans 指令,將權重數據、輸入數據導入硬件加速器內。對于權重
    發表于 10-20 08:00

    液態神經網絡(LNN):時間連續性與動態適應性的神經網絡

    1.算法簡介液態神經網絡(LiquidNeuralNetworks,LNN)是一種新型的神經網絡架構,其設計理念借鑒自生物神經系統,特別是秀麗隱桿線蟲的神經結構,盡管這種微生物的
    的頭像 發表于 09-28 10:03 ?1248次閱讀
    液態<b class='flag-5'>神經網絡</b>(LNN):時間連續性與動態適應性的<b class='flag-5'>神經網絡</b>

    神經網絡的并行計算與加速技術

    隨著人工智能技術的飛速發展,神經網絡在眾多領域展現出了巨大的潛力和廣泛的應用前景。然而,神經網絡模型的復雜度和規模也在不斷增加,這使得傳統的串行計算方式面臨著巨大的挑戰,如計算速度慢、訓練時間長等
    的頭像 發表于 09-17 13:31 ?1143次閱讀
    <b class='flag-5'>神經網絡</b>的并行計算與加速技術

    卷積神經網絡如何監測皮帶堵料情況 #人工智能

    卷積神經網絡
    jf_60804796
    發布于 :2025年07月01日 17:08:42

    無刷電機小波神經網絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建了一個以三相相電壓為輸人,轉角為輸出的小波神經網絡來實現轉角預測,并采用改進遺傳算法來訓練網絡結構與參數,借助
    發表于 06-25 13:06

    神經網絡專家系統在電機故障診斷中的應用

    摘要:針對傳統專家系統不能進行自學習、自適應的問題,本文提出了基于種經網絡專家系統的并步電機故障診斷方法。本文將小波神經網絡和專家系統相結合,充分發揮了二者故障診斷的優點,很大程度上降低了對電機
    發表于 06-16 22:09

    基于FPGA搭建神經網絡的步驟解析

    本文的目的是在一個神經網絡已經通過python或者MATLAB訓練好的神經網絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe文件,(coe
    的頭像 發表于 06-03 15:51 ?1240次閱讀
    基于FPGA搭建<b class='flag-5'>神經網絡</b>的步驟解析

    自動駕駛感知系統中卷積神經網絡原理的疑點分析

    背景 卷積神經網絡(Convolutional Neural Networks, CNN)的核心技術主要包括以下幾個方面:局部連接、權值共享、多卷積核以及池化。這些技術共同作用,使得CNN在圖像
    的頭像 發表于 04-07 09:15 ?859次閱讀
    自動駕駛感知系統中<b class='flag-5'>卷積</b><b class='flag-5'>神經網絡</b>原理的疑點分析