国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

經典圖像分類算法AlexNet介紹

新機器視覺 ? 來源:智能計算系統 ? 作者:智能計算系統 ? 2022-04-06 14:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本期開小灶Heyro將帶領大家進入下一趟旅程——基于卷積神經網絡的圖像分類算法講解,從而幫助大家了解在卷積神經網絡結構下衍生出的被用于圖像分類的經典算法。

在了解圖像分類算法以前,我們先來了解“何為圖像分類”。

圖像分類的核心是從給定的分類集合中給圖像分配一個標簽的任務。簡言之,我們需要對一個輸入圖像進行分析后返回一個對應的分類標簽,標簽來自預先定義的可能類別集。圖像分類的任務即為正確給出輸入圖像的類別或輸出不同類別的概率。例如,我們先假設一個含有可能類別的類別集:

Categories = {cat, dog, fox}

然后,我們向分類系統提供一張狐貍犬的圖片。

經過分類系統的處理,最終輸出可以是單一標簽dog,也可以是基于概率的多個標簽,例如cat:1%, dog:94%,fox:5% 。

計算機并不能像人類一樣快速通過視覺系統識別出圖像信息的語義。對于計算機而言,RGB圖像是由一個個像素數值構成的高維矩陣(張量)。計算機識別圖像的任務即尋找一個函數關系,該函數可將高維矩陣信息映射到一個具體的類別標簽中。利用計算機實現圖像分類目的過程隨即衍生出圖像分類算法。

圖像分類算法的起源——神經認知機

傳統的圖像識別模型一般包括:底層特征學習>特征編碼>空間約束>分類器設計>模型融合等幾個流程。

2012年Alex Krizhevsky提出的CNN(卷積神經網絡)模型在ImageNet大規模視覺識別比賽(ILSVRC)中脫穎而出,其效果大大超越了傳統的圖像識別方法,該模型被稱為AlexNet。

基于卷積神經網絡的圖像分類算法起源最早可追溯到日本學者福島邦彥提出的neocognition(神經認知機)神經網絡模型。

福島邦彥于1978年至1984年研制了用于手寫字母識別的多層自組織神經網絡——認知機。福島邦彥在認知機中引入了最大值檢出等概念。簡言之,當網格中某種神經元損壞時,該神經元立即可由其他神經元來代替。由此一來,認知機就具有較好的容錯能力。

但是,認知機的網絡較為復雜,它對輸入的大小變換及平移、旋轉等變化并不敏感。雖然它能夠識別復雜的文字,但卻需要大量的處理單元和連接,這使得其硬件實現較為困難。

而福島邦彥在1980年提出的“神經認知機”神經網絡模型卻能夠很好地應對以上問題。

該模型借鑒了生物的視覺神經系統。它對模式信號的識別優于認知機。無論輸入信號發生變換、失真,抑或被改變大小等,神經認知機都能對輸入信號進行處理。但是,該模型被提出后一直未受到較大關注,直至AlexNet在ILSVRC中大獲全勝,卷積神經網絡的潛力才為業界所認知。

深度學習算法

自AlexNet之后,深度學習的發展極為迅速,網絡深度也在不斷地快速增長,隨后出現了VGG(19層)、GoogleNet(22層)、ResNet(152層),以及SENet(252層)等深度學習算法。

隨著模型深度和結構設計的發展,ImageNet分類的Top-5錯誤率也越來越低。在ImageNet上1000種物體的分類中,ResNet的Top-5錯誤率僅為3.57%。在同樣的數據集上,人眼的識別錯誤率約為5.1%,換言之,目前深度學習模型的識別能力已經超過了人眼。

在卷積神經網絡的歷史上,比較有里程碑意義的算法包括AlexNet、VGG、Inception (GoogleNet是Inception系列中的一員),以及ResNet。

在本期開小灶中,我們將首先為大家介紹經典圖像分類算法AlexNet。

AlexNet 網絡結構

作為G. Hinton代表作的AlexNet是深度學習領域最重要的成果之一。下面讓我們一起從左到右依次認識這個結構。

在AlexNet網絡結構(如下圖所示)中,輸入為一個224×224大小的RGB圖像。

經典圖像分類算法AlexNet介紹

AlexNet網絡結構

第一層卷積,用48個11×11×3的卷積核計算出48個55×55大小的特征圖,用另外48個11×11×3的卷積核計算出另外48個55×55大小的特征圖,這兩個分支的卷積步長都是4,通過卷積把圖像的大小從224′224減小為55×55。第一層卷積之后,進行局部響應歸一化 (LRN) 以及步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為27×27。

第二層卷積,用兩組各128個5×5×48的卷積核對兩組輸入的特征圖分別進行卷積處理,輸出兩組各128個27×27的特征圖。第二層卷積之后,做局部響應歸一化和步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為13×13。

第三層卷積,將兩組特征圖合為一組。采用192個3×3×256的卷積核對所有輸入特征圖做卷積運算,再用另外192個3×3×256的卷積核對所有輸入特征圖做卷積運算,輸出兩組各192個13×13的特征圖。

第四層卷積,對兩組輸入特征圖分別用192個3×3×192的卷積核做卷積運算。

第五層卷積,對兩組輸入特征圖分別用128個3×3×192的卷積核做卷積運算。第五層卷積之后,做步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為6×6。

第六層和第七層的全連接層都有兩組神經元(每組2048個神經元)。

第八層的全連接層輸出1000種特征并送到softmax中,softmax輸出分類的概率。

AlexNet 技術創新點

相較于傳統人工神經網絡而言,AlexNet的技術創新體現在四個方面。

其一為Dropout(隨機失活)。Dropout于2012年由G. Hinton等人提出。該方法通過隨機舍棄部分隱層節點來緩解過擬合。目前,Dropout已經成為深度學習訓練常用的技巧之一。

使用Dropout進行模型訓練的過程為:a. 以一定概率隨機舍棄部分隱層神經元,即將這些神經元的輸出設置為0;b.一小批訓練樣本經過正向傳播后,在反向傳播更新權重時不更新其中與被舍棄神經元相連的權重;c. 恢復被刪除神經元,并輸入另一小批訓練樣本;d. 重復步驟a ~ c ,直到處理完所有訓練樣本。

其二為LRN(局部響應歸一化)。LRN對同一層的多個輸入特征圖在每個位置上做局部歸一化,從而提升高響應特征并抑制低響應特征。LRN的輸入是卷積層輸出特征圖經過ReLU激活函數后的輸出。但近年來業界發現LRN層作用有限,因此目前使用LRN的研究并不多。

其三是Max Pooling(最大池化)。最大池化可以避免特征被平均池化模糊,從而提高特征的魯棒性。在AlexNet之前,很多研究用平均池化;從AlexNet開始,業界公認最大池化的效果比較好。

其四是ReLU激活函數。在AlexNet之前,常用的激活函數是sigmoid和tanh。而ReLU函數很簡單,我們在之前的開小灶中為大家講解過ReLU激活函數的特征,即輸入小于0時輸出0,輸入大于0時輸出等于輸入。看似非常簡單的ReLU函數卻在訓練時帶來了非常好的效果,這是業界在AlexNet之前未曾料想到的。AlexNet在卷積層和全連接層的輸出均使用ReLU激活函數,從而有效提高訓練時的收斂速度。

AlexNet通過把看似平凡的技術組合起來取得了驚人的顯著效果。

正是由于AlexNet采用了深層神經網絡的訓練思路,并輔以ReLU函數、Dropout及數據擴充等操作,使得圖像識別真正走向了與深度學習結合發展的方向。

原文標題:基于卷積神經網絡的圖像分類算法講解

文章出處:【微信公眾號:機器視覺智能檢測】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107753
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98042

原文標題:基于卷積神經網絡的圖像分類算法講解

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    圖像采集卡分類、接口與性能指標詳解

    圖像采集卡是機器視覺、工業檢測、安防監控、醫療影像等領域的核心硬件,核心作用是將相機等圖像源輸出的模擬/數字信號轉化為計算機可識別、處理的數字圖像數據,同時完成信號同步、緩存、傳輸等關鍵操作,其
    的頭像 發表于 01-29 16:55 ?457次閱讀
    <b class='flag-5'>圖像</b>采集卡<b class='flag-5'>分類</b>、接口與性能指標詳解

    PID控制的算法

    當中,PID控制算法又是最簡單,最能體現反饋思想的控制算法,可謂經典中的經典經典的未必是復雜的,經典
    發表于 01-23 08:18

    基于級聯分類器的人臉檢測基本原理

    本次分享的內容是基于級聯分類器的人臉檢測基本原理 1) 人臉檢測概述 關于人臉檢測算法,目前主流方法分為兩類,一類是基于知識,主要方法包括模板匹配,人臉特征,形狀和邊緣,紋理特征,顏色特征
    發表于 10-30 06:14

    AES加解密算法邏輯實現及其在蜂鳥E203SoC上的應用介紹

    這次分享我們會簡要介紹AES加解密算法的邏輯實現,以及如何將AES算法做成硬件協處理器集成在蜂鳥E203 SoC上。 AES算法介紹 AE
    發表于 10-29 07:29

    使用Otsu閾值算法將灰度圖像二值化

    Otsu 算法是由日本學者OTSU于1979年提出的一種對圖像進行二值化的高效算法,又稱“最大類間方差法”。當我們對一個圖象進行二值化操作的時候,需要根據一項灰度閾值來判決每個像素點應該被視作純黑
    發表于 10-28 06:49

    國密系列算法簡介及SM4算法原理介紹

    一、 國密系列算法簡介 國家商用密碼算法(簡稱國密/商密算法),是由我國國家密碼管理局制定并公布的密碼算法標準。其分類1所示: 圖1
    發表于 10-24 08:25

    加密算法的應用

    加密是一種保護信息安全的重要手段,近年來隨著信息技術的發展,加密技術的應用越來越廣泛。本文將介紹加密算法的發展、含義、分類及應用場景。 1. 加密算法的發展 加密
    發表于 10-24 08:03

    基于FPGA的CLAHE圖像增強算法設計

    CLAHE圖像增強算法又稱為對比度有限的自適應直方圖均衡算法,其算法原理是通過有限的調整圖像局部對比度來增強有效信號和抑制噪聲信號。
    的頭像 發表于 10-15 10:14 ?649次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b>增強<b class='flag-5'>算法</b>設計

    迅為iTOP-RK3568人工智能開發板mobilenet圖像分類模型推理測試

    想快速驗證MobileNet圖像分類模型的實際運行效果?迅為iTOP-RK3568人工智能開發板,讓模型推理測試高效又省心。
    的頭像 發表于 08-28 15:53 ?1430次閱讀
    迅為iTOP-RK3568人工智能開發板mobilenet<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>模型推理測試

    基于FPGA的SSD目標檢測算法設計

    。有名的LeNet-5手寫數字識別網絡,精度達到99%,AlexNet模型和VGG-16模型的提出突破了傳統圖像識別算法,GooLeNet和ResNet推動了卷積神經網絡的應用。
    的頭像 發表于 07-10 11:12 ?2547次閱讀
    基于FPGA的SSD目標檢測<b class='flag-5'>算法</b>設計

    在友晶LabCloud平臺上使用PipeCNN實現ImageNet圖像分類

    利用深度卷積神經網絡(CNN)進行圖像分類是通過使用多個卷積層來從輸入數據中提取特征,最后通過分類層做決策來識別出目標物體。
    的頭像 發表于 04-23 09:42 ?1079次閱讀
    在友晶LabCloud平臺上使用PipeCNN實現ImageNet<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>

    基于RV1126開發板實現自學習圖像分類方案

    在RV1126開發板上實現自學習:在識別前對物體圖片進行模型學習,訓練完成后通過算法分類得出圖像的模型ID。 方案設計邏輯流程圖,方案代碼分為分為兩個業務流程,主體代碼負責抓取、合成
    的頭像 發表于 04-21 13:37 ?11次閱讀
    基于RV1126開發板實現自學習<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>方案

    基于RV1126開發板的resnet50訓練部署教程

    本教程基于圖像分類算法ResNet50的訓練和部署到EASY-EAI-Nano(RV1126)進行說明
    的頭像 發表于 04-18 15:07 ?1135次閱讀
    基于RV1126開發板的resnet50訓練部署教程

    基于衛星圖像的智能定位系統軟件

    基于衛星圖像的智能定位系統軟件是衛星導航、圖像處理與智能算法融合的前沿技術結晶,在高精度定位領域具有卓越表現。以下是對這類軟件的詳細介紹: 應用案例 目前,已有多個基于衛星
    的頭像 發表于 04-01 09:55 ?1023次閱讀

    處理合成孔徑雷達圖像的極坐標算法基礎

    電子發燒友網站提供《處理合成孔徑雷達圖像的極坐標算法基礎.pdf》資料免費下載
    發表于 03-06 17:59 ?0次下載