国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TPAMI 2023 | 用于視覺識別的相互對比學習在線知識蒸餾

智能感知與物聯網技術研究所 ? 來源:未知 ? 2023-09-19 10:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本次文章介紹我們于 TPAMI-2023 發表的一項用于視覺識別的相互對比學習在線知識蒸餾(Online Knowledge Distillation via Mutual Contrastive Learning for Visual Recognition)工作,該工作是我們發表在 AAAI-2022 論文 Mutual contrastive learning for visual representation learning [1] 的擴展版本,論文講解鏈接為:

https://zhuanlan.zhihu.com/p/574701719 摘要:無需教師的在線知識蒸餾聯合地訓練多個學生模型并且相互地蒸餾知識。雖然現有的在線知識蒸餾方法獲得了很好的性能,但是這些方法通常關注類別概率作為核心知識類型,忽略了有價值的特征表達信息。 本文展示了一個相互對比學習(Mutual Contrastive Learning,MCL)框架用于在線知識蒸餾。MCL 的核心思想是在一個網絡群體中利用在線的方式進行對比分布的交互和遷移。MCL 可以聚合跨網絡的嵌入向量信息,同時最大化兩個網絡互信息的下界。這種做法可以使得每一個網絡可以從其他網絡中學習到額外的對比知識,從而有利于學習到更好的特征表達,提升視覺識別任務的性能。 相比于會議版本,期刊版本將 MCL 擴展到中間特征層并且使用元優化來訓練自適應的層匹配機制。除了最后一層,MCL 也在中間層進行特征對比學習,因此新方法命名為 Layer-wise MCL(L-MCL)。在圖像分類和其他視覺識別任務上展示了 L-MCL 相比于先進在線知識蒸餾方法獲得了一致的提升。此優勢表明了 L-MCL 引導網絡產生了更好的特征表達。wKgZomUKAUeABfUfAAJfiDQnJmM755.png

論文地址:

https://arxiv.org/pdf/2207.11518.pdf

代碼地址:

https://github.com/winycg/L-MCL

wKgZomUKAUeAboOzAAAl6LOgh3c565.png

引言

傳統的離線知識蒸餾需要預訓練的教師模型對學生模型進行監督。在線知識蒸餾在無需教師的情況下同時聯合訓練兩個以上的學生模型。深度相互學習(Deep Mutual Learning,DML)[2]表明了模型群體可以從相互學習類別概率分布(圖像分類任務最后的輸出預測)中獲益。每一個模型在同伴教授的模式下相比傳統的單獨訓練效果更好。 現有的在線知識蒸餾方法通常僅僅關注結果驅動的蒸餾,但是忽略了在線蒸餾特征方面的應用。雖然先前的 AFD [3]嘗試通過在線的方式在多個網絡間對齊中間特征圖,Zhang 等人[2]指出這種做法會減少群體多樣性,降低相互學習能力。為了學習更有意義的特征嵌入,我們認為一個更好的方式是從視覺表征學習角度的對比學習。

wKgaomUOseuAHCKqAAM2USl54_8152.png

▲ 圖1. 相互對比學習基本思想示意圖 圖中, 分別表示兩個不同的網絡, 是推理來自網絡 和輸入樣本 產生的特征向量。虛線和箭頭代表要逼近或者遠離的方向。從圖中可以看出,MCL 包含了樸素對比學習(Vanilla Contrastive Learning,VCL)和交互式對比學習(Interactive Contrastive Learning,ICL)。 相比于傳統的 VCL,提出的 ICL 從兩個不同網絡間建模對比相似度分布。本文證明 ICL 的誤差函數等價于最大化兩個網絡互信息的下界,這可以被理解為一個網絡可以學習到另外網絡額外的知識。 MCL 主要是發表于 AAAI-2022 的方法,期刊版本將 MCL 從卷積網絡的最后一層擴展到多個模型的中間特征層,命名為 Layer-wise MCL。此外,傳統的中間特征層蒸餾使用手工的匹配,本文則提出一個自適應的層匹配機制,然后通過元優化來訓練該機制。

wKgZomUKAUiAUx54AAAuhh9-KLM583.png

方法

2.1. 相互對比學習MCL(AAAI-2022)

wKgaomUOsneANvyiAANja2j-FVo357.png

▲ 圖2. 相互對比學習整體示意圖

2.1.1 傳統對比學習(Vanilla Contrastive Learning,VCL) 為了便于描述,本方法將 anchor 樣本向量表示為 , 正樣本向量表示為 個負樣本向量表達 表示向量產生自網絡 。這里,特征向量通過 標準化進行預處理。使用基于 InfoNCE 的交叉熵作為對比誤差:wKgZomUKAUiAfLcVAABApOxJsHE674.png ?對于總共 個網絡來說,所有的對比誤差表示為:

wKgZomUKAUiAKCIQAAArDByt5ss241.png

2.1.2 交互式對比學習(Interactive Contrastive Learning,ICL) VCL 不能建模跨網絡的關系來進行聯合學習,因為對比分布來自于網絡自身的嵌入空間。ICL 的 anchor 樣本與對比樣本產生自不同的網絡,但在誤差形式上依舊與傳統的對比學習誤差相同:

wKgZomUKAUmAeXmWAABDzUNsmsE873.png

對于總共 個網絡來說,所有的對比誤差表示為:wKgZomUKAUmAHottAAA6ziYm6K4293.png理論分析: 相比于誤差 ,最小化 等價于最大化網絡 互信息 的下界:

wKgZomUKAUmAJPTeAAAyml4f5m0589.png

直覺上,當來自 的 anchor 特征向量已知時,互信息 衡量了來自 對比特征向量的不確定性,這可以理解為每一個網絡可以從其他網絡中學習到對比知識,從而更有利于表征學習。

2.1.3 基于在線相互遷移的軟對比學習 收到深度相互學習(Deep Mutual Learning,DML)[1] 的啟發,本方法利用 KL 散度來對齊網絡間的對比分布,根據本文提出的兩種對比學習方法 VCL 和 ICL 來進行對比分布的雙向遷移:

2.1.3.1 Soft VCL: 對于產生 的分布 來說,其監督信號是其他網絡產生的分利用 KL 散度使得 與其他分布接近:

wKgZomUKAUmATx-zAAA3kjsNkMY187.png

2.1.3.2 Soft ICL 給定兩個網絡 ,可以得到兩個ICL對應的對比分布 ,使用 KL 散度的形式使得兩個分布盡可能接近。對于 個網絡來說,每兩個網絡進行對比分布的遷移:

wKgZomUKAUmARWnNAAA9miXxmxg021.png

2.1.4 MCL的整體誤差 為了盡可能利用聯合學習的優勢,本方法將所有的對比誤差項作為一個整體的誤差訓練 個網絡:

wKgZomUKAUmAUCrKAABBz-kLkaA478.png

2.2 逐層的相互對比學習(Layer-wise MCL)

wKgZomUOspuAVn9JAAFqZvww3EU238.png

▲ 圖3. 一對一匹配和加權的多對多匹配示意圖 2.2.1 基礎框架 給定網絡群每一個網絡具有 個階段,原始的 MCL 在最后的特征嵌進行學習。Layer-wise MCL(L-MCL)進一步擴展相互對比學習到中間特征層和最后特征層,并且采用跨層的方式。wKgZomUKAUqAFi2ZAAA-leMt4VM032.png下一個章節,本文展示如何利用元網絡 來優化匹配權重

2.2.2 訓練元網絡 2.2.2.1 交叉熵任務誤差 使用交叉熵誤差訓練 個網絡:wKgZomUKAUqAcww5AABCUHA4NyM973.png ?將基礎的任務誤差和 L-MCL 誤差相加作為總誤差來進行特征層面的在線蒸餾誤差:

wKgZomUKAUqAcLFWAABDIeiIkp4346.png

2.2.2.2 元優化 受到元學習的啟發,本文采用交替優化的方式來訓練學生網絡和元網絡: (1)更新 次最小化 (2)更新 來一次最小化 (3)衡量 并且更新 來最小化它。

2.2.2.3 元網絡 結構元網絡包含了兩個線性轉換 來對輸入的特征向量 進行轉換。轉換之后,特征向量通過 正則化 來進行標準化。受到自注意力機制的啟發,本文利用點乘得到匹配特征的相似性,從而衡量匹配層的相關性,然后引入 sigmoid 激活函數 來將輸出值縮放到 作為層匹配權重 。整體的過程被規則化為:

wKgZomUKAUqAdFh7AABLnhROiyo613.png

wKgZomUKAUuAAB5HAAAtJ0fTuoM713.png

實驗

在 ImageNet 上的實驗結果如下所示,表 1 和表 2 分別展示了兩個同構和異構網絡利用相互對比學習的實驗結果。

wKgZomUKAUuAIbuWAAUoQv-V7W8394.png

▲ 表1. 兩個同構網絡利用相互對比學習的實驗結果wKgZomUKAUuAWyzaAAct8aoAeQw188.png▲表2. 兩個異構網絡利用相互對比學習的實驗結果 實驗結果表明本文提出的 L-MCL 相比于 baseline 以及先前流行的在線知識蒸餾方法都獲得了顯著的性能提升,表明在多個網絡之間使用特征層面的對比學習蒸餾相比概率分布效果更好。在下游的目標檢測和實例分割實驗上表明了該方法相比先前的蒸餾方法引導網絡學習到了更好的視覺表征,從而提升了視覺識別效果。

wKgZomUKAUyABytXAAD3uYhd4hI895.png

▲ 表3. 通過在線蒸餾的預訓練網絡遷移到下游的目標檢測和與實例分割的實驗

wKgZomUKAUyAHFsxAAAC0jQz1zo003.jpg

參考文獻

wKgZomUKAUyAHFsxAAAC0jQz1zo003.jpg ?[1] Yang C, An Z, Cai L, et al. Mutual contrastive learning for visual representation learning[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2022, 36(3): 3045-3053.[2] Zhang Y, Xiang T, Hospedales T M, et al. Deep mutual learning[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 4320-4328.[3] Chung I, Park S U, Kim J, et al. Feature-map-level online adversarial knowledge distillation[C]//International Conference on Machine Learning. PMLR, 2020: 2006-2015. ·


原文標題:TPAMI 2023 | 用于視覺識別的相互對比學習在線知識蒸餾

文章出處:【微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2945

    文章

    47818

    瀏覽量

    414831

原文標題:TPAMI 2023 | 用于視覺識別的相互對比學習在線知識蒸餾

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    友思特案例 | 金屬行業視覺檢測案例四:挖掘機鋼板表面光學字符識別(OCR)檢測

    在挖掘機鋼板表面光學字符識別(OCR)檢測中,通過實施友思特深度學習視覺檢測解決方案,解決了挖掘機零部件生產所用鋼板上標記識別的問題。這有助于防止材料分配錯誤,顯著提高了生產效率。
    的頭像 發表于 02-05 11:40 ?171次閱讀
    友思特案例 | 金屬行業<b class='flag-5'>視覺</b>檢測案例四:挖掘機鋼板表面光學字符<b class='flag-5'>識別</b>(OCR)檢測

    華秋輸出的GERBER別的軟件無法正確識別

    ,卡住了。 這個是華秋識別的,可以看到是正確的。 下面是AD,KICAD、工廠錫膏機識別的,都一樣的,統一少了太多東東。
    發表于 12-17 10:46

    電能質量在線監測裝置是如何實現對電壓中斷事件的識別的

    電能質量在線監測裝置對電壓中斷事件的識別,是基于 **“國標定義 + 高保真采樣 + 實時計算 + 多維度驗證”** 的閉環技術體系,核心目標是 “無漏判、無誤判”,精準捕捉符合 GB/T
    的頭像 發表于 11-27 16:32 ?1131次閱讀
    電能質量<b class='flag-5'>在線</b>監測裝置是如何實現對電壓中斷事件的<b class='flag-5'>識別的</b>?

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業制造領域 復雜缺陷檢測:處理傳統算法難以描述的非標準化缺陷模式 非標產品分類:對形狀、顏色、紋理多變的產品進行智能分類 外觀質量評估:基于學習的外觀質量標準判定 精密
    的頭像 發表于 11-27 10:19 ?220次閱讀

    UV紫外相機在工業視覺檢測中的應用

    UV紫外相機通過捕捉紫外信號和激發熒光反應,解決常規相機無法識別的隱形缺陷和標記,廣泛應用于工業視覺檢測。
    的頭像 發表于 10-21 09:45 ?447次閱讀

    iTOF技術,多樣化的3D視覺應用

    (CMOS)產品項目利用其在傳統TOF(CCD)技術方面的專業知識,目標是在2023年12月之前量產。基于客戶樣本驗證的初步反饋和溝通表明,與同類產品相比,這兩項指標的表現均具有優異性,增強了我們對其
    發表于 09-05 07:24

    基于LockAI視覺識別模塊:C++人臉識別

    基本知識講解 1.1 人臉識別簡介 人臉識別是一種利用人的臉部特征進行身份識別的生物識別技術。它通過檢測圖像或視頻中的人臉,提取如眼睛、鼻
    發表于 07-01 12:01

    基于LockAI視覺識別模塊:C++人臉識別

    本文基于RV1106做成的LockAI視覺識別模塊,采用LZ-Picodet模型訓練的人臉檢測模型LZ-Face,以及ArcFace人臉識別模型,實現人臉識別系統。
    的頭像 發表于 07-01 10:09 ?829次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:C++人臉<b class='flag-5'>識別</b>

    基于LockAI視覺識別模塊:手寫數字識別

    1.1 手寫數字識別簡介 手寫數字識別是一種利用計算機視覺和機器學習技術自動識別手寫數字的過程。它通過圖像預處理、特征提取和模型訓練來實現
    發表于 06-30 16:45

    基于LockAI視覺識別模塊:手寫數字識別

    手寫數字識別是一種經典的模式識別和圖像處理問題,旨在通過計算機自動識別用戶手寫的數字。本文將教會你如何使用基于RV1106的LockAI視覺識別
    的頭像 發表于 06-30 15:44 ?1113次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:手寫數字<b class='flag-5'>識別</b>

    基于LockAI視覺識別模塊:C++條碼識別

    條碼識別視覺模塊經常使用到的功能之一,經常用于識別超市的貨物信息。本文我們將演示如何基于瑞芯微RV1106的LockAI視覺
    發表于 05-27 10:26

    基于LockAI視覺識別模塊:C++條碼識別

    條碼識別視覺模塊經常使用到的功能之一,經常用于識別超市的貨物信息。本文我們將演示如何基于瑞芯微RV1106的LockAI視覺
    的頭像 發表于 05-27 09:32 ?821次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:C++條碼<b class='flag-5'>識別</b>

    基于LockAI視覺識別模塊:C++同時識別輪廓和色塊

    1.項目簡介1.1色塊識別的重要性顏色特征提取:顏色是一種重要的視覺特征,尤其在背景較為單一的情況下,能夠快速區分目標區域。應用場景:廣泛應用于機器人導航、工業自動化、物體跟蹤等領域。HSV顏色空間
    的頭像 發表于 05-23 16:41 ?983次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:C++同時<b class='flag-5'>識別</b>輪廓和色塊

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    部署,詳細介紹了基于顏色閾值和深度學習的巡線方法。 二維碼識別則廣泛應用于機器人定位與任務觸發,例如AGV(自動導引車)的路徑規劃。 深度學習在機器人
    發表于 05-03 19:41

    基于LockAI視覺識別模塊:C++圖像采集例程

    本文主要演示如何使用LockAI視覺識別模塊進行視頻流的讀取,同時使用Edit模塊進行圖像傳輸。基礎知識講解1.1OpenCV簡介OpenCV(OpenSourceComputerVisionLibra
    的頭像 發表于 04-30 18:23 ?747次閱讀
    基于LockAI<b class='flag-5'>視覺</b><b class='flag-5'>識別</b>模塊:C++圖像采集例程