国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種新型解決方案:將表征學習和分類器學習分開

智能感知與物聯網技術研究所 ? 來源:通信信號處理研究所 ? 2020-06-13 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在圖像分類任務中類別不均衡問題一直是個難點,在實際應用中大部分的分類樣本很可能呈現長尾分布。新加坡國立大學和 Facebook AI 的研究者提出了一種新型解決方案:將表征學習和分類器學習分開,從而尋找合適的表征來最小化長尾樣本分類的負面影響。該論文已被 ICLR 2020 接收。

圖像分類一直是深度學習領域中非常基本且工業應用廣泛的任務,然而如何處理待分類樣本中存在的類別不均衡問題是長期困擾學界與工業界的一個難題。相對來說,學術研究提供的普通圖像分類數據集維持了較為均衡的不同類別樣本分布;然而在實際應用中,大部分的分類樣本很可能呈現長尾分布(long-tail distribution),這很有可能導致分類模型效果偏差:對于尾部的類別分類準確率不高。 針對長尾分布的圖像識別任務,目前的研究和實踐提出了大致幾種解決思路,比如分類損失權重重分配(loss re-weighting)、數據集重采樣、尾部少量樣本過采樣、頭部過多樣本欠采樣,或者遷移學習。 在 ICLR 2020 會議上,新加坡國立大學與 Facebook AI 合著了一篇論文《Decoupling Representation and classifier for long-tailed recognition》,提出了一個新穎的解決角度:在學習分類任務的過程中,將通常默認為聯合起來學習的類別特征表征與分類器解耦(decoupling),尋求合適的表征來最小化長尾樣本分類的負面影響。

論文鏈接:https://openreview.net/pdf?id=r1gRTCVFvB

GitHub 鏈接:https://github.com/facebookresearch/classifier-balancing

該研究系統性地探究了不同的樣本均衡策略對長尾型數據分類的影響,并進行了詳實的實驗,結果表明:a) 當學習到高質量的類別表征時,數據不均衡很可能不會成為問題;b) 在學得上述表征后,即便應用最簡單的樣本均衡采樣方式,也一樣有可能在僅調整分類器的情況下學習到非常魯棒的長尾樣本分類模型。 該研究將表征學習和分類器學習分離開來,分別進行了延伸探究。 表征學習 對于表征學習來說,理想情況下好的類別表征能夠準確識別出各種待分類類別。目前針對長尾類型數據分類任務,不同的采樣策略、損失權重重分配,以及邊界正則化(margin regularization)都可用于改善類別不均。 假設 p_j 為樣本來自類別 j 中的概率,則 p_j 可用如下公式表示:

其中 n 為訓練樣本總數,C 為訓練類別總數,而 q 為 [0,1] 其中一個值。 采樣策略包含以下幾種常用采樣方式:

樣本均衡采樣(Instance-balanced sampling):該方法最為常見,即每一個訓練樣本都有均等的機會概率被選中,即上述公式中 q=1 的情況。

類別均衡采樣(Class-balanced sampling):每個類別都有同等的概率被選中,即公平地選取每個類別,然后再從類別中進行樣本選取,即上述公式中 q=0 的情況。

平方根采樣(Square-root sampling):本質上是之前兩種采樣方式的變種,通常是將概率公式中的 q 定值為 0.5。

漸進式均衡采樣(Progressively-balanced sampling):根據訓練中的迭代次數 t(epoch)同時引入樣本均衡(IB)與類別均衡(CB)采樣并進行適當權重調整的一種新型采樣模式,公式為

其中 T 為數據集訓練迭代總數。 分類器學習 該研究也針對單獨拆分出來的分類器訓練進行了調研和分類概括:

重訓練分類器(Classifier Re-training, cRT):保持表征固定不變,隨機重新初始化分類器并進行訓練。

最近類別平均分類器(Nereast Class Mean classifier, NCM):首先計算學習到的每個類別特征均值,然后執行最近鄰搜索來確定類別。

τ-歸一化分類器(τ-normalized classifier):作者提出使用該方法對分類器中的類別邊界進行重新歸一化,以取得均衡。

實驗結果 通過以上觀察和學習拆分,該研究在幾個公開的長尾分類數據集上重新修改了頭部類別和尾部類別的分類決策邊界,并且搭配不同的采樣策略進行交叉訓練實驗。訓練出的不同分類器之間的對比結果如下圖所示:

同時,在 Places-LT、Imagenet-LT 和 iNaturalist2018 三個公開標準數據集上,該研究提出的策略也獲得了同比更高的分類準確率,實現了新的 SOTA 結果:

通過各類對比實驗,該研究得到了如下觀察: 1. 解耦表征學習與分類為兩個過程均取得了非常好的效果,并且打破了人們對長尾分類固有的「樣本均衡采樣學習效果最好,擁有最具泛化性的特征表示」這一經驗之談。 2. 重新調整分類邊界對于長尾分布的物體識別來說是非常有效的。 3. 將該研究提出的解耦學習規則應用到傳統網絡(如 ResNeXt)中,仍能取得很好的效果,這說明該策略確實對長尾分類具備一定指導意義。 該研究針對業界和學界頻繁遇到的長尾樣本分類難題,提出解構傳統的「分類器表征聯合學習」范式,從另一個角度提供了新思路:調整它們在表征空間的分類邊界或許是更加高效的方法。 該研究思路比較新穎,實驗結果也具有一定的代表性。對于研究長尾分類的學者或者業界工程師而言,這在傳統采樣方式下「面多了加水,水多了加面」的經驗之外,提供了額外思路。目前該研究的相關代碼已在 GitHub 上開源,感興趣的讀者可以下載進行更多的嘗試。 代碼實現 研究者在 GitHub 項目中提供了對應的訓練代碼和必要的訓練步驟。代碼整體是相對基本的分類訓練代碼,比較容易實現。具體到復現模型訓練,作者也給出了幾點注意事項。 1. 表征學習階段

學習過程中保持網絡結構(比如 global pooling 之后不需要增加額外的全連接層)、超參數選擇、學習率和 batch size 的關系和正常分類問題一致(比如 ImageNet),以確保表征學習的質量。

類別均衡采樣:采用多 GPU 實現的時候,需要考慮使得每塊設備上都有較為均衡的類別樣本,避免出現樣本種類在卡上過于單一,從而使得 BN 的參數估計不準。

漸進式均衡采樣:為提升采樣速度,該采樣方式可以分兩步進行。第一步先從類別中選擇所需類別,第二步從對應類別中隨機選擇樣本。

2. 分類器學習階段

重新學習分類器(cRT):重新隨機初始化分類器或者繼承特征表示學習階段的分類器,重點在于保證學習率重置到起始大小并選擇 cosine 學習率。

τ-歸一化(tau-normalization):τ 的選取在驗證集上進行,如果沒有驗證集可以從訓練集模仿平衡驗證集,可參考原論文附錄 B.5。

可學習參數放縮(LWS):學習率的選擇與 cRT 一致,學習過程中要保證分類器參數固定不變,只學習放縮因子。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像分類
    +關注

    關注

    0

    文章

    96

    瀏覽量

    12491
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124400

原文標題:ICLR 2020 | 如何解決圖像分類中的類別不均衡問題?不妨試試分開學習表征和分類器

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器學習特征工程:分類變量的數值化處理方法

    編碼是機器學習流程里最容易被低估的環節之,模型沒辦法直接處理文本形式的分類數據,尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的
    的頭像 發表于 02-10 15:58 ?339次閱讀
    機器<b class='flag-5'>學習</b>特征工程:<b class='flag-5'>分類</b>變量的數值化處理方法

    強化學習會讓自動駕駛模型學習更快嗎?

    一種讓機器通過“試錯”學會決策的辦法。與監督學習不同,監督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每步的“正確答案”都告訴
    的頭像 發表于 01-31 09:34 ?646次閱讀
    強化<b class='flag-5'>學習</b>會讓自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    Bamtone ICT系列:一種新型高效的離子污染測試儀?

    設計的款精密離子污染檢測儀器,被定位為一種新型高效的離子污染測試儀,代表了當前PCBA離子污染檢測向自動化、智能化和高效化發展的趨勢,是國產替代高端進口設備的個有力
    的頭像 發表于 01-12 11:28 ?419次閱讀
    Bamtone ICT系列:<b class='flag-5'>一種</b><b class='flag-5'>新型</b>高效的離子污染測試儀?

    分享個嵌入式開發學習路線

    操作系統(RTOS):學習FreeRTOS或RT-Thread,掌握任務創建與刪除、任務調度、信號量、隊列、定時等核心概念。 物聯網通信技術:掌握WiFi、Bluetooth、LoRa等至少一種通信
    發表于 12-04 11:01

    學習物聯網怎么入門?

    聯網的基本概念和技術是學習物聯網的重要第步。物聯網是指互聯網上的物品相互連接,通過網絡實現信息交流和共享的一種技術。學習物聯網需要了解物聯網的基本概念,如物聯網的架構、物聯網的協議、
    發表于 10-14 10:34

    DWDM光模塊分類與光網傳輸解決方案

    DWDM光模塊分類與光網傳輸解決方案解析
    的頭像 發表于 10-10 15:12 ?829次閱讀

    Andes晶心科技推出新代深度學習加速

    高效能、低功耗 32/64 位 RISC-V 處理核與 AI 加速解決方案的領導供貨商—Andes晶心科技(Andes Technology)今日正式發表最新深度學習加速 Ande
    的頭像 發表于 08-20 17:43 ?2365次閱讀

    ARM入門學習方法分享

    ARM7/ARM9等多個版本。除了些Unix圖形工作站外,大多數ARM核心的處理都使用在嵌入式領域。 ARM,既可以認為是個公司的名字,也可以認為是對類微處理
    發表于 07-23 10:21

    寬調速范圍低轉矩脈動的一種新型內置式永磁同步電機的設計與分析

    摘要:寬調速范圍與低轉矩脈動直是設計電動汽車用內置式永礎同步電機時所追求的重要目標。設計了一種轉子結構為胃的新型內置式永礎同步電機,并進行了繞組結構優化與性能分析。利用有限元分析法,
    發表于 06-06 14:13

    一種新型寬帶鞭狀套筒天線

    電子發燒友網站提供《一種新型寬帶鞭狀套筒天線.pdf》資料免費下載
    發表于 05-28 14:05 ?0次下載

    使用MATLAB進行無監督學習

    無監督學習一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?1449次閱讀
    使用MATLAB進行無監督<b class='flag-5'>學習</b>

    基于RV1126開發板實現自學習圖像分類方案

    在RV1126開發板上實現自學習:在識別前對物體圖片進行模型學習,訓練完成后通過算法分類得出圖像的模型ID。 方案設計邏輯流程圖,方案
    的頭像 發表于 04-21 13:37 ?11次閱讀
    基于RV1126開發板實現自<b class='flag-5'>學習</b>圖像<b class='flag-5'>分類</b><b class='flag-5'>方案</b>

    一種分段氣隙的CLLC變換平面變壓設計

    氣隙設計的優點。 目錄1 概述2 一種分段氣隙的CLLC平面變壓設計3 實驗驗證4 參考文獻 1 概述學者們從LLC拓撲原理、新型器件、改進拓撲、先進調制方法、諧振參數優化方法、磁性器件設計方法
    發表于 03-27 13:57

    一種新型直流電機控制

    以前控制直流電機多由單片機完成。該方式缺點是接口繁瑣、速度慢,且不易在高溫、高壓等惡劣環境下工作[1]。采用一種新型直流電機控制——DSP 控制解決了單片機控制的缺點,其具備很多優
    發表于 03-25 15:25

    一種無刷直流電機霍耳信號與定子繞組關系自學習方法

    的關系。提出了一種無刷直流電機霍耳信號與定子繞組關系自學習方法,該方法通過不同的繞組通電組合電機轉子依次轉到6個不同的位置并記錄對應的霍耳信號,然后得出霍耳信號與定子繞組的對應關系。所提出的方法快速
    發表于 03-25 15:15