国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過Logit調(diào)整的長尾學(xué)習(xí)

倩倩 ? 來源:GiantPandaCV ? 作者:GiantPandaCV ? 2022-09-05 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 論文信息

標題:Long-Tail Learning via Logit Adjustment

作者:Aditya Krishna Menon, Sadeep Jayasumana, Ankit Singh Rawat, Himanshu Jain, Andreas Veit, Sanjiv Kumar (Google Research)

原文鏈接:https://arxiv.org/abs/2007.07314

代碼鏈接:https://github.com/google-research/google-research/tree/master/logit_adjustment

2. 介紹

在傳統(tǒng)的分類和識別任務(wù)中,訓(xùn)練數(shù)據(jù)的分布往往都受到了人工的均衡,即不同類別的樣本數(shù)量無明顯差異,如最有影響力的ImageNet,每種類別的樣本數(shù)量就保持在1300張左右。

aece2de2-2cd9-11ed-ba43-dac502259ad0.jpg

在實際的視覺相關(guān)任務(wù)中,數(shù)據(jù)都存在如上圖所示的長尾分布,少量類別占據(jù)了絕大多少樣本,如圖中Head部分,大量的類別僅有少量的樣本,如圖中Tail部分。解決長尾問題的方案一般分為4種:

重采樣 (Re-sampling):采樣過程中采樣不同的策略,如對tail中的類別樣本進行過采樣,或者對head類別樣本進行欠采樣。

重加權(quán) (Re-weighting):在訓(xùn)練過程中給與每種樣本不同的權(quán)重,對tail類別loss設(shè)置更大的權(quán)重,這樣有限樣本數(shù)量。

新的學(xué)習(xí)策略 (Learning strategy):有專門為解決少樣本問題涉及的學(xué)習(xí)方法可以借鑒,如:meta-learning、transfer learning。另外,還可以調(diào)整訓(xùn)練策略,將訓(xùn)練過程分為兩步:第一步不區(qū)分head樣本和tail樣本,對模型正常訓(xùn)練;第二步,設(shè)置小的學(xué)習(xí)率,對第一步的模型使用各種樣本平衡的策略進行finetune。

其實就筆者喜歡的風(fēng)格而言,我對重加權(quán)這一方向的工作更為喜歡,因為通過各種統(tǒng)計學(xué)上的結(jié)論,來設(shè)計很好的loss改進來解決長尾/不均衡分布問題,我喜歡這類研究的原因是,他們(大部分)實現(xiàn)簡單,往往只需幾行代碼修改下loss,就可以取得非常有競爭力的結(jié)果,因為簡單所以很容易運用到一些復(fù)雜的任務(wù)中。

而從“奧卡姆剃刀”來看,我覺得各種遷移模型的理念雖然非常好,從頭部常見類中學(xué)習(xí)通用知識,然后遷移到尾部少樣本類別中,但是往往會需要設(shè)計復(fù)雜的模塊,有增加參數(shù)實現(xiàn)過擬合的嫌疑,我認為這其實是把簡單問題復(fù)雜化。我覺得從統(tǒng)計方面來設(shè)計更加優(yōu)美,因此本文來介紹一篇我非常喜歡的從統(tǒng)計角度出發(fā)的工作。這篇論文來自Google Research,他們提供了一種logit的調(diào)整方法來應(yīng)對長尾分布的問題。由于研究風(fēng)格更偏向 machine learning, 所以論文風(fēng)格更偏向統(tǒng)計類。

本文首先總結(jié)了對于logit的調(diào)整方法:

聚焦于測試階段:對學(xué)習(xí)完的logit輸出進行處理(post-hoc normalization),根據(jù)一些先驗假設(shè)進行調(diào)整。

聚焦于訓(xùn)練階段:在學(xué)習(xí)中調(diào)整loss函數(shù),相對平衡數(shù)據(jù)集來說,調(diào)整優(yōu)化的方向。

aeddeafc-2cd9-11ed-ba43-dac502259ad0.png

如上圖,這兩種方法都有許多較為優(yōu)秀的工作,但是文中描述了這兩種方法的幾種限制:

weight normalization非常依賴于weight的模長會因為class的data數(shù)量稀少而變小,然而這種假設(shè)非常依賴于優(yōu)化器的選擇

直接修改loss進行重加權(quán),也會影響模型的表征學(xué)習(xí),從而導(dǎo)致優(yōu)化過程不穩(wěn)定,同時模型可能對尾部類過擬合,傷害了模型表征學(xué)習(xí)能力。

論文的motivation就是克服這些缺點,讓不同類(head and tail classed)之間的logit能有一個相對較大的margin,設(shè)以一個consistent的loss,來讓模型的性能更好。

3. 問題設(shè)定和過往方法回顧

3.1 Problem Settings

論文先從統(tǒng)計學(xué)的角度定義了一下這個problem settings,其實就是訓(xùn)練一個映射,讓這個scorer的誤分類損失最小:

但是類別不平衡的學(xué)習(xí)的setting導(dǎo)致P(y)分布是存在高度地skewed,使得許多尾部類別標簽出現(xiàn)的概率很低。在這里,錯誤分類的比例就不是一個合適的metric: 因為模型似乎把所有的尾部類別都分類成頭部類別也更夠取得比較好的效果。所為了解決這個問題,一個自然的選擇是平衡誤差,平均每個類的錯誤率,從而讓測試計算出的metric不是有偏的。

論文總結(jié)出了一個比較general的loss形式:

這里 是類別 yy 的權(quán)重;是另一個超參, 用來控制 margin 的大小。

3.2Post-hoc weight normalization

由于頭部類別多,容易過擬合,自然會對頭部類別overconfidence,所以我們需要通過一定的映射來調(diào)整logit。具體到調(diào)整的策略,自然是讓大類置信度低一點,小類置信度高一點。

for , where and . Intuitively, either choice of upweights the contribution of rare labels through weight normalisation. The choice is motivated by the observations that tends to correlate with . Further to the above, one may enforce during training.

這里引用了一些其他做long-tail learning的論文,可以參考以便更好地對這一塊進行理解。

3.3 Loss modification

至于對于loss的修改,就是很直接了在前面加一個權(quán)重,對于的取值,自然就是各個工作重點關(guān)注和改進的地方。

af02f478-2cd9-11ed-ba43-dac502259ad0.png

論文給予原有的各種方法各種比較全面的總結(jié)。

4. 方法

首先進行Post-hoc logit adjustment:

其實等號左邊就是一個根據(jù)類別的樣本數(shù)進行re-weighting。但是為了在exp的線性變換加上temperature時候不影響排序問題,所以把等號右邊變成上式,通過這種方式放縮不會導(dǎo)致原本的排序出現(xiàn)問題。從而使得重加權(quán)仍能夠給尾部類更高的權(quán)重。

af2dc766-2cd9-11ed-ba43-dac502259ad0.png

把loss改寫成易于理解的方式就如下:

下面這個更為直接的loss被成為為pairwise margin loss,它可以把 y 與 y' 之間的margin拉大。

然后就是實現(xiàn)結(jié)合:

af47e862-2cd9-11ed-ba43-dac502259ad0.png

通過一些特殊的取值和另外的trick,可以實現(xiàn)兩者的結(jié)合。

5. 實驗結(jié)果

af5f3152-2cd9-11ed-ba43-dac502259ad0.png

這張圖非常有意思,可以看出兩個設(shè)計理念非常有效果。

af842f0c-2cd9-11ed-ba43-dac502259ad0.png

afa47d2a-2cd9-11ed-ba43-dac502259ad0.png

可以發(fā)現(xiàn)該方法在頭部類和尾部類的性能都有所提升。

6. 結(jié)論

摘要:這篇寫得很好的論文重新審視了logit調(diào)整的想法,以解決長尾問題。本文首先建立了一個統(tǒng)計框架,并以此為基礎(chǔ)提出了兩種有效實現(xiàn)對數(shù)平差的方法。他們通過在合成和自然長尾數(shù)據(jù)集上使用幾個相關(guān)基線對其進行測試,進一步證明了這種方法的潛力。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 線性
    +關(guān)注

    關(guān)注

    0

    文章

    219

    瀏覽量

    26286
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3756

    瀏覽量

    52127
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26208
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    企業(yè)應(yīng)對16類產(chǎn)品CCC認證模式調(diào)整的指南

    意味著企業(yè)不能再僅靠自主聲明合格,而必須通過指定認證機構(gòu)的評價、檢測和廠檢才能獲得證書。以下是為您整理的詳細應(yīng)對指南:一、主要調(diào)整內(nèi)容:16類產(chǎn)品名單本次調(diào)整涵蓋了汽
    的頭像 發(fā)表于 03-03 23:52 ?362次閱讀
    企業(yè)應(yīng)對16類產(chǎn)品CCC認證模式<b class='flag-5'>調(diào)整</b>的指南

    強化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機器通過“試錯”學(xué)會決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強化學(xué)習(xí)不會把每一步的“正確答案”都告訴你,而是把環(huán)境、動作和結(jié)果連起來,讓機器自己
    的頭像 發(fā)表于 01-31 09:34 ?659次閱讀
    強化<b class='flag-5'>學(xué)習(xí)</b>會讓自動駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    電力調(diào)整器恒壓恒流恒功率是什么意思?#電力調(diào)整器 #三相電力調(diào)整器 #電力調(diào)整器工廠

    調(diào)整
    蘇州合泉儀表科技有限公司
    發(fā)布于 :2026年01月13日 08:56:57

    淘寶搜索API:長尾詞挖掘,SEO提升的利器!

    ? 在淘寶這個巨大的生態(tài)中,商品能否被買家精準地搜索到,直接關(guān)系到店鋪的流量和轉(zhuǎn)化。而搜索優(yōu)化的核心之一,就是關(guān)鍵詞策略。除了競爭激烈的頭部熱詞, 長尾關(guān)鍵詞 往往蘊含著巨大的潛力。它們搜索意圖明確
    的頭像 發(fā)表于 01-09 14:48 ?270次閱讀
    淘寶搜索API:<b class='flag-5'>長尾</b>詞挖掘,SEO提升的利器!

    如何測試DC-DC電源模塊的負載調(diào)整率?

    DC-DC 電源模塊的負載調(diào)整率測試,其實就是在固定的輸入電壓條件下,通過改變負載電流(從空載到滿載),測量輸出電壓的變化幅度,最終計算出電壓波動的百分比或絕對差值。其計算公式為:負載調(diào)整
    的頭像 發(fā)表于 11-21 18:10 ?642次閱讀
    如何測試DC-DC電源模塊的負載<b class='flag-5'>調(diào)整</b>率?

    學(xué)習(xí)物聯(lián)網(wǎng)怎么入門?

    聯(lián)網(wǎng)的基本概念和技術(shù)是學(xué)習(xí)物聯(lián)網(wǎng)的重要第一步。物聯(lián)網(wǎng)是指互聯(lián)網(wǎng)上的物品相互連接,通過網(wǎng)絡(luò)實現(xiàn)信息交流和共享的一種技術(shù)。學(xué)習(xí)物聯(lián)網(wǎng)需要了解物聯(lián)網(wǎng)的基本概念,如物聯(lián)網(wǎng)的架構(gòu)、物聯(lián)網(wǎng)的協(xié)議、物聯(lián)網(wǎng)的應(yīng)用場
    發(fā)表于 10-14 10:34

    如何避免傳感器故障報警閾值調(diào)整不當(dāng)?shù)膯栴}?

    是分步驟的實操方案,附關(guān)鍵工具與場景適配建議: 一、事前:明確閾值調(diào)整的 “合理范圍”,拒絕盲目設(shè)定 調(diào)整前先通過 “查標準、析數(shù)據(jù)、評風(fēng)險”,確定閾值的 “安全上限” 和 “靈敏下限”,避免過松或過嚴。 1. 提取三大核心依據(jù)
    的頭像 發(fā)表于 10-13 17:12 ?1173次閱讀
    如何避免傳感器故障報警閾值<b class='flag-5'>調(diào)整</b>不當(dāng)?shù)膯栴}?

    傳感器故障報警的閾值可以調(diào)整嗎?

    功能) 這類傳感器通常支持硬件或軟件方式調(diào)整閾值,常見于自動化產(chǎn)線、化工、醫(yī)療等場景: 硬件調(diào)整 : 物理按鍵 / 電位器 :例如速度開關(guān) RD-11801 通過電位器直接調(diào)節(jié)轉(zhuǎn)速閾值,或通過
    的頭像 發(fā)表于 10-13 17:05 ?1032次閱讀

    常用伺服參數(shù)的調(diào)整

    的基礎(chǔ)原理 伺服系統(tǒng)的參數(shù)調(diào)整本質(zhì)是通過PID控制算法實現(xiàn)對機械系統(tǒng)的精確匹配。位置環(huán)、速度環(huán)、電流環(huán)的三環(huán)結(jié)構(gòu)構(gòu)成伺服控制的基礎(chǔ)框架,其中位置環(huán)作為最外環(huán)決定最終定位精度,速度環(huán)影響動態(tài)響應(yīng)特性,電流環(huán)則直接控
    的頭像 發(fā)表于 10-13 07:41 ?1269次閱讀
    常用伺服參數(shù)的<b class='flag-5'>調(diào)整</b>

    如何分析負載特性來調(diào)整報警閾值?

    分析負載特性來調(diào)整報警閾值,核心是 找到負載對電能質(zhì)量的 “敏感點” 和 “耐受極限” ,再將這些特性轉(zhuǎn)化為具體的閾值調(diào)整規(guī)則(如收緊敏感指標、放寬耐受指標)。需分 4 步系統(tǒng)分析,每步都對
    的頭像 發(fā)表于 10-10 17:00 ?899次閱讀
    如何分析負載特性來<b class='flag-5'>調(diào)整</b>報警閾值?

    ANSA人體模型姿態(tài)調(diào)整工具介紹

    ANSA的人體模型姿態(tài)調(diào)整工具(HBM Articulation Tool)通過網(wǎng)格變形技術(shù)實現(xiàn)基于人體不同部位進行調(diào)節(jié),定位人體模型最終的姿態(tài)。
    的頭像 發(fā)表于 09-28 15:40 ?1296次閱讀
    ANSA人體模型姿態(tài)<b class='flag-5'>調(diào)整</b>工具介紹

    TLe9893怎么調(diào)整外設(shè)的中斷優(yōu)先級?

    你好林工,我該怎么調(diào)整外設(shè)的中斷優(yōu)先級?是否可以通過工具調(diào)整?默認設(shè)置下,是不是Brdv的在中斷優(yōu)先級高于T20和can?
    發(fā)表于 08-01 06:20

    變頻器的頻率怎么調(diào)整

    變頻器作為現(xiàn)代工業(yè)控制中的重要設(shè)備,其頻率調(diào)整直接關(guān)系到電機轉(zhuǎn)速和生產(chǎn)效率。本文將系統(tǒng)介紹變頻器頻率調(diào)整的原理、方法、注意事項及典型應(yīng)用場景,幫助讀者全面掌握這一關(guān)鍵技術(shù)。 一、變頻器頻率調(diào)整
    的頭像 發(fā)表于 07-13 17:41 ?5934次閱讀
    變頻器的頻率怎么<b class='flag-5'>調(diào)整</b>?

    電源管理芯片U3205A擁有良好的線性調(diào)整率和負載調(diào)整

    電源管理芯片U3205A擁有良好的線性調(diào)整率和負載調(diào)整率銀聯(lián)寶電源管理芯片U3205A通過實時監(jiān)測負載狀態(tài),自動調(diào)節(jié)MOSFET的開關(guān)頻率,輕載或空載時?降低頻率?(如待機狀態(tài)),減少開關(guān)損耗,典型
    的頭像 發(fā)表于 04-17 16:26 ?822次閱讀
    電源管理芯片U3205A擁有良好的線性<b class='flag-5'>調(diào)整</b>率和負載<b class='flag-5'>調(diào)整</b>率

    模擬示波器的波形顯示可以調(diào)整哪些參數(shù)?

    放大或縮小波形的垂直幅度,使波形在屏幕上顯示得更大或更小。 調(diào)整方法:通過旋轉(zhuǎn)垂直靈敏度旋鈕或輸入數(shù)值進行調(diào)整。 垂直位置(Vertical Position) 定義:波形在垂直方向上的位置。 作用
    發(fā)表于 04-02 14:41