国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于多標簽學習的新趨勢

智能感知與物聯網技術研究所 ? 來源:通信信號處理研究所 ? 作者:通信信號處理研究 ? 2021-01-05 14:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這里大家帶來一篇武大劉威威老師、南理工沈肖波老師和 UTS Ivor W. Tsang 老師合作的 2020 年多標簽最新的 Survey,我也有幸參與其中,負責了一部分工作。

上半年在知乎上看到有朋友咨詢多標簽學習是否有新的 Survey,我搜索了一下,發現現有的多標簽 Survey 基本在 2014 年之前,主要有以下幾篇:

Tsoumakas 的《Multi-label classification: An overview》(2007)

周志華老師的《A review on multi-label learning algorithms》(2013)

一篇比較小眾的,Gibaja 《Multi‐label learning: a review of the state of the art and ongoing research》2014

時過境遷,從 2012 年起,AI 領域已經發生了翻天覆地的變化,Deep Learning 已經占據絕對的主導地位,我們面對的問題越來越復雜,CV 和 NLP 朝著各自的方向前行。模型越來越強,我們面對的任務的也越來越復雜,其中,我們越來越多地需要考慮高度結構化的輸出空間。多標簽學習,作為一個傳統的機器學習任務,近年來也擁抱變化,有了新的研究趨勢。因此,我們整理了近年多標簽學習在各大會議的工作,希望能夠為研究者們提供更具前瞻性的思考。

關于單標簽學習和多標簽學習的區別,這里簡單給個例子:傳統的圖片單標簽分類考慮識別一張圖片里的一個物體,例如 ImageNet、CIFAR10 等都是如此,但其實圖片里往往不會只有一個物體,大家隨手往自己的桌面拍一張照片,就會有多個物體,比如手機、電腦、筆、書籍等等。在這樣的情況下,單標簽學習的方法并不適用,因為輸出的標簽可能是結構化的、具有相關性的(比如鍵盤和鼠標經常同時出現),所以我們需要探索更強的多標簽學習算法來提升學習性能。

本文的主要內容有六大部分:

Extreme Multi-Label Classification

Multi-Label with Limited Supervision

Deep Multi-Label Classification

Online Multi-Label Classification

Statistical Multi-Label Learning

New Applications

接下去我們對這些部分進行簡單的介紹,更多細節大家也可以進一步閱讀 Survey 原文。另外,由于現在的論文迭代很快,我們無法完全 Cover 到每篇工作。我們的主旨是盡量保證收集的工作來自近年已發表和錄用的、高質量的期刊或會議,保證對當前工作的整體趨勢進行把握。如果讀者有任何想法和意見的話,也歡迎私信進行交流。 1. Extreme Multi-Label Learning (XML) 在文本分類,推薦系統,Wikipedia,Amazon 關鍵詞匹配 [1] 等等應用中,我們通常需要從非常巨大的標簽空間中召回標簽。比如,很多人會 po 自己的自拍到 FB、Ins 上,我們可能希望由此訓練一個分類器,自動識別誰出現在了某張圖片中。

對 XML 來說,首要的問題就是標簽空間、特征空間都可能非常巨大,例如 Manik Varma 大佬的主頁中給出的一些數據集[2],標簽空間的維度甚至遠高于特征維度。其次,由于如此巨大的標簽空間,可能存在較多的 Missing Label(下文會進一步闡述)。最后,標簽存在長尾分布[3],絕大部分標簽僅僅有少量樣本關聯?,F有的 XML 方法大致可以分為三類,分別為:Embedding Methods、Tree-Based Methods、One-vs-All Methods。近年來,也有很多文獻使用了深度學習技術解決 XML 問題,不過我們將會在 Section 4 再進行闡述。XML 的研究熱潮大概從 2014 年開始,Varma 大佬搭建了 XML 的 Repository 后,已經有越來越多的研究者開始關注,多年來 XML 相關的文章理論和實驗結果并重,值得更多的關注。

2. Multi-Label with Limited Supervision 相比于傳統學習問題,對多標簽數據的標注十分困難,更大的標簽空間帶來的是更高的標注成本。隨著我們面對的問題越來越復雜,樣本維度、數據量、標簽維度都會影響標注的成本。因此,近年多標簽的另一個趨勢是開始關注如何在有限的監督下構建更好的學習模型。本文將這些相關的領域主要分為三類: MLC with Missing Labels(MLML):多標簽問題中,標簽很可能是缺失的。例如,對 XML 問題來說,標注者根本不可能遍歷所有的標簽,因此標注者通常只會給出一個子集,而不是給出所有的監督信息。文獻中解決該問題的技術主要有基于圖的方法、基于標簽空間(或 Latent 標簽空間)Low-Rank 的方法、基于概率圖模型的方法。

Semi-Supervised MLC:MLML 考慮的是標簽維度的難度,但是我們知道從深度學習需要更多的數據,在樣本量上,多標簽學習有著和傳統 AI 相同的困難。半監督 MLC 的研究開展較早,主要技術和 MLML 也相對接近,在這一節,我們首先簡要回顧了近年半監督 MLC 的一些最新工作。但是,近年來,半監督 MLC 開始有了新的挑戰,不少文章開始結合半監督 MLC 和 MLML 問題。畢竟對于多標簽數據量來說,即使標注少量的 Full Supervised 數據,也是不可接受的。因此,許多文章開始研究一類弱監督多標簽問題[4](Weakly-Supervised MLC,狹義),也就是數據集中可能混雜 Full labeled/missing labels/unlabeled data。我們也在文中重點介紹了現有的一些 WS-MLC 的工作。

Partial Multi-Label Learning(PML):PML 是近年來多標簽最新的方向,它考慮的是一類 “難以標注的問題”。比如,在我們標注下方的圖片(Zhang et. al. 2020[5])的時候,諸如 Tree、Lavender 這些標簽相對是比較簡單的。但是有些標簽到底有沒有,是比較難以確定的,對于某些標注者,可能出現:“這張圖片看起來是在法國拍的,好像也可能是意大利?”。這種情況稱之為 Ambiguous。究其原因,一是有些物體確實難以辨識,第二可能是標注者不夠專業(這種多標簽的情況,標注者不太熟悉一些事物也很正常)。但是,很多情況下,標注者是大概能夠猜到正確標簽的范圍,比如這張風景圖所在國家,很可能就是 France 或者 Italy 中的一個。我們在不確定的情況下,可以選擇不標注、或者隨機標注。但是不標注意味著我們丟失了所有信息,隨機標注意味著可能帶來噪聲,對學習的影響更大。所以 PML 選擇的是讓標注者提供所有可能的標簽,當然加了一個較強的假設:所有的標簽都應該被包含在候選標簽集中。在 Survey 中,我們將現有的 PML 方法劃分為 Two-Stage Disambiguation 和 End-to-End 方法(我們 IJCAI 2019 的論文 DRAMA[6] 中,就使用了前者)。關于 PML 的更多探討,我在之前的知乎回答里面也已經敘述過,大家也可以在我們的 Survey 中了解更多。

Other Settings:前文說過,多標簽學習的標簽空間紛繁復雜,因此很多研究者提出了各種各樣不同的學習問題,我們也簡單摘要了一些較為前沿的方向:

MLC with Noisy Labels (Noisy-MLC)。

MLC with Unseen Labels. (Streaming Labels/Zero-Shot/Few-Shot Labels)

Multi-Label Active Learning (MLAL)。

MLC with Multiple Instances (MIML)。

3. Deep Learning for MLC 相信這一部分是大家比較關心的內容,隨著深度學習在越來越多的任務上展現了自己的統治力,多標簽學習當然也不能放過這塊香餑餑。不過,總體來說,多標簽深度學習的模型還沒有十分統一的框架,當前對 Deep MLC 的探索主要分為以下一些類別: Deep Embedding Methods:早期的 Embedding 方法通常使用線性投影,將 PCA、Compressed Sensing 等方法引入多標簽學習問題。一個很自然的問題是,線性投影真的能夠很好地挖掘標簽之間的相關關系嗎?同時,在 SLEEC[3]的工作中也發現某些數據集并不符合 Low-Rank 假設。因此,在 2017 年的工作 C2AE[7]中,Yeh 等將 Auto-Encoder 引入了多標簽學習中。由于其簡單易懂的架構,很快有許多工作 Follow 了該方法,如 DBPC[8]等。

4a376d00-4458-11eb-8b86-12bb97331649.png

Deep Learning for Challenging MLC:深度神經網絡強大的擬合能力使我們能夠有效地處理更多更困難的工作。因此我們發現近年的趨勢是在 CV、NLP 和 ML 幾大 Community,基本都會有不同的關注點,引入 DNN 解決 MLC 的問題,并根據各自的問題發展出自己的一條線。 1. XML 的應用:對這個方面的關注主要來自與數據挖掘和 NLP 領域,其中比較值得一提的是 Attention(如 AttentionXML[9])機制、Transformer-Based Models(如 X-Transformer[10])成為了最前沿的工作。

2. 弱監督 MLC 的應用:這一部分和我們弱監督學習的部分相對交叉,特別的,CVPR 2019 的工作 [11] 探索了多種策略,在 Missing Labels 下訓練卷積神經網絡。 DL for MLC with unseen labels:這一領域的發展令人興奮,今年 ICML 的工作 DSLL[12]探索了流標簽學習,也有許多工作 [13] 將 Zero-Shot Learning 的架構引入 MLC。 3. Advanced Deep Learning for MLC:有幾個方向的工作同樣值得一提。首先是 CNN-RNN[14]架構的工作,近年有一個趨勢是探索 Orderfree 的解碼器 [15]。除此之外,爆火的圖神經網絡 GNN 同樣被引入 MLC,ML-GCN[16] 也是備受關注。特別的,SSGRL[17]是我比較喜歡的一篇工作,結合了 Attention 機制和 GNN,motivation 比較強,效果也很不錯。 總結一下,現在的 Deep MLC 呈現不同領域關注點和解決的問題不同的趨勢:

從架構上看,基于Embedding、CNN-RNN、CNN-GNN的三種架構受到較多的關注。

從任務上,在XML、弱監督、零樣本的問題上,DNN 大展拳腳。

從技術上,Attention、Transformer、GNN在 MLC 上的應用可能會越來越多。

4. Online Multi-Label Learning 面對當前這么復雜而眾多的學習問題,傳統的全數據學習的方式已經很難滿足我們現實應用的需求了。因此,我們認為 Online Multi-Label Learning 可能是一個十分重要,也更艱巨的問題。當前 Off-line 的 MLC 模型一般假設所有數據都能夠提前獲得,然而在很多應用中,或者對大規模的數據,很難直接進行全量數據的使用。一個樸素的想法自然是使用 Online 模型,也就是訓練數據序列地到達,并且僅出現一次。然而,面對這樣的數據,如何有效地挖掘多標簽相關性呢?本篇 Survey 介紹了一些已有的在線多標簽學習的方法,如 OUC[18]、CS-DPP[19]等。在弱監督學習的部分,我們也回顧了近年一些在線弱監督多標簽的文章[20](在線弱監督學習一直是一個很困難的問題)。

Online MLC 的工作不多,但是已經受到了越來越多的關注,想要設計高效的學習算法并不簡單,希望未來能夠有更多研究者對這個問題進行探索。 5. Statistical Multi-Label Learning 近年,盡管深度學習更強勢,但傳統的機器學習理論也在穩步發展,然而,多標簽學習的許多統計性質并沒有得到很好的理解。近年 NIPS、ICML 的許多文章都有探索多標簽的相關性質。一些值得一提的工作例如,缺失標簽下的低秩分類器的泛化誤差分析 [21]、多標簽代理損失的相合性質[22]、稀疏多標簽學習的 Oracle 性質[23] 等等。相信在未來,會有更多工作探索多標簽學習的理論性質。

6. New Applications 講了這么多方法論,但追溯其本源,這么多紛繁復雜的問題依然是由任務驅動的,正是有許許多多現實世界的應用,要求我們設計不同的模型來解決尺度更大、監督更弱、效果更強、速度更快、理論性質更強的 MLC 模型。因此,在文章的最后一部分,我們介紹了近年多標簽領域一些最新的應用,如 Video Annotation、Green Computing and 5G Applications、User Profiling 等。在 CV 方向,一個趨勢是大家開始探索多標簽領域在視頻中的應用 [24]。在 DM 領域,用戶畫像受到更多關注,在我們今年的工作 CMLP[25] 中(下圖),就探索了對刷單用戶進行多種刷單行為的分析。不過,在 NLP 領域,似乎大家還是主要以文本分類為主,XML-Repo[2]中的應用還有較多探索的空間,所以我們沒有花額外的筆墨。

4a74a828-4458-11eb-8b86-12bb97331649.png

總結 寫這篇文章的過程中,我跟著幾位老師閱讀了很多文章,各個領域和方向的工作都整理了不少,盡管無法 cover 到所有工作,但是我們盡可能地把握了一些較為重要的探索的方向,也在文中較為謹慎地給出了一些我們的思考和建議,希望能夠給想要了解多標簽學習領域的研究者一點引領和思考。

原文標題:多標簽學習的新趨勢(2020 Survey)

文章出處:【微信公眾號:通信信號處理研究所】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107794
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301443
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124398

原文標題:多標簽學習的新趨勢(2020 Survey)

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RFID資產管理標簽怎么選

    RFID資產管理標簽怎么選RFID資產管理標簽選型需結合資產類型、使用環境和管理需求,廣州杰眾智能科技有限公司提供抗金屬、洗滌標簽、耐高溫等系列
    的頭像 發表于 02-24 15:42 ?112次閱讀
    RFID資產管理<b class='flag-5'>標簽</b>怎么選

    智能體強化學習(MARL)核心概念與算法概覽

    訓練單個RL智能體的過程非常簡單,那么我們現在換一個場景,同時訓練五個智能體,而且每個都有自己的目標、只能看到部分信息,還能互相幫忙。這就是智能體強化學習
    的頭像 發表于 01-21 16:21 ?198次閱讀
    <b class='flag-5'>多</b>智能體強化<b class='flag-5'>學習</b>(MARL)核心概念與算法概覽

    超高頻(UHF)標簽RFID讀取器(面向項目落地的深度指南)

    超高頻(UHF)標簽RFID讀取器:一次能讀多張,怎么做到?怎么用好?(面向工程與落地的深度指南)這篇文章把“原理、設備要點、部署細節”都說清楚了,既有技術維度,也有落地建議。
    的頭像 發表于 11-01 11:37 ?576次閱讀
    超高頻(UHF)<b class='flag-5'>多</b><b class='flag-5'>標簽</b>RFID讀取器(面向項目落地的深度指南)

    發布元服務配置應用分類、標簽和資質信息

    “分類標簽和資質管理”菜單選擇元服務歸屬的類別和標簽,同時將所需的資質文件提交給華為運營人員審核。資質文件審核通過后,您選擇的標簽才能生效,之后才可選擇生效標簽進行配置。
    發表于 10-29 16:47

    炸裂!香港電子展揭秘AI PC與消費電子新趨勢

    家人們!我以行業老炮的身份剛從香港環球資源電子展上“殺”回來,這一趟探展,簡直像坐了趟科技過山車,刺激得我腦瓜子嗡嗡的。PC行業和消費電子行業的新趨勢、新玩法,簡直要把我CPU干燒了(不對!我
    的頭像 發表于 10-21 12:13 ?338次閱讀
    炸裂!香港電子展揭秘AI PC與消費電子<b class='flag-5'>新趨勢</b>

    超聲波清洗機的環保性如何?探討綠色清潔新趨勢

    走向一個環保的新趨勢。本文將深入探討超聲波清洗機的環保性以及它在現代清潔技術中的地位。一、超聲波清洗機的基本原理及優勢超聲波清洗機的工作原理是利用超聲波在液體中傳
    的頭像 發表于 10-08 16:24 ?458次閱讀
    超聲波清洗機的環保性如何?探討綠色清潔<b class='flag-5'>新趨勢</b>

    iPhone 17爆了!今年下半年看什么新技術、新趨勢?

    iPhone 17爆了!今年下半年看什么新技術、新趨勢?
    的頭像 發表于 09-23 10:48 ?551次閱讀
    iPhone 17爆了!今年下半年看什么新技術、<b class='flag-5'>新趨勢</b>?

    PCB抗金屬標簽的應用

    PCB抗金屬標簽是一種專門設計用于在金屬表面或靠近金屬環境使用的RFID標簽。它通過特殊的天線設計和材料選擇,克服了傳統RFID標簽在金屬環境中無法正常工作的難題。PCB抗金屬標簽具有
    的頭像 發表于 08-06 16:11 ?824次閱讀
    PCB抗金屬<b class='flag-5'>標簽</b>的應用

    友商跟進,共創一體化直流電能表新趨勢

    實現分流器和電能表整體封印,提高穩定性及準確度,是直流電能表發展新趨勢
    的頭像 發表于 06-19 13:13 ?774次閱讀
    友商跟進,共創一體化直流電能表<b class='flag-5'>新趨勢</b>

    云里物里推出全新按鍵倉儲標簽

    在工業倉儲場景中,同一物料需響應多個工單并行揀貨是常見的作業模式,但傳統紙質標簽或單一交互設備常面臨信息更新滯后、操作繁瑣、設備管理復雜等難題,導致揀貨效率低下、人工成本攀升。云里物里基于對工業場景的深度洞察,推出全新按鍵倉儲標簽
    的頭像 發表于 05-26 15:37 ?849次閱讀

    NXP eIQ Time Series Studio 工具使用攻略(九)-數據標簽

    其中"Data Labeling",數據標簽工具使用戶能夠通過可視化界面將相應的數據標簽(如電弧或無電弧)應用于當前數據圖形的不同部分,從而對導入的原始數據進行分類。然后,該工具根據標簽對原始數據進行細分,并創建用于訓練機器
    的頭像 發表于 05-22 09:51 ?1577次閱讀
    NXP eIQ Time Series Studio 工具使用攻略(九)-數據<b class='flag-5'>標簽</b>

    佛瑞亞談汽車產業發展的新趨勢與新機遇

    全球汽車科技供應商FORVIA佛瑞亞集團以創新之姿閃耀2025上海車展,圓滿收官此次行業盛會!佛瑞亞集團首席執行官馬啟元(Martin FISCHER)親臨展會現場,與全球行業精英共話未來出行。今天,讓我們透過他的視角,解碼汽車產業發展的新趨勢與新機遇。
    的頭像 發表于 05-14 15:17 ?963次閱讀

    2025車展,電機新趨勢

    上展現出來的,關于電機的幾個趨勢。首先是結構升級,扁線電機、發卡繞組,已經成為主流,我們就不討論了,新型結構主要體現在繞組形式,博世、中車、五菱推出X-pin繞組方
    的頭像 發表于 05-02 08:50 ?1273次閱讀
    2025車展,電機<b class='flag-5'>新趨勢</b>

    美能光伏亮相 SolarEX Istanbul 2025 共探光伏檢測技術新趨勢

    土耳其伊斯坦布爾,與全球光伏行業專家共同探討光伏檢測技術發展新趨勢。創新技術亮相,共探光伏未來MillennialSolar美能光伏向全球觀眾全方位展示了其先進且全
    的頭像 發表于 04-15 09:03 ?1126次閱讀
    美能光伏亮相 SolarEX Istanbul 2025 共探光伏檢測技術<b class='flag-5'>新趨勢</b>

    IPC2221簡略學習筆記

    關于IPC2221的學習筆記。
    發表于 03-14 18:07 ?10次下載