国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習:小樣本學習下的多標簽分類問題初探

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:侯宇泰 ? 2021-01-07 14:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要

小樣本學習(Few-shot Learning)近年來吸引了大量的關注,但是針對多標簽問題(Multi-label)的研究還相對較少。在本文中,我們以用戶意圖檢測任務為切入口,研究了的小樣本多標簽分類問題。對于多標簽分類的SOTA方法往往會先估計標簽-樣本相關性得分,然后使用閾值來選擇多個關聯的標簽。

為了在只有幾個樣本的Few-shot場景下確定合適的閾值,我們首先在數據豐富的多個領域上學習通用閾值設置經驗,然后采用一種基于非參數學習的校準(Calibration)將閾值適配到Few-shot的領域上。為了更好地計算標簽-樣本相關性得分,我們將標簽名稱嵌入作為表示(Embedding)空間中的錨點,以優化不同類別的表示,使它們在表示空間中更好的彼此分離。在兩個數據集上進行的實驗表明,所提出的模型在1-shot和5-shot實驗均明顯優于最強的基線模型(baseline)。

1.Introduction

1.1 背景一:用戶意圖識別

用戶意圖識別是任務型對話理解的關鍵組成部分,它的任務是識別用戶輸入的話語屬于哪一個領域的哪一種意圖 [1]。

當下的用戶意圖識別系統面臨著兩方面的關鍵挑戰:

頻繁變化的領域和任務需求經常導致數據不足

用戶在一輪對話中經常會同時包含多個意圖 [2,3]

a1b2d2a6-5036-11eb-8b86-12bb97331649.png

圖1. 示例:意圖理解同時面領域繁多帶來數據不足和多標簽的挑戰

1.2 背景二:多標簽分類 & 小樣本學習

小樣本學習(Few-shot Learning)旨在像人一樣利用少量樣本完成學習,近年來吸引了大量的關注 [4,5]。

但是針對多標簽問題的小樣本學習研究還相對較少。

1.3 本文研究內容

本文以用戶意圖檢測任務為切入口,研究了的小樣本多標簽分類問題,并提出了Meta Calibrated Threshold (MCT) 和 Anchored Label Reps (ALR) 從兩個角度系統地為小樣本多標簽學習提供解決方案。

2. Problem Definition

2.1 多標簽意圖識別

如圖2所示,目前State-of-the-art多標簽意圖識別系統往往使用基于閾值(Threshold)的方法 [3,6,7],其工作流程可以大致分為兩步:

計算樣本-標簽類別相關性分數

然后用預設或從數據學習的閾值選擇標簽

2.2小樣本多標簽用戶意圖識別

觀察一個給定的有少量樣例的支持集(Support Set)

預測未見樣本(Query Instance)的意圖標簽

a1e07080-5036-11eb-8b86-12bb97331649.png

圖2. 小樣本多標簽意圖識別框架概覽

3. 方法

a20ccd1a-5036-11eb-8b86-12bb97331649.png

圖3. 我們提出的小樣本多標簽識別模型

3.1 閾值計算

(1)挑戰:

多標簽分類任務在小樣本情景下主要面臨如下挑戰:

a. 因為要從數據中學習閾值,現有方法只適用于數據充足情況。小樣本情景下,模型很難從幾個樣本中歸納出閾值;

b. 此外,不同領域間閾值無法直接遷移,難以利用先驗知識。

(2)解決方案:

為了解決上述挑戰,我們提出Meta Calibrated Threshold (MCT),具體可以分為兩步(如圖3左邊所示):

a. 首先在富數據領域,學習通用的thresholding經驗

a28d7ee2-5036-11eb-8b86-12bb97331649.png

b. 然后在Few-shot領域上,用Kernel Regression 來用領域內的知識矯正閾值 (Calibration)

a2c75306-5036-11eb-8b86-12bb97331649.png

這樣,我們在估計閾值時,既能遷移先驗知識,又能利用領域特有的知識:

a2e9003c-5036-11eb-8b86-12bb97331649.png

3.2 樣本-標簽類別相關度計算

(1)挑戰:

如圖4所示,經典的小樣本方法利用相似度計算樣本-標簽類別相關性,這在多標簽場景下會失效。

a315937c-5036-11eb-8b86-12bb97331649.png

圖4. 經典的基于相似度的小樣本學習模型:原型網絡

如圖3所示,例子中,time和location兩個標簽因為support example相同,導致這兩個類別由樣本得到的表示相同不可分,進而無法進行基于相似度的樣本-類別標簽相關度計算。

(2)解決方案:

為了解決上述挑戰,我們提出了Anchored Label Reps (ALR)。具體的,如圖三右邊所示,我們

a. 利用標簽名作為錨點來優化Embedding空間學習

b. 利用標簽名語義來分開多標簽下的類別表示

4. 實驗

4.1 主實驗結果

實驗結果顯示,我們的方法在兩個數據集上顯著的優于最強baseline。同時可以看到,我們的方法很多時候只用小的預訓練模型就超過了所有使用大預訓練模型的baseline,這在計算資源受限的情景下格外有意義。

a33248fa-5036-11eb-8b86-12bb97331649.png

表1. 主實驗結果。+E 代表使用 Electra-small (14M);+B為 BERT-base (110M)

4.2 實驗分析

圖5的消融實驗顯示所提出的ALR和MCT都對最終的效果產生了較大的貢獻。

a3a1d42c-5036-11eb-8b86-12bb97331649.png

圖5. 消融實驗

在圖6中,我們對Meta Calibrated Threshold中各步驟對最終標簽個數準確率的影響進行了探索。結果顯示Meta學習和基于Kernel Regression的Calibration過程都會極大地提升最終模型的準確率。

a3b775a2-5036-11eb-8b86-12bb97331649.png

圖6. 標簽個數準確率結果

參考文獻

[1] Young, S.; Gasiˇ c, M.; Thomson, B.; and Williams, J. D. ′ 2013. Pomdp-based statistical spoken dialog systems: A review. In Proc. of the IEEE, volume 101, 1160–1179. IEEE.

[2] Xu, P.; and Sarikaya, R. 2013. Exploiting shared information for multi-intent natural language sentence classification. In Proc. of Interspeech, 3785–3789.

[3]Qin, L.; Xu, X.; Che, W.; and Liu, T. 2020. TD-GIN: Token-level Dynamic Graph-Interactive Network for Joint Multiple Intent Detection and Slot Filling. arXiv preprint arXiv:2004.10087 .

[4] Vinyals, O.; Blundell, C.; Lillicrap, T.; Kavukcuoglu, K.; and Wierstra, D. 2016. Matching networks for one shot learning. In Proc. of NeurIPS, 3630–3638.

[5] Bao, Y.; Wu, M.; Chang, S.; and Barzilay, R. 2020. Few-shot Text Classification with Distributional Signatures. In Proc. of the ICLR.

[6] Xu, G.; Lee, H.; Koo, M.-W.; and Seo, J. 2017. Convolutional neural network using a threshold predictor for multilabel speech act classification. In IEEE international conference on big data and smart computing (BigComp), 126–130.

[7]Gangadharaiah, R.; and Narayanaswamy, B. 2019. Joint Multiple Intent Detection and Slot Labeling for GoalOriented Dialog. In Proc. of the ACL, 564–569.

責任編輯:xj

原文標題:【賽爾AAAI2021】小樣本學習下的多標簽分類問題初探

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39771

    瀏覽量

    301372
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136935
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396

原文標題:【賽爾AAAI2021】小樣本學習下的多標簽分類問題初探

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器學習特征工程:分類變量的數值化處理方法

    編碼是機器學習流程里最容易被低估的環節之一,模型沒辦法直接處理文本形式的分類數據,尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發表于 02-10 15:58 ?329次閱讀
    機器<b class='flag-5'>學習</b>特征工程:<b class='flag-5'>分類</b>變量的數值化處理方法

    機器學習深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?187次閱讀
    機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課(11大系列課程,共5000+分鐘)

    、GPU加速訓練(可選) 雙軌教學:傳統視覺算法+深度學習方案全覆蓋 輕量化部署:8.6M超輕OCR模型,適合嵌入式設備集成 無監督學習:無需缺陷樣本即可訓練高精度檢測模型 持續更新:
    發表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課程(11大系列課程,共5000+分鐘)

    、GPU加速訓練(可選) 雙軌教學:傳統視覺算法+深度學習方案全覆蓋 輕量化部署:8.6M超輕OCR模型,適合嵌入式設備集成 無監督學習:無需缺陷樣本即可訓練高精度檢測模型 持續更新:
    發表于 12-03 13:50

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業制造領域 復雜缺陷檢測:處理傳統算法難以描述的非標準化缺陷模式 非標產品分類:對形狀、顏色、紋理多變的產品進行智能分類 外觀質量評估:基于
    的頭像 發表于 11-27 10:19 ?220次閱讀

    超高頻(UHF)標簽RFID讀取器(面向項目落地的深度指南)

    超高頻(UHF)標簽RFID讀取器:一次能讀多張,怎么做到?怎么用好?(面向工程與落地的深度指南)這篇文章把“原理、設備要點、部署細節”都說清楚了,既有技術維度,也有落地建議。
    的頭像 發表于 11-01 11:37 ?566次閱讀
    超高頻(UHF)<b class='flag-5'>多</b><b class='flag-5'>標簽</b>RFID讀取器(面向項目落地的<b class='flag-5'>深度</b>指南)

    發布元服務配置應用分類標簽和資質信息(僅分發手表設備)

    配置應用分類標簽 登錄AppGallery Connect,點擊“APP與元服務”。 選擇要發布的元服務。 左側導航選擇“應用上架 > 應用信息”。 進入“應用分類標簽”區域
    發表于 10-30 17:47

    發布元服務配置應用分類標簽和資質信息

    分類標簽和資質管理”菜單選擇元服務歸屬的類別和標簽,同時將所需的資質文件提交給華為運營人員審核。資質文件審核通過后,您選擇的標簽才能生效,之后才可選擇生效
    發表于 10-29 16:47

    如何在機器視覺中部署深度學習神經網絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 在討論人工智能(AI)或深度學習時,經常會出現“神經網絡”、“黑箱”、“標注”等術語。這些概
    的頭像 發表于 09-10 17:38 ?900次閱讀
    如何在機器視覺中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b>神經網絡

    模板驅動 無需訓練數據 SmartDP解決小樣本AI算法模型開發難題

    。但是這個平臺不適用于小樣本AI模型開發,特別是一些特殊行業,數據本來就不多,但又有著需求,因此陷于兩難。面臨這種市場困境,慧視光電推出了一個全新的AI平臺Sma
    的頭像 發表于 09-09 17:57 ?1397次閱讀
    模板驅動  無需訓練數據  SmartDP解決<b class='flag-5'>小樣本</b>AI算法模型開發難題

    深度學習對工業物聯網有哪些幫助

    深度學習作為人工智能的核心分支,通過模擬人腦神經網絡的層級結構,能夠自動從海量工業數據中提取復雜特征,為工業物聯網(IIoT)提供了從數據感知到智能決策的全鏈路升級能力。以下從技術賦能、場景突破
    的頭像 發表于 08-20 14:56 ?1023次閱讀

    自動駕駛中Transformer大模型會取代深度學習嗎?

    持續討論。特別是在自動駕駛領域,部分廠商開始嘗試將模態大模型(MLLM)引入到感知、規劃與決策系統,引發了“傳統深度學習是否已過時”的激烈爭論。然而,從技術原理、算力成本、安全需求與實際落地路徑等維度來看,Transforme
    的頭像 發表于 08-13 09:15 ?4184次閱讀
    自動駕駛中Transformer大模型會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    B10 BMS技術知識初探(上、

    紹相關電子元器件分類,引導課程B15深入學習 適應對象: 所有關注電池、新能源行業發展的朋友們。 課程時長: 90 分鐘
    發表于 05-02 11:04

    嵌入式AI技術之深度學習:數據樣本預處理過程中使用合適的特征變換對深度學習的意義

    ? 作者:蘇勇Andrew 使用神經網絡實現機器學習,網絡的每個層都將對輸入的數據做一次抽象,多層神經網絡構成深度學習的框架,可以深度理解數據中所要表示的規律。從原理上看,使用
    的頭像 發表于 04-02 18:21 ?1516次閱讀

    如何排除深度學習工作臺上量化OpenVINO?的特定層?

    無法確定如何排除要在深度學習工作臺上量化OpenVINO?特定層
    發表于 03-06 07:31