国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種為小樣本文本分類(lèi)設(shè)計(jì)的結(jié)合數(shù)據(jù)增強(qiáng)的元學(xué)習(xí)框架

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:南大NLP ? 作者:孫鵬飛 ? 2021-05-19 15:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

研究背景及動(dòng)機(jī)

近些年,元學(xué)習(xí)已經(jīng)成為解決小樣本問(wèn)題的主流技術(shù),并且取得不錯(cuò)的成果。然而,由于現(xiàn)有的元學(xué)習(xí)方法大多數(shù)集中在圖像分類(lèi)上,而對(duì)文本分類(lèi)上的關(guān)注比較少。與圖像不同,同一類(lèi)別中文本具有多種表達(dá)方式,這使得當(dāng)前元學(xué)習(xí)方法的性能更容易受到每個(gè)類(lèi)別樣本數(shù)(即shot的數(shù)量)的影響。因此,現(xiàn)有的元學(xué)習(xí)方法很難在小樣本文本分類(lèi)上取得令人滿意的結(jié)果。

為了解決這個(gè)問(wèn)題,我們?cè)谠獙W(xué)習(xí)中引入了數(shù)據(jù)增強(qiáng),它帶來(lái)的好處是我們可以產(chǎn)生增強(qiáng)樣本以增加新類(lèi)別的樣本數(shù)量,并使訓(xùn)練樣本多樣化。然而,這帶來(lái)了一個(gè)新的挑戰(zhàn),如何在小樣本的情況下產(chǎn)生置信度高的樣本?

為此,我們提出了一種新穎的數(shù)據(jù)增強(qiáng)方法,稱為Ball generator,圖1給出了一個(gè)簡(jiǎn)單的例子。首先,我們計(jì)算支持集的最小包圍球,并在該球中合成樣本。我們認(rèn)為該球中的樣本具有較高的置信度,因?yàn)樗兄С旨瘶颖径及谠撉蛑校⑶宜鼈兣c球心的最遠(yuǎn)距離最小。

其次,為避免合成樣本偏差的影響,我們引入了變換模塊,以使合成樣本靠近自己的球心,并遠(yuǎn)離其他球心。此外,我們還提出了一個(gè)新的基于數(shù)據(jù)增強(qiáng)的元學(xué)習(xí)框架(MEta-Learning with Data Augmentation,MEDA),以聯(lián)合訓(xùn)練ball generator和meta-learner,使二者協(xié)同進(jìn)化。與普通元學(xué)習(xí)相比,通過(guò)增加新類(lèi)別的樣本數(shù)量,有效地提高了meta-learning在小樣本情況下的泛化能力。

950a13b4-b4a6-11eb-bf61-12bb97331649.png

圖1:Ball generator示例

02

MEDA

MEDA的框架如圖2所示。它是兩模塊組成:一個(gè)是ball generator模塊,它負(fù)責(zé)利用支持集生成增強(qiáng)支持集,并得到擴(kuò)展支持集。另一個(gè)模塊是meta-learner,它在給定了擴(kuò)展支持集的條件下計(jì)算每個(gè)查詢實(shí)例在類(lèi)別上的概率分布,表示為。而不同的meta-learner的區(qū)別在于如何實(shí)現(xiàn)。這里我們選擇原型網(wǎng)絡(luò)和關(guān)系網(wǎng)絡(luò)作為MEDA的meta-learner。

9536f29e-b4a6-11eb-bf61-12bb97331649.png

圖2: MEDA

其中,ball generator是一種特征空間數(shù)據(jù)增強(qiáng)方法。它的核心思想是在特征空間中進(jìn)行樣本的合成,并對(duì)合成的樣本進(jìn)行調(diào)整。因此,整個(gè)ball generator由兩個(gè)子模塊組成:合成模塊和變換模塊。

合成模塊利用空間采樣算法獲得相應(yīng)的合成樣本。具體是將采樣空間限制為支持集的最小包圍球,這里是球心,是半徑。然后,通過(guò)如下公式計(jì)算得到合成樣本:

95bedefc-b4a6-11eb-bf61-12bb97331649.png

這里,和。

變換模塊,它是為了進(jìn)一步避免合成樣本偏差的影響,在特征空間中對(duì)合成的樣本進(jìn)行變換操作,使合成樣本更接近自己類(lèi)別的球心,而遠(yuǎn)離其他球心。因此,我們將變換操作寫(xiě)成函數(shù),該函數(shù)以合成樣本作為輸入,產(chǎn)生一個(gè)增強(qiáng)樣本作為輸出。

03

實(shí)驗(yàn)

本文的實(shí)驗(yàn)是在SNIPS和ARSC數(shù)據(jù)集上進(jìn)行的。我們將MEDA與三組baseline模型進(jìn)行了比較。第一組是數(shù)據(jù)增強(qiáng)的模型;第二組是傳統(tǒng)的元學(xué)習(xí)模型;第三組是最新的小樣本文本分類(lèi)的SOTA模型。實(shí)驗(yàn)結(jié)果如表1和2所示。

表1:SNIPS實(shí)驗(yàn)結(jié)果

9634ec8c-b4a6-11eb-bf61-12bb97331649.png

表2: ARSC實(shí)驗(yàn)結(jié)果

967c6e36-b4a6-11eb-bf61-12bb97331649.png

從實(shí)驗(yàn)結(jié)果上來(lái)看,由于通過(guò)數(shù)據(jù)增強(qiáng)獲得更多的訓(xùn)練樣本,使得MEDA在兩個(gè)數(shù)據(jù)集上都取得一致且顯著的提升。

為了更進(jìn)一步說(shuō)明模型的shot數(shù)量對(duì)模型的影響,我們?cè)O(shè)計(jì)相應(yīng)的實(shí)驗(yàn)。如圖3所示,我們可以觀察到MEDA在所有設(shè)置中都取得了最好的表現(xiàn)。特別地,MEDA的準(zhǔn)確率隨著shot數(shù)量的減少而增加(間距變大),這表明當(dāng)shot數(shù)相對(duì)較小時(shí),模型效果的提升更明顯。

96bf7cc6-b4a6-11eb-bf61-12bb97331649.png

圖3: 不同shot數(shù)量對(duì)模型準(zhǔn)確率的影響

此外,我們還研究了模型的準(zhǔn)確性如何隨著增強(qiáng)樣本數(shù)量的變化而變化。我們畫(huà)出不同模型在SNIPS數(shù)據(jù)集上的準(zhǔn)確率變化情況。如圖4所示:

970f03f4-b4a6-11eb-bf61-12bb97331649.png

圖4: 不同模型的平均準(zhǔn)確率隨增強(qiáng)樣本數(shù)量的變化而變化

可以看到,隨著增強(qiáng)樣本數(shù)量的增加,模型的準(zhǔn)確率有所提高。同時(shí),我們比較5-shot和10-shot的實(shí)驗(yàn)設(shè)置,我們發(fā)現(xiàn)通過(guò)模型增強(qiáng)5個(gè)樣本與使用5個(gè)真實(shí)樣本的效果幾乎相同,這意味著我們的MEDA不是簡(jiǎn)單地復(fù)制樣本,而是為模型生成有意義的樣本。

04

總結(jié)

在本文中,我們提出了一種新穎的數(shù)據(jù)增強(qiáng)方法,稱為ball generator,以增加新類(lèi)別的樣本數(shù)量。此外,我們還提出了一個(gè)新的框架MEDA,該框架聯(lián)合優(yōu)化了ball generator和meta-learner,從而使ball generator可以學(xué)習(xí)生成最適合meta-learner的增強(qiáng)樣本。更多的細(xì)節(jié)、結(jié)果以及分析請(qǐng)參考原論文。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94757
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4417

    瀏覽量

    67502

原文標(biāo)題:IJCAI2021論文:MEDA:一種為小樣本文本分類(lèi)設(shè)計(jì)的結(jié)合數(shù)據(jù)增強(qiáng)的元學(xué)習(xí)框架

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)特征工程:分類(lèi)變量的數(shù)值化處理方法

    編碼是機(jī)器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之,模型沒(méi)辦法直接處理文本形式的分類(lèi)數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red
    的頭像 發(fā)表于 02-10 15:58 ?329次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>特征工程:<b class='flag-5'>分類(lèi)</b>變量的數(shù)值化處理方法

    一種無(wú)OS的MCU實(shí)用軟件框架

    介紹一種無(wú)OS的MCU實(shí)用軟件框架,包括任務(wù)輪詢管理,命令管理器、低功耗管理、環(huán)形緩沖區(qū)等實(shí)用模塊。系統(tǒng)中廣泛利用自定義段技術(shù)減少各個(gè)模塊間的耦合關(guān)系,大大提供程序的可維護(hù)性。 主要功能 支持模塊
    發(fā)表于 01-08 06:58

    詳解DBC的Signal與JSON文本結(jié)合

    為了優(yōu)化CAN數(shù)據(jù)發(fā)送與接收的操作流程,更改以前手動(dòng)輸入狀態(tài)對(duì)應(yīng)數(shù)據(jù)的模式,采用下拉列表選擇內(nèi)容,但這需要用到超出DBC原有承載能力的信息。因此,將JSON與其結(jié)合,采用JSON格式文本
    的頭像 發(fā)表于 01-06 10:57 ?297次閱讀
    詳解DBC的Signal與JSON<b class='flag-5'>文本</b><b class='flag-5'>結(jié)合</b>

    發(fā)布服務(wù)配置內(nèi)容分級(jí)

    ”。 8.如果您最終選擇的年齡分級(jí)3、8或者12,點(diǎn)擊“提交”后,您還需再次確認(rèn)您的服務(wù)是否僅面向兒童。 選擇“是”:如果服務(wù)分類(lèi)是兒童類(lèi),點(diǎn)擊“確認(rèn)”成功提交分級(jí);如果
    發(fā)表于 11-21 11:29

    發(fā)布服務(wù)配置應(yīng)用分類(lèi)、標(biāo)簽和資質(zhì)信息(僅分發(fā)手表設(shè)備)

    ,參考華為應(yīng)用市場(chǎng)應(yīng)用分類(lèi)規(guī)則,選擇服務(wù)分類(lèi)。 5.點(diǎn)擊“管理標(biāo)簽”,選擇服務(wù)的標(biāo)簽。 最多可以選擇5個(gè)標(biāo)簽,且必須設(shè)置其中個(gè)為主標(biāo)簽
    發(fā)表于 10-30 17:47

    發(fā)布服務(wù)配置應(yīng)用分類(lèi)、標(biāo)簽和資質(zhì)信息

    聯(lián)。 說(shuō)明 暫不支持“分類(lèi)標(biāo)簽和資質(zhì)管理”菜單的存量非手表服務(wù),可參考僅分發(fā)手表設(shè)備分別前往應(yīng)用信息和版本信息頁(yè)面,分開(kāi)配置應(yīng)用分類(lèi)標(biāo)簽與版權(quán)信息。 若您也希望這部分
    發(fā)表于 10-29 16:47

    模板驅(qū)動(dòng) 無(wú)需訓(xùn)練數(shù)據(jù) SmartDP解決小樣本AI算法模型開(kāi)發(fā)難題

    。但是這個(gè)平臺(tái)不適用于小樣本AI模型開(kāi)發(fā),特別是些特殊行業(yè),數(shù)據(jù)本來(lái)就不多,但又有著需求,因此陷于兩難。面臨這種市場(chǎng)困境,慧視光電推出了個(gè)全新的AI平臺(tái)Sma
    的頭像 發(fā)表于 09-09 17:57 ?1397次閱讀
    模板驅(qū)動(dòng)  無(wú)需訓(xùn)練<b class='flag-5'>數(shù)據(jù)</b>  SmartDP解決<b class='flag-5'>小樣本</b>AI算法模型開(kāi)發(fā)難題

    一種適用于動(dòng)態(tài)環(huán)境的自適應(yīng)先驗(yàn)場(chǎng)景-對(duì)象SLAM框架

    由于傳統(tǒng)視覺(jué)SLAM在動(dòng)態(tài)場(chǎng)景中容易會(huì)出現(xiàn)嚴(yán)重的定位漂移,本文提出了一種新穎的基于場(chǎng)景-對(duì)象的可靠性評(píng)估框架,該框架通過(guò)當(dāng)前幀質(zhì)量指標(biāo)以及相對(duì)于可靠參考幀的場(chǎng)景變化,全面評(píng)估SLAM的
    的頭像 發(fā)表于 08-19 14:17 ?873次閱讀
    <b class='flag-5'>一種</b>適用于動(dòng)態(tài)環(huán)境的自適應(yīng)先驗(yàn)場(chǎng)景-對(duì)象SLAM<b class='flag-5'>框架</b>

    一種帶通濾波器在無(wú)位置傳感器轉(zhuǎn)子檢測(cè)中的應(yīng)用

    摘 要:論文研究了一種直流無(wú)刷電機(jī)的無(wú)位置傳感器的轉(zhuǎn)子位置的硬件電路檢測(cè)方法。結(jié)合傳統(tǒng)“反電動(dòng)勢(shì)\"方法,分析并設(shè)計(jì)了一種新的帶通濾波器延時(shí)檢測(cè)電路。該電路不僅可以抑制高頻分量和消除直流
    發(fā)表于 08-04 14:56

    一種基于擴(kuò)散模型的視頻生成框架RoboTransfer

    在機(jī)器人操作領(lǐng)域,模仿學(xué)習(xí)是推動(dòng)具身智能發(fā)展的關(guān)鍵路徑,但高度依賴大規(guī)模、高質(zhì)量的真實(shí)演示數(shù)據(jù),面臨高昂采集成本與效率瓶頸。仿真器雖提供了低成本數(shù)據(jù)生成方案,但顯著的“模擬到現(xiàn)實(shí)”(Sim2Real)鴻溝,制約了仿真
    的頭像 發(fā)表于 07-09 14:02 ?833次閱讀
    <b class='flag-5'>一種</b>基于擴(kuò)散模型的視頻生成<b class='flag-5'>框架</b>RoboTransfer

    HarmonyOS NEXT意圖框架習(xí)慣推薦場(chǎng)景說(shuō)明

    、概述 意圖框架是HarmonyOS系統(tǒng)級(jí)的意圖標(biāo)準(zhǔn)體系。將應(yīng)用和服務(wù)的業(yè)務(wù)功能智慧分發(fā)給不同的系統(tǒng)入口,以“音樂(lè)播放”例,HarmonyOS將業(yè)務(wù)分發(fā)給“小藝建議”,提供了桌面
    發(fā)表于 06-18 15:06

    嵌入式AI技術(shù)漫談:怎么訓(xùn)練AI模型采集樣本數(shù)據(jù)

    多少數(shù)據(jù),才能形成合適的樣本集,進(jìn)而開(kāi)始訓(xùn)練模型呢? 此時(shí),回答“按需提供”或者“先試試看”似乎會(huì)變成句車(chē)轱轆話,看似回答了問(wèn)題,但客戶還是無(wú)從下手。 AI數(shù)據(jù)
    的頭像 發(fā)表于 06-11 16:30 ?1371次閱讀

    寬調(diào)速范圍低轉(zhuǎn)矩脈動(dòng)的一種新型內(nèi)置式永磁同步電機(jī)的設(shè)計(jì)與分析

    摘要:寬調(diào)速范圍與低轉(zhuǎn)矩脈動(dòng)直是設(shè)計(jì)電動(dòng)汽車(chē)用內(nèi)置式永礎(chǔ)同步電機(jī)時(shí)所追求的重要目標(biāo)。設(shè)計(jì)了一種轉(zhuǎn)子結(jié)構(gòu)胃的新型內(nèi)置式永礎(chǔ)同步電機(jī),并進(jìn)行了繞組結(jié)構(gòu)優(yōu)化與性能分析。利用有限分析法,
    發(fā)表于 06-06 14:13

    一種實(shí)時(shí)多線程VSLAM框架vS-Graphs介紹

    針對(duì)現(xiàn)有VSLAM系統(tǒng)語(yǔ)義表達(dá)不足、地圖可解釋性差的問(wèn)題,本文提出vS-Graphs,一種實(shí)時(shí)多線程VSLAM框架。該方案顯著提升了重建地圖的語(yǔ)義豐富度、可解釋性及定位精度。實(shí)驗(yàn)表明
    的頭像 發(fā)表于 04-19 14:07 ?1001次閱讀
    <b class='flag-5'>一種</b>實(shí)時(shí)多線程VSLAM<b class='flag-5'>框架</b>vS-Graphs介紹

    嵌入式AI技術(shù)之深度學(xué)習(xí)數(shù)據(jù)樣本預(yù)處理過(guò)程中使用合適的特征變換對(duì)深度學(xué)習(xí)的意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)框架,可以深度理解
    的頭像 發(fā)表于 04-02 18:21 ?1516次閱讀