国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹兩個few-shot NER中的challenge

深度學(xué)習(xí)自然語言處理 ? 來源:AI Station ? 作者:QI ? 2022-08-24 10:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

Introduction-現(xiàn)有什么問題、怎么解決

此部分著重介紹了兩個few-shot NER中的challenge:limited information challenge和knowledge mismatch challenge。前者主要是指樣本數(shù)少,后者是指不同的數(shù)據(jù)集中同一個實體可能被分成了不同的類別標(biāo)簽。(比如“America”在Wikipedia被分為geographic , 在 OntoNotes中被分為GPE, 在WNUT17被分為location )

本文最重要的思想基于這樣一個假設(shè):不論是否是未知的實體類別,都可以用一個概念集中的若干概念來描述(all entity types can be described using the same set of concepts)。這樣可以解決knowledge mismatch challenge,而且在給了幾個少樣本后,可以根據(jù)這幾個少樣本構(gòu)建新實體類別到概念集的映射,這樣可以直接用映射后的若干概念識別實體,進而解決limited information challenge。下圖是實體類別到概念集的映射舉例。

93bd0394-22ce-11ed-ba43-dac502259ad0.jpg

02

SDNet: Self-describing Networks for FS-NER

2.1 SDNet核心部分: Mention describing、Entity generation

這部分將主要介紹SDNet怎么進行命名實體識別的,主要包括:Mention describing(從給的sentence構(gòu)建該實體的concept description)和Entity generation(根據(jù)給的實體類型逐個生成句子中的實體詞)。

以下圖為例,輸入一個sentence(以[MD]作為起始符),SDNet將輸出novel series這樣的concept description。輸入一個以[EG]作為起始符、實體類別名+相關(guān)的concept description以及待識別的sentence作為內(nèi)容的文本,SDNet將輸出Harry Potter is creative work.這樣的回答。這兩個過程分別對應(yīng)Mention describing和Entity generation。

93d176ee-22ce-11ed-ba43-dac502259ad0.png

2.2 模型工作流程

93dc6414-22ce-11ed-ba43-dac502259ad0.jpg

a、預(yù)訓(xùn)練階段

左上角的維基百科上有大量的句子,句子中的人物、地點、公司等都有相應(yīng)的維基百科給的標(biāo)簽和描述。預(yù)訓(xùn)練階段根據(jù)2.1部分介紹的模板,進行[MD]和[EG]兩個任務(wù)的Seq2Seq任務(wù)的訓(xùn)練。

b、微調(diào)與解碼階段

這部分對應(yīng)于Few-shot NER的少樣本階段。給了一些帶標(biāo)注的少量樣本句子,我們知道了這些句子中那些單詞是實體部分,把這些實體部分添加到以[MD]開頭的模板并輸入到SDNet中,模型會生成這些實體部分描述,并將生成的描述加入到新類別的概念描述集中,并在預(yù)測階段輸入添加了新類別的[EG]開頭的模板,根據(jù)生成的結(jié)果判斷待預(yù)測的句子中哪些單詞部分是該類別的實體。

以上圖中為例,給的少樣本中Iran是GPE類別的實體,SDNet先用[MD]開頭的模板生成了Iran是country的描述,將country加入到屬于GPE這個新類別的概念描述集合中,在預(yù)測階段用[EG]開頭的模板輸入GPE這個類別名、其包含的概念描述以及待識別的句子,生成屬于GPE的實體詞,完成實體識別。

c、Filtering Strategy

在眾多下游任務(wù)中,SDNet可能會遇到難以生成新實體類別描述的情況(或者或生成不準(zhǔn)確的描述),因此SDNet在訓(xùn)練階段可以對于那些不去確定的instance生成other的描述詞。如果給少量樣本生成的描述詞中有0.5以上的other,將在最后的decode階段直接使用新實體類別名(如GPE)。(實驗部分可以看到這個策略帶來了一定的提升)

具體實現(xiàn)過程將不再贅述,可以看原文的第4部分,有對預(yù)訓(xùn)練和fintune階段的詳細介紹。

03

實驗部分

93f542f4-22ce-11ed-ba43-dac502259ad0.jpg

這種借助先驗知識的方式,在6個數(shù)據(jù)集上都取得了很好的效果,尤其是對一些之前的識別效果一直很差的(比如I2B2),這說明這種通用的實體概念集合在各種類別間是通用的。

04

評價

優(yōu)點

為少樣本NER引用外部知識提供了新思路,且提供了可直接使用的,通用的預(yù)訓(xùn)練模型,可以為后來的研究工作提供參考。

可能的缺陷

在很多新領(lǐng)域下(尤其涉及到domain transfer)的,可能會出現(xiàn)很多無法描述成概念集合的實體類別,出現(xiàn)大量的other,這時只能用實體類別名了,在完全不重疊的領(lǐng)域之間可能效果會不佳。

另外,預(yù)訓(xùn)練階段使用的維基百科,大量的是事件人物地點等這些廣泛且常用的,面對實際應(yīng)用中的非常見實體類別時,可能做不到很好的描述。

在大量的語料中進行訓(xùn)練,可能出現(xiàn)了“泄露”,當(dāng)然這只是一個猜測。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SDNet
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    5794

原文標(biāo)題:ACL2022 | 基于自描述網(wǎng)絡(luò)的小樣本命名實體識別

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    兩個RS485(Modbus RTU)主站與主站之間如何通訊

    本產(chǎn)品能很好解決Master-1主站向模塊寫入數(shù)據(jù),Master-2主站讀取數(shù)據(jù);Master-2主站向模塊寫入數(shù)據(jù),Master-1主站讀取數(shù)據(jù)。由此解決兩個主站之間的互相讀通信難題。
    的頭像 發(fā)表于 02-08 15:32 ?629次閱讀
    <b class='flag-5'>兩個</b>RS485(Modbus RTU)主站與主站之間如何通訊

    兩個RS485-Modbus主站如何通訊

    本產(chǎn)品能很好解決Master-1主站向模塊寫入數(shù)據(jù),Master-2主站讀取數(shù)據(jù);Master-2主站向模塊寫入數(shù)據(jù),Master-1主站讀取數(shù)據(jù)。由此解決兩個主站之間的互相讀通信難題。
    發(fā)表于 02-08 15:32 ?0次下載

    AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動

    第四屆AICAS Grand Challenge——AICAS 2026全球技術(shù)挑戰(zhàn)賽現(xiàn)已正式啟動,誠邀各界英才和技術(shù)先鋒共同參與,以“芯”智能驅(qū)動未來!
    的頭像 發(fā)表于 02-04 14:59 ?503次閱讀

    使用博圖(TIA Portal)監(jiān)控PROFINET從站通訊狀態(tài)的兩個方法

    如何使用博圖監(jiān)控Profinet從站通訊狀態(tài),這里有兩個方法供你選擇。 方法一 | 使用DeviceStates指令 創(chuàng)建全局數(shù)據(jù)塊 在博圖項目中,創(chuàng)建一全局數(shù)據(jù)塊(DB),用于存儲從站狀態(tài)信息
    的頭像 發(fā)表于 01-17 11:21 ?1239次閱讀
    使用博圖(TIA Portal)監(jiān)控PROFINET從站通訊狀態(tài)的<b class='flag-5'>兩個</b>方法

    曙光存儲連續(xù)斬獲兩個行業(yè)獎項

    近期,曙光存儲連續(xù)斬獲兩個行業(yè)獎項,自研技術(shù)產(chǎn)品在國產(chǎn)突破、AI行業(yè)應(yīng)用等方面的成果獲得廣泛關(guān)注。
    的頭像 發(fā)表于 01-15 16:28 ?2483次閱讀

    一文讀懂:直線模組兩個滑塊距離能否調(diào)節(jié)?

    關(guān)鍵問題:直線模組兩個滑塊距離可以調(diào)節(jié)嗎?答案并非絕對,而是要根據(jù)直線模組的具體類型、結(jié)構(gòu)設(shè)計來綜合判斷,不同類型的直線模組在滑塊距離調(diào)節(jié)上有著截然不同的特性。?飛
    的頭像 發(fā)表于 12-29 15:47 ?237次閱讀
    一文讀懂:直線模組<b class='flag-5'>兩個</b>滑塊距離能否調(diào)節(jié)?

    FreeRtos 能否同時使用兩個 CPU?

    的情況下,CM0 更愿意專門用于管理外設(shè)。 - 是否有在 CM0 和 CM4 同時運行代碼的簡單示例或教程? - FreeRtos 能否同時使用兩個 CPU?
    發(fā)表于 11-11 08:28

    AI智能大模型,你身邊的最好用的辦公提效小能手

    幾十億到數(shù)萬億; 任務(wù)廣:一次訓(xùn)練可以支持多個任務(wù),具備通用能力; 適應(yīng)快:只需少量樣例,就能遷移到新任務(wù)Few-shot、Zero-shot)。 訊維AI智能大模型訓(xùn)練流程包含以下幾個步驟: 1.收集數(shù)據(jù):包括書籍、百科、
    的頭像 發(fā)表于 09-30 10:59 ?329次閱讀

    硬件SPI兩個CS操作兩個norflash,怎么互斥操作兩個norflash?

    硬件SPI兩個CS操作兩個norflash,怎么互斥操作兩個norflash,有一norflash被模擬成U盤,會在中斷
    發(fā)表于 09-26 06:18

    基本半導(dǎo)體連獲兩個行業(yè)獎項

    近日,基本半導(dǎo)體憑借在碳化硅模塊領(lǐng)域的突出表現(xiàn),連獲“國產(chǎn)SiC模塊TOP企業(yè)獎”和“年度優(yōu)秀功率器件產(chǎn)品獎”兩個行業(yè)獎項。
    的頭像 發(fā)表于 09-05 16:31 ?1095次閱讀

    圖中兩個按鍵開關(guān)是兩個干簧管,為什么不直接對GND設(shè)計來檢測這個干簧管通斷呢?

    圖中兩個按鍵開關(guān)是兩個干簧管,為什么不直接對GND設(shè)計來檢測這個干簧管通斷呢? 這樣設(shè)計的原理是什么?
    發(fā)表于 06-17 06:30

    看到STM8L152用兩個IO用兩個或非門檢測兩個通斷,是什么原理呢?

    圖中兩個按鍵開關(guān)是兩個干簧管,為什么不直接對GND設(shè)計來檢測這個干簧管通斷呢? 這樣設(shè)計的原理是什么?
    發(fā)表于 06-12 06:25

    有可能在 FX3 GPIF2 創(chuàng)建兩個獨立的狀態(tài)機嗎?

    我想,如果我想通過 FX3 GPIF2 創(chuàng)建兩個獨立的傳輸流接口,我需要在 GPIF2 設(shè)計器創(chuàng)建兩個獨立的狀態(tài)機,我是否有可能在 GPIF2 設(shè)計器創(chuàng)建
    發(fā)表于 05-20 06:14

    ADAU1787四ADC、兩個DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊

    ADAU1787 是一款具有四輸入和兩個輸出的編解碼器,其中整合了兩個數(shù)字信號處理器 (DSP)。從模擬輸入到 DSP 內(nèi)核再到模擬輸出的路徑已針對低延遲進行優(yōu)化,適用于噪聲消除耳機。通過加入少量無源組件,ADAU1787 提
    的頭像 發(fā)表于 05-12 14:57 ?1514次閱讀
    ADAU1787四<b class='flag-5'>個</b>ADC、<b class='flag-5'>兩個</b>DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊

    兩個EMC抗干擾的經(jīng)典案例

    一前言從輻射角度總結(jié)來說,形成天線效應(yīng)的可能有三種情況;從輻射抗干擾角度來說,單極子天線和環(huán)形天線需要重點尋找及關(guān)注,定向的找到這些等效天線或許就能解決問題。下面以篇案例介紹。二手持抗干擾測試在手
    的頭像 發(fā)表于 04-22 11:33 ?1365次閱讀
    <b class='flag-5'>兩個</b>EMC抗干擾的經(jīng)典案例