国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NLP:關系抽取到底在乎什么

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:高能A ? 2021-01-07 14:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

關系抽取到底在乎什么?這是來自EMNLP20上清華大學劉知遠團隊的“靈魂發問”~ 關系抽取是每一位NLPer都很熟知的任務,特別是基于BERT的神經關系抽取模型已經登頂各大榜單SOTA,某些甚至直逼人類表現。但也許你和JayJay一樣,可能只是調個包、從不過問關系抽取的核心要素是啥吧~ 在劉知遠老師的EMNLP20論文《Learning from Context or Names? An Empirical Study on Neural Relation Extraction》中,就「關系抽取到底在乎什么」這一問題進行深入全面的探究,是難得的好文!

注意:本文所稱的關系抽取也稱關系分類,即判斷兩個實體

論文下載:https://arxiv.org/pdf/2010.01923.pdfgithub開源:https://github.com/thunlp/RE-Context-or-Names 為具備更好的閱讀體驗,本文以QA形式進行組織:

8316f48a-5036-11eb-8b86-12bb97331649.png

我們廢話不說,先po結論(劃重點): 1、對關系抽取的兩個主要特征(上下文信息和實體信息),進行了對比分析發現:

上下文信息 和 實體信息 對于關系模型都很關鍵;

上下文信息是關系模型的主要信息來源;

實體信息中最重要的實體類型信息,但模型會存在對實體信息的過度依賴問題;

現有的數據集可能會通過實體泄漏淺層的啟發式信息,導致當前關系任務的指標虛高!

2、構建了關系預訓練模型,基于關系抽取的實體遮蔽的對比學習框架:

能幫助模型更好地的借助上下文信息和實體類型信息,避免“死記硬背”實體表面表述;

提高了多個場景下神經關系抽取模型的有效性和魯棒性,特別是在低資源場景下;

Q1: 關系抽取為什么主要利用「上下文信息」和「實體信息」?

836f28e4-5036-11eb-8b86-12bb97331649.png

為什么本篇論文會選取上下文和實體信息進行對比研究呢?作者認為:

上下文信息:從人的直覺來看,文本上下文是主要的信息來源;最為簡單的一種方式,就是可以用關系模板進行歸納。如上圖所示,「... be founded ... by ...」模板就可以很好地映射到某一類關系上。因此,上下文關系肯定會對關系預測結構起著某種作用。

實體信息:實體信息主要包括實體類型、實體ID、實體屬性信息等,如果實體可以被鏈接到知識圖譜上,那么相關信息也可以被模型所利用。既然關系抽取基于實體pair進行的分類預測,那么實體信息就必不可少了。

Q2: 關系抽取的baseline模型選擇哪些?

83a4f046-5036-11eb-8b86-12bb97331649.png

為了更好地進行分析驗證,本文主要主要采取CNN、BERT、MTB三種模型進行實驗(如上圖所示):采取BERT時主要是提取實體pair的相關標識符對應的表示進行關系分類。 MTB是由Google在2019年提出預訓練關系模型 ,其只在獲得更好的適配于關系抽取的特征表示,其具體的預訓練方式為:認為包含相同實體pair的句子表示相同的關系,將相似度得分作為預訓練目標,如下圖示意。

83cfc8de-5036-11eb-8b86-12bb97331649.png

Q3: 「上下文信息」和「實體信息」到底哪家強?

83fbcfb0-5036-11eb-8b86-12bb97331649.png

為了分析「上下文信息」和「實體信息」對于關系模型的內在影響,論文設置眾多輸入格式(如上圖所示):

Context+Mention (C+M) :即最為廣泛的使用方式,在原句子輸入的同時,強調實體mention:對于BERT模型,采用位置向量和特殊的實體標識符來強化metion。

Context+Type (C+T) :將實體mention用其實體類型Type代替,如上圖,「SpaceX」用「organization」代替,「Elon Musk」用「person」代替。

Only Context (OnlyC) :即只利用上下文信息,將實體mention用「subject」或「object」代替,通過這種方式可以將實體信息源完全阻擋。

Only Mention (OnlyM) :即只利用實體提及,忽略其他文本上下文的輸入。

Only Type (OnlyT) :即只利用實體類型信息,如「organization」「SEP」「person」。

論文通過上述設置在最大的有監督關系數據集TACRED上(共42種關系,10w+實例)進行了相關實驗,結果如下(指標為micro F1值):

842bd2fa-5036-11eb-8b86-12bb97331649.png

由上圖的紅框(OnlyC、OnlyM、OnlyT)可以看出,只利用上下文信息或實體信息指標都大幅下降,這表明:上下文信息 和 實體信息 對于關系模型都很關鍵;

844a9e56-5036-11eb-8b86-12bb97331649.png

由上圖的紅框可以看出,C+M和C+T表現一致,這表明:實體提及中的類型Type信息很重要!這與之前女神的SOTA《反直覺!陳丹琦用pipeline方式刷新關系抽取SOTA》中關于「類型信息」的重要性相互佐證~

84aadf96-5036-11eb-8b86-12bb97331649.png

由上圖的紅框可以看出:

OnlyC總體高于OnlyM,可以看出:上下文信息比實體信息更重要~(PS:CNN中OnlyC沒有明顯高于OnlyM,也說明其上下文的捕捉能力不如BERT吧)

OnlyM也有較高指標,這表明:現有的數據集可能會通過實體泄漏淺層的啟發式信息,導致當前關系任務的指標虛高!

此外,本篇論文也通過Case Study進一步證明了上述結果、并有了新的發現:

C+M與C+T類似,共享95.7%的正確預測和68.1%的錯誤預測,充分說明了實體提及的主要的信息來源是其類型Type信息。

C+M容易對實體提及產生過高的偏置依賴,特別是容易對訓練集中的實體提及進行“死記硬背”,如下圖:模型容易死記住訓練集中「Washington」的實體提及只存在于「stateorprovinceofresidence 」關系中,從而導致關系預測錯誤。

84dae8d0-5036-11eb-8b86-12bb97331649.png

C+T不容易捕捉共指信息和語義信息,如下圖所示,「Natalie」和「she」兩個實體如果被實體Type替代后,不容易捕捉到原有的共指關系:

850591ca-5036-11eb-8b86-12bb97331649.png

再通過對OnlyC的case分析中發現:人類可以本能地從上下文中判斷關系,但模型似乎在捕捉上下文信息的能力上還有很大缺失。如下圖所示,具體體現在3個方面:

Wrong:對于那些很清晰的關系模式仍然會預測錯誤。

No pattern:對于那些不具備pattern的關系會預測錯誤。

Confusing:對于困惑的關系類型缺乏魯棒能力。

85514c14-5036-11eb-8b86-12bb97331649.png

Q4: 如何提升關系模型的預測性能? 從上文的分析中,我們可以發現:上下文信息和實體信息對于關系模型都很重要,但在一些情況下,關系模型并不能很好地理解關系模式、會過度依賴于實體mention的淺層提示信息。 為了更好地捕捉上下文信息和實體類型Type信息,論文提出了一種基于實體遮蔽的對比學習框架,來進行關系預訓練。 1、對比學習數據生成方法

860d47ca-5036-11eb-8b86-12bb97331649.png

對比學習預訓練框架如上圖所示,論文借鑒了「對比學習」的思想,通過聚合“neighbors”、分離“non-neighbors”來學習特征表示;通過這種模式,“neighbors”具備相似的表示。因此,定義“neighbors”對于對比學習至關重要。

本文定義:實體pair共享同種關系的句子是“neighbors”。

為了防止模型在預訓練過程中對實體mention死記硬背、或者抽取比較淺層的表面特征,作者采取了隨機mask實體的辦法,將實體mention替換為「BLANK」,替換率為0.7. 事實上,生成預訓練數據是通過遠程監督的方法進行,這雖然會造成噪聲;但作者認為噪聲問題對于預訓練框架不是關鍵的,因為:預訓練目標是相對于像BERT這樣的原始預訓練模型,獲得相對更好的關系表示,而不是直接訓練關系模型對于下游任務,因此數據中的噪聲是可以接受的。 通過上述的對比學習生成方法,預訓練模型可以學習更好地從實體metion中掌握類型Type信息,并從文本上下文中提取關系語義:

成對的兩個句子雖然包含不同的實體pair,但共享相同的關系,提示模型發現這些實體mention之間的聯系。此外,實體mask策略可以有效地避免簡單的記憶實體mention。這最終鼓勵模型利用實體類型Type信息。

生成策略提供了相同關系類型下的多種上下文集合,這有利于模型學習從多種表達方式中提取關系pattern。

2、對比學習訓練目標 上述預訓練的目標函數共包含兩部分:對比學習目標( Contrastive Pre-training,CP)和遮蔽語言模型(MLM):

8683c74c-5036-11eb-8b86-12bb97331649.png

對比損失CP采取隨機負樣本采樣,加速訓練過程。 3、對比學習實驗結果

86a806fc-5036-11eb-8b86-12bb97331649.png

基于對比學習的預訓練框架的關系模型最終表現如何?作者在不同的數據集上設置不同數據使用量(1%、10%、100%)進行了對比分析,發現:對比學習模型CP在不同數據集上均超過了BERT和MTB,特別是在低資源(1%數據量)條件下也能呈現較高指標,如上圖紅框所示。 可見,對比學習機制相比于Google的MTB模型更具備多樣性的數據特征、能更充分的學習實體類型Type信息。

總結 本文主要基于「關系抽取到底在乎什么」、「上下文和實體mention如何影響關系模型」進行了討論,發現:

文本上下文和實體mention都給關系模型提供了關鍵信息;

關系抽取數據集可能會通過實體泄漏淺層的啟發式信息,導致當前關系任務的指標虛高!

關系模型并不能很好地理解關系模式、會過度依賴于實體mention的淺層提示信息

基于上述幾點,論文提出了一種基于實體遮蔽的對比學習框架來改進關系模型的表現,最終提高了多個場景下神經關系抽取模型的有效性和魯棒性(特別是在低資源條件下)。 有了本文全面的實驗分析,或許未來我們可以進一步研究開放關系抽取和關系發現問題,這些需要我們考慮zero-shot問題,但可以確信:預訓練關系模型將對這些領域產生積極影響。

責任編輯:xj

原文標題:劉知遠老師的“靈魂發問”:關系抽取到底在乎什么?

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自然語言
    +關注

    關注

    1

    文章

    292

    瀏覽量

    13986
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23280
  • 知識圖譜
    +關注

    關注

    2

    文章

    132

    瀏覽量

    8315

原文標題:劉知遠老師的“靈魂發問”:關系抽取到底在乎什么?

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個分支,它會教計算機如何理解口頭和書面形式的人類語言。自然語言處理將計算語言學與機器學習和深度學習相結合來處理語音和文本數據,這些數據也可以與其他類型的數據一起用于開發智能工程系統。
    的頭像 發表于 01-29 14:01 ?361次閱讀
    自然語言處理<b class='flag-5'>NLP</b>的概念和工作原理

    Modbus產品腳本編輯器“映射關系”解釋?映射關系的地址對應關系

    Modbus產品腳本編輯器“映射關系”解釋?映射關系的地址對應關系
    發表于 01-20 15:28

    因網絡問題未獲取到信息,可提供附件用于撰寫電子工程師設計博文

    很遺憾,在搜索相關信息時遇到了網絡問題(504 Gateway Time - out),暫時未能獲取到有用內容。你可以直接將附件提供給我,我會根據附件中的內容為你撰寫電子工程師設計博文。 文件下載: tps99001-q1.pdf
    的頭像 發表于 12-11 15:50 ?709次閱讀

    模數轉換器(ADC)到底在干嘛?

    模數轉換器是一種用于將模擬信號(如光敏電阻或熱敏電阻的輸出)轉換為可由數字計算機或微控制器處理的二進制信號的設備。將模擬信號轉換為二進制數字信號有多種方法,但在本教程中我們將討論逐次逼近法,因為這可能是最常用的方法。采樣每個交流波形都有特定的頻率、波長和振幅。為了將這種波轉換成數字信號,我們以周期性間隔(稱為采樣率)測量交流波形的振幅。更高的采樣率將產生更精
    的頭像 發表于 11-24 19:05 ?1300次閱讀
    模數轉換器(ADC)<b class='flag-5'>到底在</b>干嘛?

    單片機和嵌入式,到底是什么關系

    關系:什么是單片機?什么是嵌入式?它們到底是不是一回事?先說說大家最先聽說的那個詞——單片機(MCU)。單片機,全稱是MicrocontrollerUnit,顧名思
    的頭像 發表于 11-14 10:28 ?1500次閱讀
    單片機和嵌入式,<b class='flag-5'>到底</b>是什么<b class='flag-5'>關系</b>?

    國產測頭與雷尼紹測頭的差距到底在哪里

    就和您盤一盤, 好的測頭和差的測頭(也叫機床測頭,機床探頭),到底有什么樣的區別。 說到用測頭,客戶通常不外乎看中兩個價值:一是大大減少調機時間,提高生產效率;二是提高產品質量,達成零件精度,確保
    發表于 10-29 23:52

    rt_object_get_information獲取到的鏈表為空怎么解決?

    rtt啟動過程,在初始化堆的時候,進入rt_object_init,調用rt_object_get_information獲取到的鏈表為空,導致系統起不來。
    發表于 10-11 11:44

    請問在移植rtthread nano版時官網里面系統時鐘函數在哪里實現的?

    我在已有的華大HC32開發板的LED例程里我找不到官網移植教程里的這三個函數,文檔也沒說明這三個函數的移植步驟?到底在哪里找的?是rtthread里的實現還是需要用戶自己找函數實現?
    發表于 09-26 08:09

    科技云報到:AI變革需要‘減脂增肌’

    產業的錨點到底在哪里?
    的頭像 發表于 09-25 09:20 ?455次閱讀
    科技云報到:AI變革需要‘減脂增肌’

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發表于 09-04 17:07 ?3555次閱讀

    【硬盤抽取盒民主實驗】你的真話,決定產品命運!敢說就送!

    這不是一場營銷,而是一次硬盤抽取盒民主實驗。ICYDOCK誠邀敢說真話的你!你的每一條真實反饋,都可能被采納,直接塑造CP138產品的命運!你的聲音,至關重要!CP138核心亮點速覽CP138是專為
    的頭像 發表于 07-18 16:32 ?427次閱讀
    【硬盤<b class='flag-5'>抽取</b>盒民主實驗】你的真話,決定產品命運!敢說就送!

    Jtti.ccVPS和IP的關系是什么?一文講清服務器背后的網絡邏輯

    不少朋友在使用 VPS 搭建網站、做代理或遠程桌面時,經常聽到“獨立IP”、“共享IP”、“原生IP”這些詞,但到底 VPS 和 IP 是什么關系?有沒有固定綁定?怎么查?怎么換?今天小編就從
    的頭像 發表于 07-07 17:41 ?860次閱讀

    運動控制軸和單軸控制區別怎么選?工業自動化工程師一文講透!

    在工業自動化項目里,運動控制這件事是繞不過去的技術核心。無論你是在做機器人、自動點膠機,還是搞多軸聯動的數控系統,都會遇到一個讓很多技術人員頭大的問題:運動控制軸和單軸控制區別到底在哪?實際應用中該怎么選?
    的頭像 發表于 05-29 10:19 ?1143次閱讀
    運動控制軸和單軸控制區別怎么選?工業自動化工程師一文講透!

    ICY DOCK PCIe可拆卸式擴展插槽硬盤抽取盒或轉接器,革新存儲解決方案

    插槽硬盤抽取盒或轉接器站在創新的最前沿。我們的解決方案重新定義了易用性,提供快速、免工具的硬盤抽取盒安裝和無縫的硬盤更換。它們非常適合存儲敏捷性,專為快速維護和輕
    的頭像 發表于 04-18 14:42 ?976次閱讀
    ICY DOCK PCIe可拆卸式擴展插槽硬盤<b class='flag-5'>抽取</b>盒或轉接器,革新存儲解決方案

    請問移植rtthread nano版時官網里面系統時鐘函數在哪里實現的?

    我在已有的華大HC32開發板的LED例程里我找不到官網移植教程里的這三個函數,文檔也沒說明這三個函數的移植步驟?到底在哪里找的?是rtthread里的實現還是需要用戶自己找函數實現?
    發表于 03-10 06:16