国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

了解信息抽取必須要知道關系抽取

深度學習自然語言處理 ? 來源:CSDN ? 作者:CSDN ? 2021-04-15 14:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文主要詳細解讀關系抽取SOTA論文Two are Better than One:Joint Entity and Relation Extraction with Table-Sequence Encoders[1], 順帶簡要介紹關系抽取的背景,方便完全不了解童鞋。

信息抽取

我們說的信息抽取一般是指從文本數據中抽取特定數據結構信息的一種手段。對于不同結構形式的數據如結構化文本,半結構化文本,自由文本,有各自對應的方案,其中從自由文本中抽取難度最大。總之,我們的目的是希望在海量文本中,快速抽出我們關注的事實。

了解信息抽取必須要知道關系抽取。

關系抽取

大部分情況下,我們喜歡用三元組的數據結構來描述抽取到的信息

三元組

三元組的表達能力非常豐富,幾乎所有事情都可以自然或者強行的表達成三元組,比如隨便一句”今天天氣真冷“ 表達為天氣-狀態-冷。

三元組與后續的知識圖譜工作非常適配,如Neo4j等圖數據庫就是以三元組為存儲單位,圖譜的查詢推斷等工具使用三元組比普通的關系型數據庫來的方便的多。

三元組千千萬,我應該怎么抽?

Schema

當我們拿到一個信息抽取的任務,需要明確我們抽取的是什么,”今天天氣真冷“,我們要抽的天氣的狀態天氣-狀態-冷,而非今天-氣候-冷(雖然也可以這樣抽),因此一般會首先定義好我們要抽取的數據結構模式shcema, 會確定謂詞以及主語并與的類型

一個三元組schema的例子,其中Subject_type代表主語類型,Predicate是謂詞,Object_type指賓語類型:

Subject_type:人物 Predicate:出生地 Object_type:地點

確定了schema,我們一般如何抽取呢?

常規RE方案

目前主流關系抽取一般兩種解決方法

pipline兩步走:將關系抽取分解為NER任務和分類任務,NER任務標注主語或賓語,分類主要針對定義的schema中的有限個謂詞進行分類。根據具體任務不同,有些可能是兩步走或者三步走,pipline任務的順序先分類還是先標注也會有差異

Pipline優勢:每一步分別針對各個任務進行,表征是task-specific, 相對來說精度較高

Pipline缺陷:- 任務有順序會存在誤差傳遞問題,即在預測時下一步任務會受上一步誤差影響,而在訓練階段沒有這種誤差,因此存在訓練和預測階段的gap- 分開的任務在一句話中多個實體關系時,比較難解決實體和關系的對應問題,以及重疊關系

joint learning:joint learing可以理解為采用多任務的方式,同時進行NER和關系分類任務, 在眾多joint learning中最出眾的是采用tabel filled 方式,即任務的輸出是filled一張有text-sequence構成的表,在表中的位置表達除了詞與詞的連接,該位置的標注則標出了謂語(如下圖)

a82e50a8-9cd8-11eb-8b86-12bb97331649.jpg

優勢:1. 兩個任務的表征有交互作用可能輔助任務的學習2. 不用訓練多個模型,一個模型解決問題,不存在訓練與預測時的gap

缺陷:1. 兩個任務的表征可能沖突,影響任務效果2. 解決了主謂賓之間的對應關系,無法解決重疊問題3. Fill table本質仍然是轉成sequence來fill,未能充分利用table結構信息(下文會解釋)

下面重點解讀table fill方式的一篇SOTA,解決了joint learning的多任務表征沖突以及為利用table結構信息

RE with Table Sequence

終于來到本篇的主題啦,為了解決一般filled table的問題, 作者提出table-sequence encoder的方法,分別對table和sequence做表征,本文的最大貢獻在于

分別對table和sequence做表征(encoder),并設計了一個Table-Guided Attention來對table和sequence進行交互,這樣即不會完全共享表征導致對不同的任務表征沖突,也不會丟失表征的相互指導作用

在table encoder中采用多維GRU來捕獲更多的句子結構信息

在架構上table encoder和 sequence encoder多層交互

a84af794-9cd8-11eb-8b86-12bb97331649.jpg

下面仔細介紹各個部分,看看它是如何神奇做到SOTA的

Text Embedder

在上圖的結構圖中,Text Embedder采用類似FLAT分別做了基于lstm的char()和word(),以及基于bert的word ()作為預訓練的embedding ,并拼接起來

圖中

Table Encoder

整個Table Encoder部分由多個Table Encoding的單元組成,每個Encoding單元的輸入分別是起始輸入,對應senquence結構的輸入,以及上一個Tabel Encoding單元的輸出,Table Encoding 采用MDRNN結構提取輸入的特征信息,作者在這選擇MDGRU(多維度GRU),tabel結構本身有2維,加上前后層實際有4維,但是層的維度信息單向流動,實際上是只用到了3個方向()

a879c3bc-9cd8-11eb-8b86-12bb97331649.jpg

如圖所示,是來自sequence的輸入,作者分別測了使用所有方向和分別使用幾個方向,發現上圖中a,c效果類似,這種多維GRU全面的考慮了整個table的結構信息,即一個詞的狀態跟其他所有詞的狀態相關,并且受其他詞的不同程度的影響,這種影響程度由GRU門控機制控制

Sequence Encoder

sequence Encoder 也由多個sequence encoding夠成,sequence encoding結構直接采用transformer中的encoder

a88c27dc-9cd8-11eb-8b86-12bb97331649.jpg

只不過將其中的self attention替換為table-guide attention,這種attention的改造非常巧妙,能更好捕捉word-word之間的關系

a8c91868-9cd8-11eb-8b86-12bb97331649.jpg

正常的dot attention如上圖

Table-Guided attention具體來說:

為參數矩陣

采用加性

是table encoder中的table的隱藏節點,該節點由多個方向的經過GRU編碼得到,不管是哪個方向它的來源始終是由構造而來,理論上是可以由擬合而來,因此這里直接由 來代替 ,也就是這個attention,其實是計算了table 結構中各個位置對該的權重,是一個四面八方attention

剩下就是transform中正常的LayerNorm 和殘差結構了

輸出和loss

輸出比較常規,loss采用常規

輸出:

loss:

實驗 and 效果

作者在各個數據集上進行實驗,對比各個目前SOTA分別有一定的提高,且時效果最佳,模型參數量不到5M,要什么自行車,附上開源地址[2],作者的代碼與論文在attention計算有一丟丟不一致,但是并不影響效果

a8d23eac-9cd8-11eb-8b86-12bb97331649.jpg

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    4020

    瀏覽量

    68353
  • Gru
    Gru
    +關注

    關注

    0

    文章

    12

    瀏覽量

    7750
  • 數據結構
    +關注

    關注

    3

    文章

    573

    瀏覽量

    41589

原文標題:關系抽取一步到位!

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    汽車電子EMC測試系統:車企必須要知道的電磁安全方案

    南柯電子|汽車電子EMC測試系統:車企必須要知道的電磁安全方案
    的頭像 發表于 01-08 11:00 ?414次閱讀

    高效部署磁盤陣列:選對硬盤抽取盒,省心又強力

    挑戰:散熱壓力、安裝維護的便捷性,以及寶貴的機箱空間。此時,一款設計出色的硬盤抽取盒就能成為關鍵助力。ICYDOCK的ToughArmor系列——MB998SP-
    的頭像 發表于 11-07 16:34 ?1134次閱讀
    高效部署磁盤陣列:選對硬盤<b class='flag-5'>抽取</b>盒,省心又強力

    創新企業級NVMe存儲拓展方案 艾西達克前置M.2硬盤抽取盒測評

    空間散熱受限,極易因高溫觸發硬盤性能衰退。艾西達克推出的M.2NVMeSSDPCIe4.0硬盤抽取盒可以完美解決這些痛點。此系列提供MB833MK-BV2(單盤位M
    的頭像 發表于 11-07 16:07 ?980次閱讀
    創新企業級NVMe存儲拓展方案 艾西達克前置M.2硬盤<b class='flag-5'>抽取</b>盒測評

    多塊 M.2 硬盤拆到崩潰?M.2 硬盤抽取盒才是救星!

    新硬盤,而是讓機箱內每塊硬盤“活”起來的方案——一款設計精良的具有可抽取功能M.2硬盤盒,能徹底改變你與數據的交互方式。極速連接,釋放完整性能一款優秀的M.2硬盤盒
    的頭像 發表于 10-11 15:15 ?788次閱讀
    多塊 M.2 硬盤拆到崩潰?M.2 硬盤<b class='flag-5'>抽取</b>盒才是救星!

    工業相機數據爆炸?ICY DOCK硬盤抽取盒極速存 + 0宕機!

    與更換能力。針對這些關鍵需求,ICYDOCK旗艦級硬盤抽取盒MB699VP-B與MB720MK-BV3以其工業級設計,提供了可靠的存儲解決方案。MB699VP-B
    的頭像 發表于 09-05 16:02 ?427次閱讀
    工業相機數據爆炸?ICY DOCK硬盤<b class='flag-5'>抽取</b>盒極速存 + 0宕機!

    突破影音錄播設備存儲瓶頸!ICY DOCK 高密度硬盤抽取盒提升制作效率

    都在考驗存儲設備的極限性能。ICYDOCK針對這些核心問題,推出MB873MP-BV2與MB998SK-B工業級硬盤抽取盒解決方案。MB873MP-BV2是一款突破
    的頭像 發表于 08-14 17:23 ?1002次閱讀
    突破影音錄播設備存儲瓶頸!ICY DOCK 高密度硬盤<b class='flag-5'>抽取</b>盒提升制作效率

    【ICY DOCK新品】4盤位2.5英寸U.2/U.3 NVMe SSD硬盤抽取

    企業級免工具硬盤托盤設計搭配PCIe4.0極致速度ICYDOCKExpressCageMB324V4P-B是一款具備高性能的硬盤抽取盒,它可在單個標準的5.25英寸光驅位中容納多達4個
    的頭像 發表于 08-08 14:39 ?1320次閱讀
    【ICY DOCK新品】4盤位2.5英寸U.2/U.3 NVMe SSD硬盤<b class='flag-5'>抽取</b>盒

    最新PCIe5.0 U.2硬盤抽取盒— ICY DOCK MB491V5K-B 開箱測評

    ——ICYDOCKToughArmorMB491V5K-B,正是專為高安全、高性能、高強度環境打造的U.2/U.3NVMeSSD抽取盒,不僅支持PCIe5.0,還擁有軍規
    的頭像 發表于 08-01 14:48 ?1334次閱讀
    最新PCIe5.0 U.2硬盤<b class='flag-5'>抽取</b>盒— ICY DOCK MB491V5K-B 開箱測評

    【硬盤抽取盒民主實驗】你的真話,決定產品命運!敢說就送!

    這不是一場營銷,而是一次硬盤抽取盒民主實驗。ICYDOCK誠邀敢說真話的你!你的每一條真實反饋,都可能被采納,直接塑造CP138產品的命運!你的聲音,至關重要!CP138核心亮點速覽CP138是專為
    的頭像 發表于 07-18 16:32 ?430次閱讀
    【硬盤<b class='flag-5'>抽取</b>盒民主實驗】你的真話,決定產品命運!敢說就送!

    【ICY DOCK 新品 MB601V5K-B】2.5英寸 U.2/U.3 NVMe PCIe 5.0轉3.5英寸硬盤抽取盒(1 x MCIO 4i SFF-TA-1016)

    ToughArmor MB601V5K-B是專為高速U.2/U.3 NVMe硬盤設計的PCIe 5.0硬盤抽取盒。這款硬盤抽取盒配備最新的MCIO 4i(SFF-TA-1016)接口,支持高達
    的頭像 發表于 05-21 16:55 ?1098次閱讀
    【ICY DOCK 新品 MB601V5K-B】2.5英寸 U.2/U.3 NVMe PCIe 5.0轉3.5英寸硬盤<b class='flag-5'>抽取</b>盒(1 x MCIO 4i SFF-TA-1016)

    ICY DOCK PCIe可拆卸式擴展插槽硬盤抽取盒或轉接器,革新存儲解決方案

    插槽硬盤抽取盒或轉接器站在創新的最前沿。我們的解決方案重新定義了易用性,提供快速、免工具的硬盤抽取盒安裝和無縫的硬盤更換。它們非常適合存儲敏捷性,專為快速維護和輕
    的頭像 發表于 04-18 14:42 ?978次閱讀
    ICY DOCK PCIe可拆卸式擴展插槽硬盤<b class='flag-5'>抽取</b>盒或轉接器,革新存儲解決方案

    【極速存儲新選擇】PCIe5.0 M.2硬盤盒 免工具安裝全金屬抽取

    ICYDOCKMB840M5P-B可在PCIex4/x8/x16擴展插槽空間安裝1個M.2NVMeSSD,并且無需打開機箱即可輕松快速更換硬盤。全新可抽取M.2NVMeSSD硬盤盒
    的頭像 發表于 04-17 16:44 ?2084次閱讀
    【極速存儲新選擇】PCIe5.0 M.2硬盤盒 免工具安裝全金屬<b class='flag-5'>抽取</b>盒

    步進電機選型時必須要了解什么?

    步進電機選型時,必須要了解以下幾個方面的信息以確保所選電機能夠滿足特定的應用需求: 1. 轉矩需求: ? ?● 步進電機的保持轉矩類似于傳統電機的“功率”,但物理結構和輸出特性有所不同
    的頭像 發表于 04-14 07:38 ?1272次閱讀

    【概念產品CP149】可拆卸式 2盤位 M.2 NVMe SSD(硬盤)轉 PCIe 5.0 x16 插槽全金屬硬盤抽取

    產品介紹ICYDOCKCP149是一款可拆卸的2盤位M.2NVMe硬盤轉PCIe5.0x16插槽全金屬硬盤抽取盒,專為使用x8/x8或x8/x4/x4PCIe拆分設置的英特爾主板而設計。與需要x4
    的頭像 發表于 03-20 17:24 ?1150次閱讀
    【概念產品CP149】可拆卸式 2盤位 M.2 NVMe SSD(硬盤)轉 PCIe 5.0 x16 插槽全金屬硬盤<b class='flag-5'>抽取</b>盒

    使用轉輪流量計必須要知道的事!

    流量計
    華泰天科
    發布于 :2025年03月11日 17:46:47