国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

在BERT中引入知識圖譜中信息的若干方法

引言

隨著BERT等預訓練模型橫空出世，NLP方向迎來了一波革命，預訓練模型在各類任務上均取得了驚人的成績。隨著各類預訓練任務層出不窮，也有部分研究者考慮如何在BERT這一類模型中引入或者強化知識圖譜中包含的信息，進而增強BERT對背景知識或常識信息的編碼能力。本文主要關注于如何在BERT中引入知識圖譜中信息，并survey了目前已公布的若干種方法，歡迎大家批評和交流。

ERNIE: Enhanced Language Representation with Informative Entities

論文鏈接：https://www.aclweb.org/anthology/P19-1139.pdf

這篇論文來自于清華劉知遠老師和華為劉群老師，已被ACL2019所錄取，是較早的考慮將知識引入預訓練模型的論文。

該論文主要利用了從知識庫中提出的高信息量的實體信息，通過特殊的語義融合模塊，來增強文本中對應的表示。首先本文通過實體鏈接算法，將Wikipedia文本中包含的實體與Wikidata中的實體庫構建關聯，然后采用TransE算法，對Wikidata中的實體embedding進行預訓練，進而得到其初始的表示；之后本文采用一個特殊的信息融合結構，其模型框架如下圖所示：

從圖中可以看出，ERNIE的框架分為以下兩部分，T-Encoder和K-Encoder，以上兩部分均使用BERT的Transformer框架，并利用其中的參數進行初始化。其中Wikipedia中的每一句話首先被輸入給T-Encoder，其通過Transformer的多頭注意力機制對文本中的信息進行編碼；之后輸出的表示與其內部包含的實體被一起輸入給了K-Encoder，其內部包含兩個多頭注意力層以分別對文本信息和實體信息進行編碼。

編碼后實體信息會得到兩種表示——詞級別和實體級別的表示，ERNIE通過將兩種信息concat之后輸入給DNN層，進而融合得到知識增強的表示；為進一步促進該部分融合，ERNIE采用一個denoising entity auto-encoder (dEA)來對該部分進行監督，其采用類似于BERT中的Mask機制，基于一定的概率對其中的實體進行mask或替換，然后還原該部分實體信息。

在采用以上過程預訓練后，本文將ERNIE在多個NLP任務上進行微調，并在多個數據集上獲得了State-of-the-art的結果。

K-BERT: Enabling Language Representation with Knowledge Graph

論文鏈接：https://arxiv.org/pdf/1909.07606v1.pdf

這篇論文來自于北大和騰訊，已被AAAI2020所錄取，是較早的考慮將知識圖譜中的邊關系引入預訓練模型的論文。

該論文主要通過修改Transformer中的attention機制，通過特殊的mask方法將知識圖譜中的相關邊考慮到編碼過程中，進而增強預訓練模型的效果。首先本文利用CN-DBpedia、HowNet和MedicalKG作為領域內知識圖譜，對每一個句子中包含的實體抽取其相關的三元組，這里的三元組被看作是一個短句（首實體，關系，尾實體），與原始的句子合并一起輸入給Transformer模型；針對該方法，本文采用基于可見矩陣的mask機制，如下圖所示：

從圖中可以看出，輸入的句子增加了許多三元組構成的短句，在每次編碼時針對每一個詞，模型通過可視矩陣（0-1變量）來控制該詞的視野，使其計算得到的attention分布不會涵蓋與其無關的詞，進而模擬一個句子樹的場景；由于該策略僅僅改動了mask策略，故其可以支持BERT，RoBERTa等一系列模型；該方法最終在8個開放域任務和4個特定領域任務下取得了一定的提升。

KEPLER: A Unified Model for Knowledge Embedding and Pre-trained Language Representation

論文鏈接：https://arxiv.org/pdf/1911.06136.pdf

這篇論文來源于清華和Mila實驗室，其主要關注于如何使用BERT增強知識圖譜embedding，并幫助增強對應的表示。

該論文主要通過添加類似于TransE的預訓練機制來增強對應文本的表示，進而增強預訓練模型在一些知識圖譜有關任務的效果。首先本文基于Wikipedia和Wikidata數據集，將每個entity與對應的維基百科描述相鏈接，則每個entity均獲得其對應的文本描述信息；之后對于每一個三元組——<頭實體，關系，尾實體>，本文采用基于BERT對encoder利用entity的描述信息，對每個實體進行編碼，如下圖所示：

從圖中可以看出，在通過encoder得到頭實體和尾實體對應的表示之后，本文采用類似于TransE的訓練方法，即基于頭實體和關系預測尾實體；此外本文還采用BERT經典的MLM損失函數，并使用RoBERTa的原始參數進行初始化；最終本文提出的方法在知識圖譜補全和若干NLP任務上均帶來了增益。

CoLAKE: Contextualized Language and Knowledge Embedding

論文鏈接：https://arxiv.org/pdf/2010.00309.pdf

這篇論文來源于復旦和亞馬遜，其主要關注于如何使用知識圖譜以增強預訓練模型的效果。

本文首先將上下文看作全連接圖，并根據句子中的實體在KG上抽取子圖，通過兩個圖中共現的實體將全連接圖和KG子圖融合起來；然后本文將該圖轉化為序列，使用Transformer進行預訓練，并在訓練時采用特殊的type embedding來表示實體、詞語與其他子圖信息，如下圖所示：

最終本文將文本上下文和知識上下文一起用MLM進行預訓練，將mask的范圍推廣到word、entity和relation；為訓練該模型，本文采用cpu-gpu混合訓練策略結合負采樣機制減少訓練時間；最終本文提出的方法在知識圖譜補全和若干NLP任務上均帶來了增益。

Exploiting Structured Knowledge in Text via Graph-Guided Representation Learning

論文鏈接：https://arxiv.org/pdf/2004.14224.pdf

這篇論文來源于悉尼科技大學和微軟，其主要關注于如何使用知識圖譜增強預訓練模型。

本文思路比較簡潔，其提出了一個基于entity的mask機制，結合一定的負采樣機制來增強模型。首先對于輸入的每一句話，本文首先進行實體鏈接工作，得到其中的entity，并從知識圖譜conceptnet和freebase中召回其鄰接的三元組；本文利用一個特殊的權重，防止在mask時關注于句子中過于簡單和過于難的entity，這樣模型在entity-level MLM訓練時就關注于較為適合學習的信息；此外本文還引入了基于知識圖譜的負采樣機制，其利用relation來選擇高質量的負例，以進一步幫助訓練；最終本文提出的方法在知識圖譜補全和若干NLP任務上均帶來了增益。

K-ADAPTER: Infusing Knowledge into Pre-Trained Models with Adapters

論文鏈接：https://arxiv.org/pdf/2002.01808v3.pdf

這篇論文來源于復旦和微軟，其考慮自適應的讓BERT與知識相融合。

這篇論文考慮如何通過不同的特殊下游任務來幫助向預訓練模型融入任務相關的知識。首先本文針對不同的預訓練任務，定義了對應的adapter；在針對具體的下游任務進行fine-tune時，可以采用不同的adapter來針對性的加入特征，進而增強其效果；如下圖所示：

基于該思想，本文提出了兩種特殊的adapter，分別利用factor knowledge和linguistic knowledge；針對這兩個adapter，本文提出了針對entity之間的關系分類任務和基于依存關系的分類任務；再fine-tune階段，兩個adapter得到的特征可以與BERT或RoBERTa得到的特征一起拼接來進行預測，該策略在三個知識驅動數據集上均取得了較大增益。

Integrating Graph Contextualized Knowledge into Pre-trained Language Models

論文鏈接：https://arxiv.org/pdf/1912.00147.pdf

這篇論文來自于華為和中科大，其主要關注于如何將上下文有關的知識信息加入到預訓練模型里。

這篇論文的思想類似于graph-BERT和K-BERT，其針對給出文本首先檢索返回相關的entity三元組，再在知識圖譜上搜集其相鄰的節點以構成子圖；然后將該子圖轉換成序列的形式，輸入給傳統的Transformer模型（類似graph-BERT），通過特殊的mask來約束注意力在相鄰節點上（K-BERT）；最后用類似于ERNIE的策略將子圖中的信息加入到Transformer中；最終該模型在下游的幾個醫療相關數據集上取得了增益。

JAKET: Joint Pre-training of Knowledge Graph and Language Understanding

論文鏈接：https://arxiv.org/pdf/2010.00796.pdf

這篇論文來自于CMU和微軟，其主要關注于如何同時對知識圖譜和語言模型一起預訓練。

本文使用RoBERTa作為語言模型對文本進行編碼，增加了relation信息的graph attention模型來對知識圖譜進行編碼；由于文本和知識圖譜的交集在于其中共有的若干entity，本文采用一種交替訓練的方式來幫助融合兩部分的知識，如下圖所示：

可以看出，語言模型得到的信息會首先對輸入文本以及entity/relation的描述信息進行編碼，以得到對應的表示；之后語言模型得到的entity embedding會被送給R-GAT模型以聚合鄰居節點的信息，以得到更強的entity表示；然后該部分信息會被輸入給語言模型繼續融合并編碼，以得到強化的文本表示信息；為了訓練該模型，本文還采用embedding memory機制來控制訓練時梯度的更新頻率和優化目標的權重，并提出四種特殊的損失函數來進行預訓練；最終本文提出的模型在多個知識驅動的下游任務均取得較好效果。

責任編輯：xj

原文標題：BERT meet Knowledge Graph：預訓練模型與知識圖譜相結合的研究進展

文章出處：【微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

nlp

nlp

+關注

關注
1

文章
491

瀏覽量
23280
知識圖譜

知識圖譜

+關注

關注
2

文章
132

瀏覽量
8315
訓練模型

訓練模型

+關注

關注
1

文章
37

瀏覽量
4071

原文標題：BERT meet Knowledge Graph：預訓練模型與知識圖譜相結合的研究進展

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

評論

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 高效大模型的推理綜述
New 什么是RAG，RAG學習和實踐經驗

精選推薦
更多

文章

資料

帖子

匠芯創D213ECV實現PicoClaw極簡部署（附體驗過程）

jf_69054165
11小時前

508 閱讀

從點云到圖像級！華為新一代896線激光雷達來襲，分辨率提升4倍

章鷹觀察
6小時前

784 閱讀

睿擎派3562快速上手體驗

RT-Thread官方賬號
1天前

608 閱讀

MWC2026:6G狂飆！華為、高通、英偉達等五大巨頭，亮出哪些突破性技術

章鷹觀察
13小時前

1652 閱讀

中科芯CKS32F107XX系列MCU的以太網介紹（二）

中科芯MCU
12小時前

924 閱讀

MAX16067中文資料

吳湛
344

10積分

118下載

單片機應用程序設計技術

liuxin
6.22 MB

免費

1142下載

四大絕招，讓你的Boost電路更安全！

Hx
290KB

免費

216下載

openharmony第三方組件適配移植的音頻可視化實現案例

姚小熊27
2.98 MB

免費

2下載

HisiPHP后臺管理框架

江根磊
7.84 MB

免費

0下載

【飛凌嵌入式RV1126B開發板】+基本功能測試篇（1）

jennyzhaojie
22小時前

90 閱讀

【飛凌嵌入式RV1126B開發板】+初識篇

jennyzhaojie
1天前

138 閱讀

樹莓派5還是香橙派5 Pro？兩款熱門開發板的詳細對比

行走的小派
1天前

333 閱讀

OrangePi RV2 深度技術評測：RISC-V AI融合架構的先行者

行走的小派
2天前

699 閱讀

lab view NI6003搭建電路

jf_73763743
2天前

693 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视