国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹一種新穎的三元組對比學(xué)習(xí)訓(xùn)練框架

深度學(xué)習(xí)自然語言處理 ? 來源:浙大KG ? 作者:葉宏彬 ? 2021-06-23 15:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要

在自然語言處理和知識圖譜領(lǐng)域的信息提取中,三元組抽取是必不可少的任務(wù)。在本文中,我們將重新審視用于序列生成的端到端三元組抽取任務(wù)。由于生成三元組抽取可能難以捕獲長期依賴關(guān)系并生成不忠實的三元組,因此我們引入了一種新的模型,即使用生成式Transformer的對比學(xué)習(xí)三元組抽取框架。

具體來說,我們介紹了一個共享的Transformer模塊,用于基于編碼器-解碼器的生成。為了產(chǎn)生忠實的結(jié)果,我們提出了一種新穎的三元組對比學(xué)習(xí)訓(xùn)練框架。此外,我們引入了兩種機(jī)制來進(jìn)一步改善模型的性能(即,分批動態(tài)注意掩碼和三元組校準(zhǔn))。在三個數(shù)據(jù)集(NYT,WebNLG和MIE)上的實驗結(jié)果表明,我們的方法比基線具有更好的性能。我們的代碼和數(shù)據(jù)集將在論文出版后發(fā)布。

論文動機(jī)

編碼器-解碼器模型是功能強(qiáng)大的工具,已在許多NLP任務(wù)中獲得成功,但是現(xiàn)有方法仍然存在兩個關(guān)鍵問題。首先,由于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的固有缺陷,它們無法捕獲長期依賴關(guān)系,從而導(dǎo)致重要信息的丟失,否則將在句子中反映出來,從而導(dǎo)致模型無法應(yīng)用更長的文本。第二,缺乏工作致力于生成忠實的三元組,序列到序列的體系結(jié)構(gòu)會產(chǎn)生不忠實的序列,從而產(chǎn)生意義上的矛盾。例如,給定句子“美國總統(tǒng)特朗普在紐約市皇后區(qū)長大,并居住在那里直到13歲”,該模型可以生成事實“(特朗普出生于皇后區(qū))”。盡管從邏輯上講是正確的,但我們無法從給定的句子中找到直接的證據(jù)來支持它。

為了解決這些問題,我們引入了帶有生成變壓器(CGT)的對比學(xué)習(xí)三元組提取框架,該框架是一個共享的Transformer模塊,支持編碼器-解碼器的生成式三元組對比學(xué)習(xí)多任務(wù)學(xué)習(xí)。首先,我們使用分隔符和部分因果掩碼機(jī)制將輸入序列與目標(biāo)序列連接起來,以區(qū)分編碼器-解碼器表示形式。除了預(yù)先訓(xùn)練的模型之外,我們的模型不需要任何其他參數(shù)。然后,我們介紹了一種新穎的三元組對比學(xué)習(xí)對象,該對象利用真實的三元組作為正實例,并利用隨機(jī)令牌采樣將損壞的三元組構(gòu)造為負(fù)實例。為了共同優(yōu)化三元組生成對象和對比學(xué)習(xí)對象,我們引入了分批動態(tài)注意掩碼機(jī)制,該機(jī)制允許我們動態(tài)選擇不同的對象并共同優(yōu)化任務(wù)。最后,我們介紹了一種新穎的三元組校準(zhǔn)算法,以在推理階段濾除虛假三元組。

這項工作的貢獻(xiàn)如下:

我們將三元組提取作為序列生成任務(wù)進(jìn)行了重新介紹,并引入了一種新穎的CGT模型。考慮到增加的提取功能,CGT除了在預(yù)訓(xùn)練語言模型中發(fā)現(xiàn)的參數(shù)外,不需要其他參數(shù)。

我們引入了兩種機(jī)制來進(jìn)一步提高模型性能(即,批處理動態(tài)注意掩碼和三元組校準(zhǔn))。第一個可以聯(lián)合優(yōu)化不同的對象,第二個可以確保忠實的推理。

我們在三個基準(zhǔn)數(shù)據(jù)集上評估了CGT。 我們的模型優(yōu)于其他強(qiáng)大的基準(zhǔn)模型。我們還證明,在捕獲長期依存關(guān)系方面,CGT比現(xiàn)有的三元組抽取方法更好,因此,在使用長句子場景下依然可以獲得更好的性能。

模型框架

ffb2014e-d3f6-11eb-9e57-12bb97331649.png

這里我們展示了CGT生成式Transformer的總體架構(gòu)。右上部分表示Transformer生成模塊,右下部分表示三元組對比學(xué)習(xí)模塊。這兩個部分訓(xùn)練時共同優(yōu)化。生成模塊依靠部分因果掩碼機(jī)制建模成序列生成任務(wù),如右圖中的示例所示,對于三元組序列生成,其中右上部分設(shè)置為-∞以阻止從源段到目標(biāo)段的關(guān)注;左側(cè)部分設(shè)置為全0,表示令牌能夠參與第一段。利用交叉熵?fù)p失生成來優(yōu)化三元組生成過程,獲得生成損失。對比學(xué)習(xí)模塊將輸入文本與正確的三元組實例或者偽造的三元組進(jìn)行隨機(jī)拼接,依靠部分因果掩碼機(jī)制建模成文本分類任務(wù),其中mask矩陣的元素全為0,利用經(jīng)過MLP多層感知機(jī)層的特殊token[CLS]表示來計算分類打分函數(shù),鑒別是否為正確實例,從而增強(qiáng)模型對關(guān)鍵token的感知能力。我們利用交叉熵優(yōu)化對比損失。生成損失與對比學(xué)習(xí)損失通過一個超參數(shù)權(quán)衡構(gòu)成了我們最終的總體損失。我們的解碼推理采用的是波束搜索和啟發(fā)式約束。

實驗結(jié)果

我們對三個基準(zhǔn)數(shù)據(jù)集進(jìn)行了實驗:紐約時報(NYT),WebNLG和MIE。MIE是醫(yī)學(xué)領(lǐng)域的大規(guī)模中文對話信息提取數(shù)據(jù)集。圖2中中顯示了這三個數(shù)據(jù)集的部分實驗統(tǒng)計信息。

ffcac79c-d3f6-11eb-9e57-12bb97331649.png

ffd4edda-d3f6-11eb-9e57-12bb97331649.png

責(zé)任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3953

    瀏覽量

    142646
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    630

    瀏覽量

    14667

原文標(biāo)題:AAAI2021-基于對比學(xué)習(xí)的三元組生成式抽取方法

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    一種無OS的MCU實用軟件框架

    介紹一種無OS的MCU實用軟件框架,包括任務(wù)輪詢管理,命令管理器、低功耗管理、環(huán)形緩沖區(qū)等實用模塊。系統(tǒng)中廣泛利用自定義段技術(shù)減少各個模塊間的耦合關(guān)系,大大提供程序的可維護(hù)性。 主要功能 支持模塊
    發(fā)表于 01-08 06:58

    四探針電阻測試 | CuNiC 三元合金的導(dǎo)電性能研究

    在電子材料領(lǐng)域,銅基合金因高導(dǎo)電性和低成本備受關(guān)注,但其易氧化特性限制了應(yīng)用。CuNiC三元合金通過引入鎳和碳,在提升抗氧化性的同時保持良好導(dǎo)電性,為高溫、高穩(wěn)定性的電子器件提供了新材料選項。本研究
    的頭像 發(fā)表于 01-04 18:04 ?1085次閱讀
    四探針電阻測試 | CuNiC <b class='flag-5'>三元</b>合金的導(dǎo)電性能研究

    借助NVIDIA Megatron-Core大模型訓(xùn)練框架提高顯存使用效率

    隨著模型規(guī)模邁入百億、千億甚至萬億參數(shù)級別,如何在有限顯存中“塞下”訓(xùn)練任務(wù),對研發(fā)和運(yùn)維團(tuán)隊都是巨大挑戰(zhàn)。NVIDIA Megatron-Core 作為流行的大模型訓(xùn)練框架,提供了靈活高效的并行化
    的頭像 發(fā)表于 10-21 10:55 ?1151次閱讀
    借助NVIDIA Megatron-Core大模型<b class='flag-5'>訓(xùn)練</b><b class='flag-5'>框架</b>提高顯存使用效率

    量子機(jī)器學(xué)習(xí)入門:三種數(shù)據(jù)編碼方法對比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)中數(shù)據(jù)編碼確實相對直觀:獨(dú)熱編碼處理類別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個過程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機(jī)器學(xué)習(xí)的編碼完全是另回事。傳統(tǒng)算
    的頭像 發(fā)表于 09-15 10:27 ?774次閱讀
    量子機(jī)器<b class='flag-5'>學(xué)習(xí)</b>入門:<b class='flag-5'>三種</b>數(shù)據(jù)編碼方法<b class='flag-5'>對比</b>與應(yīng)用

    汽車800V高壓儲能電池管理系統(tǒng)設(shè)計框架

    和 RS485 多種對外通訊方 式實現(xiàn)與整車控制器、車載充電機(jī)、直流充電樁、儀表、GPRS 等設(shè)備進(jìn)行數(shù)據(jù)傳輸。 系統(tǒng)適用于錳酸鋰、三元、磷酸鐵鋰、鈦 酸鋰等在線測量監(jiān)控各種電池特性數(shù)字化的數(shù)據(jù),以達(dá)到電池
    發(fā)表于 08-20 16:39

    一種適用于動態(tài)環(huán)境的自適應(yīng)先驗場景-對象SLAM框架

    由于傳統(tǒng)視覺SLAM在動態(tài)場景中容易會出現(xiàn)嚴(yán)重的定位漂移,本文提出了一種新穎的基于場景-對象的可靠性評估框架,該框架通過當(dāng)前幀質(zhì)量指標(biāo)以及相對于可靠參考幀的場景變化,全面評估SLAM的
    的頭像 發(fā)表于 08-19 14:17 ?875次閱讀
    <b class='flag-5'>一種</b>適用于動態(tài)環(huán)境的自適應(yīng)先驗場景-對象SLAM<b class='flag-5'>框架</b>

    鋰離子電池正極材料之三元高鎳化的研究現(xiàn)狀

    衰減機(jī)制對于提高鋰離子電池的循環(huán)穩(wěn)定性與安全性能具有重大指導(dǎo)意義。#Part.01鋰電池正極材料——三元材料鋰電池正極材料是鋰電池的重要組成部分之,其性能較大程
    的頭像 發(fā)表于 08-05 17:52 ?2096次閱讀
    鋰離子電池正極材料之<b class='flag-5'>一</b>:<b class='flag-5'>三元</b>高鎳化的研究現(xiàn)狀

    一種基于擴(kuò)散模型的視頻生成框架RoboTransfer

    在機(jī)器人操作領(lǐng)域,模仿學(xué)習(xí)是推動具身智能發(fā)展的關(guān)鍵路徑,但高度依賴大規(guī)模、高質(zhì)量的真實演示數(shù)據(jù),面臨高昂采集成本與效率瓶頸。仿真器雖提供了低成本數(shù)據(jù)生成方案,但顯著的“模擬到現(xiàn)實”(Sim2Real)鴻溝,制約了仿真數(shù)據(jù)訓(xùn)練策略的泛化能力與落地應(yīng)用。
    的頭像 發(fā)表于 07-09 14:02 ?833次閱讀
    <b class='flag-5'>一種</b>基于擴(kuò)散模型的視頻生成<b class='flag-5'>框架</b>RoboTransfer

    HarmonyOS NEXT意圖框架習(xí)慣推薦場景說明

    、概述 意圖框架是HarmonyOS系統(tǒng)級的意圖標(biāo)準(zhǔn)體系。將應(yīng)用和服務(wù)的業(yè)務(wù)功能智慧分發(fā)給不同的系統(tǒng)入口,以“音樂播放”為例,HarmonyOS將業(yè)務(wù)分發(fā)給“小藝建議”,提供了桌面大流量曝光
    發(fā)表于 06-18 15:06

    寬調(diào)速范圍低轉(zhuǎn)矩脈動的一種新型內(nèi)置式永磁同步電機(jī)的設(shè)計與分析

    摘要:寬調(diào)速范圍與低轉(zhuǎn)矩脈動直是設(shè)計電動汽車用內(nèi)置式永礎(chǔ)同步電機(jī)時所追求的重要目標(biāo)。設(shè)計了一種轉(zhuǎn)子結(jié)構(gòu)為胃的新型內(nèi)置式永礎(chǔ)同步電機(jī),并進(jìn)行了繞組結(jié)構(gòu)優(yōu)化與性能分析。利用有限分析法,將所設(shè)計的電機(jī)
    發(fā)表于 06-06 14:13

    介紹三種常見的MySQL高可用方案

    在生產(chǎn)環(huán)境中,為了確保數(shù)據(jù)庫系統(tǒng)的連續(xù)可用性、降低故障恢復(fù)時間以及實現(xiàn)業(yè)務(wù)的無縫切換,高可用(High Availability, HA)方案至關(guān)重要。本文將詳細(xì)介紹三種常見的 MySQL 高可用
    的頭像 發(fā)表于 05-28 17:16 ?1245次閱讀

    OCAD應(yīng)用:四連續(xù)變焦系統(tǒng)

    ,雖然不動,也起著變焦的功能。后面是補(bǔ)償。系統(tǒng)前固定、前變焦、中固定、補(bǔ)償
    發(fā)表于 05-20 08:49

    一種實時多線程VSLAM框架vS-Graphs介紹

    針對現(xiàn)有VSLAM系統(tǒng)語義表達(dá)不足、地圖可解釋性差的問題,本文提出vS-Graphs,一種實時多線程VSLAM框架。該方案顯著提升了重建地圖的語義豐富度、可解釋性及定位精度。實驗表明
    的頭像 發(fā)表于 04-19 14:07 ?1005次閱讀
    <b class='flag-5'>一種</b>實時多線程VSLAM<b class='flag-5'>框架</b>vS-Graphs<b class='flag-5'>介紹</b>

    百度飛槳框架3.0正式版發(fā)布

    、推理等任務(wù)都離不開深度學(xué)習(xí)框架的優(yōu)化與支撐。 飛槳框架3.0,從設(shè)計理念上實現(xiàn)了從底層硬件適配到頂層開發(fā)體驗的全面進(jìn)化,在訓(xùn)練效率、性能、兼容性等關(guān)鍵指標(biāo)上建立了新標(biāo)桿。 其中, “
    的頭像 發(fā)表于 04-02 19:03 ?1197次閱讀
    百度飛槳<b class='flag-5'>框架</b>3.0正式版發(fā)布

    一種多模態(tài)駕駛場景生成框架UMGen介紹

    端到端自動駕駛技術(shù)的快速發(fā)展對閉環(huán)仿真器提出了迫切需求,而生成式模型為其提供了一種有效的技術(shù)架構(gòu)。然而,現(xiàn)有的駕駛場景生成方法大多側(cè)重于圖像模態(tài),忽略了其他關(guān)鍵模態(tài)的建模,如地圖信息、智能交通參與者等,從而限制了其在真實駕駛場景中的適用性。
    的頭像 發(fā)表于 03-24 15:57 ?1687次閱讀
    <b class='flag-5'>一種</b>多模態(tài)駕駛場景生成<b class='flag-5'>框架</b>UMGen<b class='flag-5'>介紹</b>