国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個新任務:給定知識圖譜中的一條query path,生成對應的問題

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2020-10-10 10:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言

EMNLP2020中,復旦大學數據智能與社會計算實驗室 (Fudan DISC) 提出了一篇基于事實的問題生成工作,論文題目為:PathQG: Neural Question Generation from Facts,被錄取為長文。

文章摘要

關于問題生成的當前研究通常將輸入文本作為序列直接編碼,而沒有明確建模其中的事實信息,這會導致生成的問題和文本不太相關或者信息量較少。在這篇論文中,我們考慮結合文本中的事實以幫助問題生成。我們基于輸入文本的事實信息構造了知識圖,并提出了一個新任務:給定知識圖中的一條query路徑生成問題。任務可以被分為兩個步驟,(1)對query表示的學習;(2)基于query的問題生成。我們首先將query表示學習定義為序列標記問題,以識別涉及的事實從而學習到一個query表示,之后使用基于RNN的生成器進行問題生成。我們以端到端的方式共同訓練這兩個模塊,并提出通過變分框架加強這兩個模塊之間的交互。我們基于SQuAD構造了實驗數據集,實驗結果表明我們的模型優于其他方法,并且當目標問題復雜時,性能提升更多。通過人工評估,也驗證了我們生成的問題的確和文本更相關且信息更豐富。

研究動機

本文關注基于文本的問題生成任務(Question Generation from Text):輸入一段文本,自動生成對應的問題。

當前端到端的問題生成研究,通常對輸入文本直接編碼并學習一個隱表示,而沒有對其中的語義信息進行明確建模,這會使得生成過程有較大不確定性,導致生成的問題包含和給定文本不相關的信息或者信息量較少,如下圖顯示,生成的問題Q2包含了不相關的信息“Everton Fc”,而Q1雖然正確但是缺少特定的信息描述,顯得比較簡略。

先對輸入文本中的事實(facts)進行建模可以減輕這些問題,并且針對文本中的多個事實,可以生成較為復雜(complex)的問題。我們通過對給定文本構建知識圖譜(Knowledge Graph,KG)來表示其中的事實,并提出一個新任務:給定知識圖譜中的一條query path來生成問題,其中query path是一條由多個事實三元組構成的序列,每個事實三元組包含兩個實體以及它們的關系。如上圖(b)顯示了一個KG以及其中的兩條query paths。

由于query path中并非所有事實都會在目標問題中被提及,我們首先需要學習一個query representation來表示query path中會被提及的事實信息,并基于此生成對應的問題,因此任務可以分成兩個步驟:(1)對query representation的學習;(2)基于query的問題生成。我們以端到端的方式共同訓練這兩個模塊,并提出通過變分框架加強這兩個模塊之間的交互。

我們使用了數據集SQuAD,并且為了驗證模型在復雜問題生成上的效果,基于SQuAD構造了一個復雜問題數據集,并分別進行了實驗。

模型

Path-based Question Generation

給定query path的問題生成任務包含兩個步驟,我們設計兩個模塊:Query Representation Learner和Query-based Question Generator分別進行任務中的兩個步驟。我們首先以端到端的框架PathQG共同訓練這兩個模塊,具體結構如下圖顯示。

1. Query Representation Learner

由于query path中的不同的實體和關系會對生成目標問題有不同的貢獻度,我們首先計算它們各自的貢獻權重,從而學到一個query representation來表示目標問題將涉及的事實信息。

貢獻權重計算:將query path看作是一條由實體和關系相間構成的序列,并將query path中各個成分的貢獻度計算看作是一個序列標記過程。并且對輸入文本進行編碼作為context,通過attention幫助序列標記的概率計算,最后將各個位置的sigmoid概率作為各自的貢獻權重。

Query表示學習:得到query path的各個成分的貢獻權重后,我們以加權的方式對query path編碼,學習到對應的query representationL。考慮到query path由實體和關系相間構成的特殊結構,我們使用循環跳躍網絡(recurrent skipping network, RSN)來對路徑序列進行編碼。

2. Query-based Question Generator

基于學到的query representationL,解碼生成對應的問題。將最后的query representation和context表示聯合作為解碼器的初始狀態,并分別對他們執行注意力機制,逐步生成問題。

Variational Path-based Question Generation

對query representation的學習可以看成是對query path的一個推斷過程,參考變分推斷的思想,我們將query representation的學習看作是推導query的先驗分布(prior query distribution),而基于query的問題生成是在計算目標問題的likelihood,我們又引入了一個額外的后驗query分布(posterior query distribution),通過將目標問題作為指導來幫助減少query representation學習的不確定性。并且通過訓練,使得query的先驗分布不斷靠近后驗分布,最終提升生成的問題質量。變分PathQG的結構如下圖。

實驗

我們在SQuAD數據集上進行了實驗,對每一條文本,通過場景圖解析器(scene garph parser)和詞性標注器(part-of-speech tagger)自動構建了知識圖譜,并且根據參考問題從知識圖譜中抽取出對應的query path。為了進一步驗證模型在復雜問題生成上的效果,我們還根據query path中事實三元組的個數從SQuAD中劃分了一個復雜問題數據集。在全數據集和復雜數據集上的實驗結果顯示我們的模型都優于其他模型。

除了自動評估,我們還通過Amazon Mechanical Turk (AMT)進行了人工評估,分別從問題的流利度、正確性(和給定文本和答案一致)、信息量對不同模型生成的問題進行了兩兩比較,結果顯示我們的模型也取得不錯效果。

我們還通過對不同模型生成的問題和給定文本之間的重疊率進行比較,來評估生成問題和給定文本的相關性。

最后還進行了一些案例分析,可以看出相對模型NQG+,我們生成的問題更加和文本相關和有信息量。在第一個樣例中,我們生成的問題包含有特定信息“plymouth”和“late 18th”而*NQG+沒有,而在第二個例子中NQG+*生成的問題包含不相關的“swazi economye”而我們生成的和給定文本更一致。

總結

這篇文章中,我們通過知識圖譜對文本中的事實建模用于問題生成,并提出一個新任務:給定知識圖譜中的一條query path,生成對應的問題。我們提出先學習一個query representation來表示問題中可能涉及的事實,再生成問題,將這兩個模塊聯合進行訓練并提出一個變分模型提升問題的生成。我們通過自動構建知識圖譜并抽取出對應的query path構建了我們的實驗數據集,結果驗證了我們模型的有效性。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼
    +關注

    關注

    6

    文章

    1039

    瀏覽量

    56976
  • 生成器
    +關注

    關注

    7

    文章

    322

    瀏覽量

    22715
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26196

原文標題:【論文】PathQG: 基于事實的神經問題生成

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RAG(檢索增強生成)原理與實踐

    \"\"\"# 角色 你是嚴謹的知識問答助手。 # 任務 基于提供的參考資料回答用戶問題,并標注信息來源。 # 參考資料
    發表于 02-11 12:46

    管理型工業交換機被低估的重要功能

    很多網絡工程師會遇到同一個問題:一條網線夠不夠用?一條鏈路斷了怎么辦?尤其是在工業場景,網絡旦不穩定,輕則數據延遲,重則業務中斷,后果往
    的頭像 發表于 02-04 09:41 ?162次閱讀
    管理型工業交換機<b class='flag-5'>中</b>,<b class='flag-5'>一</b><b class='flag-5'>個</b>被低估的重要功能

    嵌入式基礎知識-系統調度

    :處于等待態的任務將不能繼續執行,它將等待至少事件發生。 (a) 觸發:新任務被設置成就
    發表于 12-16 08:15

    Unix的相關知識

    些經驗獲益。 (1)讓每個程序就做好件事。如果有新任務,就重新開始,不要往原程序中加入新功能而搞得復雜。 (2)假定每個程序的輸出都會成為另一個程序的輸入,哪怕那個程序還是未知的
    發表于 12-10 07:13

    如何創建浮點立即數

    和U-type格式的指令加載立即數,I-type格式包含12位立即數,U-type格式包含20位立即數,而且這20位是加載到寄存器的高20位的。所以,一條I-type指令加上一條U-type指令就可以加載
    發表于 10-21 13:51

    AI智能大模型,你身邊的最好用的辦公提效小能手

    幾十億到數萬億; 任務廣:次訓練可以支持多個任務,具備通用能力; 適應快:只需少量樣例,就能遷移到新任務(Few-shot、Zero-s
    的頭像 發表于 09-30 10:59 ?330次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力

    ,使其與新知識兼容。 2、遷移學習 遷移學習只尋求利用特定領域的知識來幫助目標領域學習,利用在任務上訓練好的模型,來完成另
    發表于 09-14 14:04

    利用NVIDIA Cosmos模型訓練通用機器人

    機器人領域的大核心挑戰在于如何讓機器人掌握新任務,而無需針對每個新任務和環境耗費大量精力收集和標注數據集。NVIDIA 的最新研究方案通過生成式 AI、世界基礎模型(如 NVIDIA
    的頭像 發表于 08-05 16:22 ?2114次閱讀
    利用NVIDIA Cosmos模型訓練通用機器人

    HarmonyOS AI輔助編程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平臺,用于快速生成可編譯、可運行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成對應
    發表于 07-10 11:51

    從材質到結構:一條優質HDMI線背后的技術講究

    因素——材質與結構設計。今天,我們將深入探討一條優質HDMI線背后的技術講究,幫助您做出更加明智的選擇。 、導體材料:信號傳輸的基礎 HDMI線的導體材料直接關系到信號傳輸的質量和穩定性。優質的導體材料能夠有效降低電阻,減少信
    的頭像 發表于 07-09 17:59 ?1108次閱讀

    不只是傳輸信號:一條優質HDMI線如何提升觀影沉浸感

    在家庭影院系統,我們常常把注意力放在電視的畫質、音響的音效、片源的清晰度上,卻容易忽略看似普通卻至關重要的環節——HDMI線纜。很多人認為“HDMI線不就是根傳輸數據的線嗎?能
    的頭像 發表于 06-13 18:10 ?732次閱讀

    CYUSB3014采用5根地址線通信,但其中一條地址線懸空,對數據通信有影響嗎?

    CYUSB3014采用5根地址線通信,但其中一條地址線懸空,對數據通信有影響嗎??是否還能進行正常的多個端點通信,只要跳過那個地址線對應的socket即可?
    發表于 05-21 07:59

    輕輕松松學電工(識圖篇)

    內容介紹 結合廣大電工人員的實際需要,主要介紹了常用電工電路識圖的基礎知識、方法及技巧,內容包括常用電氣符號、電工識圖基本方法,以及識讀供配電系統圖、建筑電氣圖、電力拖動系統電氣圖、PLC梯形圖
    發表于 04-30 17:18

    電路識圖從入門到精通高清電子資料

    由淺入深地介紹了電路圖的基礎知識、典型單元電路的識圖方法,通過“入門篇”和“精通篇”循序漸進、由淺入深地介紹了電路圖的基礎知識、典型單元電路的識圖方法,以及典型小家電、電動車、洗衣機、
    發表于 04-10 16:22

    官網下載的stm32cubemx無法連接互聯網,WiFi有一條斜杠,怎么解決?

    有哪位大佬幫忙解決下,我在官網下載的stm32cubemx無法連接互聯網,WiFi有一條斜杠,感謝您。
    發表于 03-11 07:35