国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

會話式機器閱讀理解概述

智能感知與物聯網技術研究所 ? 來源:通信信號處理研究所 ? 作者:通信信號處理研究 ? 2020-11-25 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1

會話式機器閱讀理解是什么?

如何在會話式閱讀理解里面能夠建模它的implicative reasoning,即如何去學習會話與閱讀理解篇章之間的蘊含關系。 在這篇文章中,講者概述了兩種常見閱讀理解的類型: 第一種是標準的閱讀理解,該模式是指,給定一篇描述型的文章和一個基于事實型的問題,通過匹配文章和問題,從文章中抽取一個span來回答這個問題; 第二種是會話式的問答,與標準的單輪問答不同,需要追問新問題,即follow up question,同時問題是以交互的形式出現。會話式問答,存在兩個挑戰,一個是需要能理解篇章,另一個是能夠理解交互的會話本身。 基于會話式問答,講者引入一個例子簡單說明(圖1)。

比如,用戶簡單描述了自己的情況(Scenario),但用戶的問題并不能直接從文章(Rule Text)中獲取,往往這個文章可能是一個比較通用的、相當于是一個法規或者法律的篇章。 比如,說明能夠申請7a貸款的人,需要具備什么樣的條件,但針對用戶問題在文章中沒有直接的答案,必須和用戶進行一個交互,才能得到明確的回答。例子中,成功申請貸款的條件有三個,所以還需再問另外的條件。 比如,能不能夠在別的地方獲取它的資金來源,假如用戶說no的話,這時候就可以給他一個答案,也就是說你可以申請。 因此,在這種情形下,就需要既能夠讀懂這篇文章,理解文章中的規則,也要能夠主動地和用戶交互,從用戶那邊獲取一些需要知道的信息,最終再給他一個決策。

圖1 定義該項任務常用的數據集是ShARC (shaping answers with rules through conversation 的簡稱),數據集的設定是:給定Rule Text;用戶描述自己的Scenario(Background);用戶提出question;已有的問答(Dialog History)。 整個過程可以概述為,由于用戶給定的background往往不明確,機器需要進行幾輪交互,然后從交互中獲取一些跟規則有關的信息,然后告訴用戶具體答案。 整個任務有兩個子任務: 任務一,整合Rule Text,Scenario,Question以及通過幾輪交互從用戶獲取的信息,作為模型輸入,然后做出決策(Decision Making)。

該決策包含四種類型:一種是根據現有的信息能夠作出yes or no 的決策;或者有些情況下,用戶的問題可能與給定Rule Text無關,或根據Rule Text并不能解決問題,則會出現unanswerable的答案;另一種情況是Rule Text中需要滿足很多條件,但有些條件機器不確定是否滿足,需要作出inquire的決策,主動從用戶那里獲取更多信息,直至幾輪交互后能夠作出yes or no的決策。 任務二,如果生成的決策是inquire,則需要機器問一個follow-up question,該問題能根據Rule Text引導用戶提供一些沒有提供的信息,便于進一步的決策。

圖2 2

會話式機器閱讀理解的初探

2.1 模型介紹 負采樣 針對于該任務,講者主要介紹了兩項工作,首先是發表于ACL2020的文章“Explicit Memory Tracker with Coarse-to-Fine Reasoning for Conversational Machine Reading”。 該工作的貢獻有兩個: a. 針對決策,提出了explicit tracker,即能夠顯示的追蹤文章中條件是否被滿足; b. 采用coarse-to-fine方法抽取Rule Text中沒有被問到的規則、條件等。

圖3 模型主要包括了四部分:1.Encoding→ 2.Explicit Memory Tracking→ 3.Decision Making→ 4.Question Generation,整體結構如下:

圖4 (1) Encoding 將Rule Text中的句子分開,比如分為三個句子,在每個句子前加一個[CLS]表征句子特征,同時把queestion,scenario以及用戶的會話歷史加起來,也用[CLS]表征,拼接起全部特征后,通過BERT進行encoding。

圖5 (2) Explicit Memory Tracking 該部分的目的在于挖掘出存在于Relu Text的句子中與用戶提供的信息(比如initial question 和dialog history)之間的implication。 針對于此,提出了explict memory tracker,類似于recurrent的思想,逐步的把用戶的信息和Relu Text中的規則進行交互,從而更新每一個規則的memory里對應的value,最終得到每一個條件滿足,不滿足或者不知道的一個狀態。 經過n次更新完后,每一個rule 都會得到key-value對。

圖6 (3)Decision Making 對n次更新完后的key-value做self-attention,經過一個線性層做四分類,即Yes, No, Irrelevant, Inquire。

圖7 同時,還設計了一個subtask,即對最終更新完之后的key-value做一個預測,顯示的預測該規則是Entailment,Prediction還是Unknown。該預測任務和Decision Making一起進行訓練。

圖8 (4)Question Generation 若得到的決策是Inquire,就要求繼續做一個follow-up question的generation。 主要包括兩個步驟: 第一步,從rule 中抽取一個span,具體是使用了一種coarse-to-fine 的做法,如下圖所示。由于在Entailment prediction,句子的unknown分數越高,表示該句子越可能被問;若句子狀態是Entailment或者Contradiction,說明該句子狀態已知,沒必要繼續問下去。 因此,選擇每一個句子在Entailment prediction中unknown的分數,并在每一個句子中計算抽取start和end的分數,然后將這兩個分數相乘,綜合判斷哪一個span最有可能被問到。

圖9 第二步,就是把span和rule 拼接起來,經過一個預訓練模型將其rephrase一個question。

圖10 2.2 實驗驗證 負采樣 使用ShARC數據集進行實驗驗證,包含了兩個任務的評價:分別為對于Decision Making任務采用 Marco-Accuracy 和Micro-Accuracy評價;以及對于問題生成采用BLEU Score評價。 此外,講者考慮到在end-to-end evaluation時,存在一個缺點,也就是說,對于評價問題生成時,模型是基于決策這部分的水平去做問題生成的評價,這使得每個模型之間問題生成的表現不好比較,因此提出一個oracle question generation evaluation,即只要當Ground truth decision 是inquire,就對其問題生成的水平進行評價。 在測試集上得到的結果驗證了所提出的Entailnment Memory Tracker(EMT)模型較其他模型效果有很大提升,尤其在問題生成方面效果顯著。

表1 具體分析每一類決策的準確率,可驗證Inquire的效果要更好,主要因為模型能顯式的追蹤模型的一些狀態,而不是簡單的學習模型中一些Pattern。 此外,在oracle question generation evaluation數據集上,與之前最好的模型E3,以及加上UniLM的模型進行對比,同樣也證明了采用Coarse-to-Fine的方法抽取span,在問題生成方面具有更好的效果。

表2 同時,講者給出了一個例子,更形象明白的說明了所提出的模型具備可解釋性。

圖11 3

如何更好地進行會話式機器閱讀理解

3.1 問題提出負采樣 進一步,講者介紹了第二項工作,該工作與前者的側重點有所不同,存在兩個差異: 第一,document interpretation,主要由于第一項工作只是簡單的對句子進行了一個切分,但實際上有些conditions(比如,上述例子中的American small business for profit business)是長句子中從句的條件,因此,第二項工作側重如何去理解這樣的條件。比如,能申請7(a)貸款,需要滿足(①==True and ②==True and ③==True)的條件,這在第一項工作中是沒有被建模的。

圖12 第二,dialogs understanding,即對于會話并沒有做特別顯式的理解。比如,在會話第一輪發現rule之間是and的關系,并且在Scenairo中抽取出條件,說明第一個rule是true,但還要繼續問第二個和第三個rule,所以給定Inquire的決策,直至滿足所有的rule后,才能給一個“You can apply the loan”的回答。

3.2 模型介紹負采樣 因此,該項工作主要基于這兩點,提出先采用Discourse Segmentation的方法顯式的把條件更好地抽取出來,之后做Entailment Reasoning 顯式地預測每一個狀態是否被滿足,如果預測結果是Inquire,還需要做一個Follow-up Question Generation。

具體的,在discourse segmentation 中主要有兩個目標:其一是明白Rule Text中的邏輯關系;其二是將句子中的條件更好地抽取出來。比如,對于一個rule采用Discourse Segmentation的方法將其抽取成三個elementary discourse unit (EDU),比如,下圖中EDU1 ,EDU3是條件,然后EDU2是一個結果,這樣的一個關系。

圖15 如何實現Entailment Reasoning? 與工作一類似,在EDU抽取之后,將其與之前的用戶Question,Scenairo 以及Dialog History拼接起來,經過預訓練模型,得到每一個phrase的表征。然后采用多層transformer模型預測rule中每一個EDU 的狀態,是Entailment、Contradiction,或者Neutral。 多層transformer模型較之前recurrent思想的模型更優秀,其不僅能在用戶信息與rule之間做交互,也能更好的理解rule本身的邏輯結構(比如,conjunction,disconjunction等 )。 進一步,如何實現Decision Making? 在做決策時,根據學習到的Entailment、 Contradiction、Neutral向量,去映射前一步做Entailment Prediction的三個分數,得到每一個EDU的狀態vector,同時拼接該狀態vector與EDU本身的語義表示,作為Decision Classifier 輸入,從而得到決策。

圖163.3實驗驗證及結論負采樣 同樣地,實驗也是在ShARC數據集上進行。實驗結果表明,使用discourse segmentation加上更好的更顯式的Reasoning的模式,較之前使用EMT模型具有更好的性能表現,在Micro Accuracy和Macro Accuracy上差不多高出4%。

表3 在Ablation Study中,首先對比了RoBERTa和BERT之間的區別,表明了RoBERTa對于Reasoning的任務具有一定的貢獻;其次,說明了采用discourse segmentation劃分一個句子為多個EDU形式的效果優于僅對句子進行劃分的結果;然后,證明了采用Transformer顯示地對用戶信息和問題之間做交互是有必要的;最后,證明了拼接Entailment vector和EDU本身的語義表示,對最終決策具有相當大的貢獻。

表4 進一步,分析了不同邏輯結構下模型的結果表現。這里粗略分成4種規則的邏輯結構,即Simple、Disjunction、Conjunction以及Other。結果表示,模型在Simple形式下具有最好效果,然而在Disjunction形式下效果較差。

圖17 為什么模型對于Disjunction,做出的決策效果較差? 考慮到模型涉及兩部分內容,一是dialogue understanding;二是對 scenario的理解。 因此,講者進一步做了如下實驗,就是把這兩塊內容分開,選擇一個只用到dialogue understanding 的子集,再選擇一個只用到scenario Interpretation的子集,進行實驗。 結果表明,只用到dialogue understanding 的子集的模型效果要優于用到整個數據集的效果,但在scenario Interpretation的子集上,實驗效果差了很多。 該現象的原因在于,用戶自己的background (scenario)可能用到了很多reasoning的方式,與rule 不完全一樣,因此對scenario的理解是比較差的。很多時候scenario里提到了關鍵信息但是模型并沒有抽取成功,從而繼續做出inquire的決策。這也可能是導致Disjunction決策效果較差的原因。

圖18 4

總結

綜上,講者團隊分別提出了Explicit Memory Tracker with Coarse-to-Fine Reasoning 以及Discourse aware Entailment Reasoning的方法,并且在ShARC數據集上效果很好,同時設計實驗分析了數據集本身的難點以及模型的缺陷,為后續研究指明可拓展方向。

責任編輯:xj

原文標題:香港中文大學高一帆博士:會話式機器閱讀理解

文章出處:【微信公眾號:通信信號處理研究所】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 閱讀
    +關注

    關注

    0

    文章

    10

    瀏覽量

    11679
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136938

原文標題:香港中文大學高一帆博士:會話式機器閱讀理解

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    破解RDMA網絡“黑盒”:輕量化會話追蹤工具

    在RDMA網絡運維面臨“黑盒”挑戰的背景下,星融元推出的RST工具通過無侵入捕獲CM報文,實現RDMA會話的可視化追蹤與全網路徑還原。該工具基于RFT與RPT雙模塊,支持從設備流表到全局拓撲的多維觀測,大幅降低運維定位成本,推動高性能網絡運維走向透明化與智能化。
    的頭像 發表于 02-13 14:30 ?323次閱讀
    破解RDMA網絡“黑盒”:輕量化<b class='flag-5'>會話</b>追蹤工具

    MAX14663:便攜醫療設備的理想電源管理解決方案

    的電源管理芯片——MAX14663。 文件下載: MAX14663.pdf 一、概述 MAX14663是一款集成度極高的電源管理解決方案,適用于便攜醫療設備,如高端血糖儀等。它將電池充電器、電量計、電壓保護與轉換以及電纜檢測與
    的頭像 發表于 02-05 16:35 ?370次閱讀

    【「龍芯之光 自主可控處理器設計解析」閱讀體驗】--全書概覽與概述

    感謝論壇與出版社提供此書以及作者編著此書。下面是書籍實物,不是很厚但很通俗易懂、簡明概要。 首先對全書章節進行概覽,然后對第一章概述進行閱讀學習。 全書分6章,在架構、工具鏈、案例方面進行了介紹
    發表于 01-18 12:58

    《AI機器人控制進階教程(入門版)》閱讀指引

    一、為何要學習“AI+機器人”?在開始動手實驗前,理解“AI”與“機器人”結合的價值至關重要。這不僅是技術的融合,更是開啟智能體(Agent)未來的鑰匙。1.從自動化到智能化傳統機器
    的頭像 發表于 01-07 10:56 ?2187次閱讀
    《AI<b class='flag-5'>機器</b>人控制進階教程(入門版)》<b class='flag-5'>閱讀</b>指引

    【「高速數字設計(基礎篇)」閱讀體驗】+初步上手閱讀

    初步拿到書,閱讀了第一章。感受就是非常講的基礎,非常適合小白學習。剛好我就是,雖然大學里也學過數電,但是也有一段時間了,突然讓我將一下D觸發器,一定是腦袋空空的說出什么來的,但是稍微講一下,就可以
    發表于 10-21 20:50

    手持身份證識別閱讀器:移動的身份識別智能終端

    鳥鳥N70S手持居民身份證閱讀器是一種專為移動辦公與身份核驗而設計的終端設備,集身份證識別、OCR、二維碼掃描、人臉識別等功能于一體。廣泛應用于公安執法、金融開戶、醫療登記、展會安保等場景,支持全天候移動工作,真正實現身份驗證的高效與安全。
    的頭像 發表于 08-20 14:34 ?1528次閱讀
    手持<b class='flag-5'>式</b>身份證識別<b class='flag-5'>閱讀</b>器:移動的身份識別智能終端

    【「Yocto項目實戰教程:高效定制嵌入Linux系統」閱讀體驗】+基礎概念學習理解

    。為了對珠峰更了解些,開始接觸 Linux 系統開發,并逐漸認識到 Yocto 項目在定制嵌入 Linux 系統方面的重要性。所以很想拜讀下此書。 二、書籍內容概述 基礎知識 書中首先回顧了 Linux
    發表于 08-04 22:29

    納芯微電子工業控制、機器人解決方案器件選型概述

    納芯微電子工業控制、機器人解決方案器件選型概述
    的頭像 發表于 05-15 14:40 ?967次閱讀
    納芯微電子工業控制、<b class='flag-5'>機器</b>人解決方案器件選型<b class='flag-5'>概述</b>

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    閱讀心得體會:ROS2機器人視覺與地圖構建技術 通過對本書第7章(ROS2視覺應用)和第8章(ROS2地圖構建)的學習,我對機器人視覺感知和自主導航的核心技術有了更深入的理解。以下是我
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】機器人入門的引路書

    ROS的全稱:Robot Operating System 機器人操作系統 ROS的 目的 :ROS支持通用庫,是通信總線,協調多個傳感器 為了解決機器人里各廠商模塊不通用的問題,讓機器人快速開發
    發表于 04-30 01:05

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例

    、深度學習視覺巡線、相機標定、OpenCV圖像處理等。這些內容雖然在本次閱讀體驗中沒有詳細展開,但它們同樣對于機器人的視覺感知和環境理解具有重要作用。
    發表于 04-27 11:42

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+內容初識

    《ROS 2智能機器人開發實踐》內容閱讀初體驗 《ROS 2 智能機器人開發實踐》是一本針對 ROS 2(Robot Operating System 2)這一先進機器人開發框架的實用
    發表于 04-27 11:24

    【「零基礎開發AI Agent」閱讀體驗】+初品Agent

    事務和專業事務的處理能力,它是存在于計算機程序等虛擬環境中的虛擬代理人。 Agent并非聊天機器人的升級版,它不僅會告訴你“如何做”,還會“幫你做”。 因此它可以被定義為能自主理解、規劃決策、執行復雜
    發表于 04-22 11:51

    ZXUN xGW會話數不均衡的故障分析

    某區域部署了兩套xGW,權重相同。通常,兩套xGW上的會話數是一樣的,從某天開始2套xGW的會話數出現了差異,并且差異越來越大,如下圖所示。
    的頭像 發表于 04-12 15:51 ?740次閱讀
    ZXUN xGW<b class='flag-5'>會話</b>數不均衡的故障分析

    MCUXpresso_24.12.148/FRDM-K22F調試會話啟動速度非常慢,怎么解決?

    我們的檔案中提取的項目,但是當我單擊“調試”選項時,它始終需要 3 分 48 秒來加載并準備好進行調試。當我構建這個項目時,我收到 0 個警告和 0 個錯誤,并且在啟動 Debug 會話時沒有收到
    發表于 04-02 08:26