国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于長度感知注意機制的長度可控摘要模型

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-01-06 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以往的長度可控摘要模型大多在解碼階段控制長度,而編碼階段對指定的摘要長度不敏感。這樣模型傾向于生成和訓練數據一樣長的摘要。在這篇論文中,作者提出了一種長度感知注意機制(LAAM,length-aware attention mechanism)來適應基于期望長度的編碼。

本文的方法是在由原始訓練數據構建的摘要長度平衡數據集上訓練 LAAM,然后像往常一樣進行微調。結果表明,這種方法可以有效地生成具有所需長度的高質量摘要,甚至是原始訓練集中從未見過的短長度摘要。

e92b8d12-8d5b-11ed-bfe3-dac502259ad0.png

論文題目:Length Control in Abstractive Summarization by Pretraining Information Selection

收錄會議:

ACL 2022

論文鏈接:

https://aclanthology.org/2022.acl-long.474.pdf

代碼鏈接:

https://github.com/yizhuliu/lengthcontrol

背景

摘要任務目的是改寫原文,在簡明流暢的摘要中再現原文的語義和主題。為了在不同的移動設備或空間有限的網站上顯示摘要,我們必須生成不同長度的摘要。

長度可控的摘要是一個多目標優化問題,包括:

在期望的長度內生成完整的摘要

以及根據期望的長度選擇適當的信息

相關方法

現有的基于編解碼器模型的長度可控摘要可分為兩類:

解碼時的早停

編碼前的信息選擇

解碼過程中的早停方法關注何時輸出 eos(end of sequence),也就是摘要的結束標志。有人設計了專門的方法。這個專門方法是通過在測試期間將期望長度的位置上的所有候選單詞分配 ?∞ 的分數來生成 eos。這個方法可以應用于任何 seq2seq 模型。然而,這些方法只是簡單地為解碼器增加了長度要求,而忽略了從源文檔編碼內容或信息選擇也必須適應不同長度要求的問題。

基于信息選擇的方法分為兩階段。一個突出的例子是 LPAS,在第一階段,從源文檔中提取最重要的l個標記作為所需長度的原型摘要,并在第二階段通過雙編碼器對源文檔和原型摘要進行編碼。一方面,這種兩階段方法會在中間結果中引入噪聲。另一方面,這些方法的第二階段沒有第一手的長度信息,這削弱了長度控制。

本文方法

在本文中,作者提出了LAAM(長度感知注意機制),它擴展了 Transformer seq2seq 模型,具有根據長度約束在上下文中選擇信息的能力。

LAAM 重新 normalize 編碼器和解碼器之間的注意力,以增強指定長度范圍內具有更高注意力分數的 token,幫助從源文檔中選擇長度感知信息。隨著解碼進行,增強 token 的數量將會逐步減少,直到 eos 獲得最高的注意力分數,這有助于在指定長度上停止解碼過程。

LAAM 可以被認為是上一節兩類方法的混合版本。

同時作者觀察到,在現有訓練集中,不同長度的摘要數量有很大差異。為了平衡摘要在不同長度范圍內的分布,本文提出了一種啟發式方法:首先定義摘要長度范圍,然后從原文中直接抽取不同長度的摘要,根據特定指標控制抽取摘要的相關度,從而創建長度平衡數據集(LBD,length-balanced dataset)。

在本文方法中,先從原始的摘要數據集創建一個 LBD。之后,在 LBD 上預訓練LAAM,以增強 LAAM 在長度約束下的文本選擇能力。最后,將預訓練后的 LAAM 在原始數據集上微調,以學習將所選文本改寫為不同長度的摘要。

當前訓練數據集中沒有短摘要,微調后的模型沒有見過短摘要,所以如果用它生成短摘要的話算是 zero-shot。得益于 LDB 的預訓練,本文的方法可以解決zero-shot情況下的長度控制問題。

本文的主要貢獻:

提出了LAAM(長度感知注意機制)來生成具有所需長度的高質量摘要。

設計了一種啟發式方法,從原始數據集中創建一個LBD(長度平衡數據集)。在 LBD 上對 LAAM 進行預訓練后,LAAM 效果能有提升,并且可以有效解決 zero-shot 情況下的短摘要生成問題。

LAAM

e969c8de-8d5b-11ed-bfe3-dac502259ad0.png

上圖是 Transformer 解碼器。

左上方為源文檔輸入:,作為注意力的 Key。

最左側為模型當前輸出:,作為注意力的 Query,兩者點乘得到注意力矩陣。 注意力矩陣分為兩部分, 負責文本信息選擇, 負責結束標志選擇

注意力矩陣的第一行加粗了 Top3,第二行加粗了 Top2,第三行加粗了 Top1,對加粗的進行提權,本文通過這種方式向模型傳遞句子剩余預測長度信息。

也會進行提權,并且越接近指定長度,提權幅度越大,模型也就更容易預測出 eos。

提權后要進行一次歸一化,不然和不為 1。

這就是本文提出的 LAAM 模型。

總結

本文方案的整體流程是:

用原始訓練集生成 LBD(長度平衡數據集)

在 LBD 上預訓練 LAAM 模型

在原始訓練集上微調 LAAM 模型

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編解碼器
    +關注

    關注

    0

    文章

    286

    瀏覽量

    25402
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26196

原文標題:ACL 2022 | 基于長度感知注意機制的長度可控摘要模型

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    設置了帶有長度、CRC校驗的指令格式,通信時需要注意哪些方面?

    設置了帶有長度、CRC校驗的指令格式,通信時需要注意哪些方面?
    發表于 02-03 14:14

    測試案例分享——OFDR測試大插損器件長度的方法與技巧

    隨著通信技術的不斷發展,光學器件與系統內部集成的組件數量顯著增加,系統結構日趨復雜。大量功能各異的光學組件不可避免地引入更高的插入損耗,從而在復雜光路中對各段待測光路長度的精確測量提出了巨大挑戰
    的頭像 發表于 12-12 17:38 ?1321次閱讀
    測試案例分享——OFDR測試大插損器件<b class='flag-5'>長度</b>的方法與技巧

    關于伺服電纜長度問題的詳解

    對信號完整性的影響機制 1. 傳輸延遲與波形畸變 伺服系統中的編碼器信號對時序極為敏感,當電纜長度超過30米時,信號傳播延遲可達150ns以上。特別是100MHz以上的高頻脈沖信號,在50米電纜傳輸后可能出現明顯的上升沿鈍化現象。建議采
    的頭像 發表于 11-01 07:40 ?989次閱讀

    MD5信息摘要算法實現一(基于蜂鳥E203協處理器)

    的整數倍,是因為在MD5的哈希運算中,每次的輸入是以512-bit為單位,然后進入運算。需要注意的是,消息的長度是指將輸入的數據通過ASCII碼轉換為二進制后所占的位數,而非字符串本身長度。 【舉例1
    發表于 10-30 07:18

    pipe發送超過16384長度,會被截斷怎么解決?

    我在使用paho_mqtt 發送數據的時候,短包沒問題,發現數據長度超過16384就會崩潰; 追查之下發現pipe 寫入數據以后,一次性讀出來只有16384; 反復測試之后,看到第二次接收到3255;為什么會分兩次接收。
    發表于 10-11 06:18

    極細同軸線長度差如何影響高速信號同步?

    在高速信號系統中,極細同軸線束的長度差會直接影響信號同步、差分完整性和系統誤碼率。隨著速率不斷提高,設計人員對線長匹配的要求也越來越嚴格。只有在設計、制造和應用的全過程中都重視這一問題,才能確保系統的穩定性和可靠性。
    的頭像 發表于 09-22 15:02 ?1577次閱讀
    極細同軸線<b class='flag-5'>長度</b>差如何影響高速信號同步?

    小白學大模型:大模型加速的秘密 FlashAttention 1/2/3

    在Transformer架構中,注意機制的計算復雜度與序列長度(即文本長度)呈平方關系()。這意味著,當模型需要處理更長的文本時(比如從幾
    的頭像 發表于 09-10 09:28 ?4808次閱讀
    小白學大<b class='flag-5'>模型</b>:大<b class='flag-5'>模型</b>加速的秘密 FlashAttention 1/2/3

    電纜的長度會影響特性阻抗嗎?

    電纜的長度會影響特性阻抗嗎?
    發表于 09-08 07:08

    信號走線長度:輻射發射的隱形 “操盤手”

    一前言在電子設備中,隨著電路集成度不斷提高以及工作頻率持續上升,電磁兼容性(EMC)成為關鍵問題。信號走線作為電路中信號傳輸的通道,其長度對輻射發射有著顯著影響,這不僅關系到設備自身的穩定運行,還關
    的頭像 發表于 08-05 11:33 ?1035次閱讀
    信號走線<b class='flag-5'>長度</b>:輻射發射的隱形 “操盤手”

    六類線永久鏈路的長度不能超過多少米-科蘭

    六類線永久鏈路的長度不能超過90米,這是根據國際標準TIA/EIA-568及ISO/IEC 11801明確規定的上限值。以下為具體說明: 一、標準依據與定義 永久鏈路(Permanent Link
    的頭像 發表于 07-14 10:09 ?1295次閱讀
    六類線永久鏈路的<b class='flag-5'>長度</b>不能超過多少米-科蘭

    技術資訊 I 漸變線或淚滴的最佳長度設計

    線、焊盤或過孔之間銅走線或漸變線連接的長度。借助PCB布線軟件中的漸變線和淚滴布局工具,設計人員能夠輕松放置常見的連接形狀。在大多數設計工具的基本功能是將漸變線采
    的頭像 發表于 07-04 13:34 ?1814次閱讀
    技術資訊 I 漸變線或淚滴的最佳<b class='flag-5'>長度</b>設計

    CYUSB3014如何增加最大傳輸數據長度

    我正在使用 CYUSB3014(FX3)在 PC 的 USB 和 FPGA 之間傳輸數據。 對于小于2097152的數據長度,數據都可以成功傳輸到PC。 如果數據長度超過 2097152(power
    發表于 05-19 08:03

    VirtualLab Fusion應用:相干時間和相干長度計算器

    摘要 在本用例中,我們介紹了一種計算器,它可以根據給定光源的波譜信息快速估計其時間相干特性。然后,可以將該計算器的結果自動復制到通用探測器中,以便在考慮時間相干性時應用近似方法,而無需對光源的波長
    發表于 04-08 08:48

    線束導線長度的定義有哪些?重要嗎?

    關于線束導向長度的定義,定義了適當的、準確的導線長度,可用于線束制造。
    的頭像 發表于 03-27 11:46 ?1269次閱讀

    變頻串聯諧振耐壓試驗裝置:如何根據電纜長度與截面積選擇容量

    在選擇變頻串聯諧振耐壓試驗裝置的容量時,需要考慮電纜的長度和截面積,因為它們直接影響到試驗所需的電壓、電流以及設備的容量。以下是根據電纜長度和截面積選擇變頻串聯諧振耐壓試驗裝置容量的詳細步驟: 一
    的頭像 發表于 03-14 09:39 ?1233次閱讀