国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

受控文本生成模型的一般架構及故事生成任務等方面的具體應用

深度學習自然語言處理 ? 來源:哈工大訊飛聯合實驗室 ? 作者:申資卓 ? 2021-10-13 09:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自:哈工大訊飛聯合實驗室

本期導讀:本文是對受控文本生成任務的一個簡單的介紹。首先,本文介紹了受控文本生成模型的一般架構,點明了受控文本生成模型的特點。然后,本文介紹了受控文本生成技術在故事生成任務和常識生成任務上的具體應用,指出了受控文本生成技術在具體應用場景下的改進方向。

0. 什么是受控文本生成

文本生成任務是自然語言處理領域十分重要的一類任務。文本摘要、語法糾錯、人機對話等很多自然語言處理任務都可以被視為文本生成任務。GPT-2、BART、T5等文本生成相關的技術也在這些任務上取得了較好的效果。

受控文本生成任務與常規的文本生成任務有一些不同。常規的文本生成任務對生成文本的內容(Content)通常沒有強制性的約束,而受控文本生成任務會要求生成文本的內容必須滿足一些既定的約束條件,如風格(Style)、主題(Topic)等。

例如,文本風格轉換(Text Style Transfer)就是一類十分經典的受控文本生成任務,該任務要求生成文本的內容在語義上需要與轉換前保持一致,在風格上需要轉換為預定義好的目標風格。從應用的角度來看,受控文本生成技術更有希望構建出場景適配的、用戶可接受的文本生成系統。因此,受控文本生成技術已經被越來越多的研究者關注。

1. 受控文本生成模型的一般架構

CMU的一些研究者們發表在COLING 2020的一篇論文對受控文本生成模型的一般架構(見圖1)進行了比較細致的描述。受控文本生成模型在生成受控文本時可以通過5個子模塊對生成文本進行控制。

第一個模塊稱為額外輸入模塊(External Input module),該模塊負責提供生成受控文本時的初始信號

第二個模塊稱為序列輸入模塊(Sequential Input module),該模塊負責提供生成受控文本時每個時間步上的輸入。

第三個模塊稱為生成操作模塊(Generator Operations module),該模塊決定每個時間步向量表示的計算方式,即是使用RNN計算,還是使用Transformer計算,亦或是使用其他計算方式。

第四個模塊稱為輸出模塊(Output module),該模塊負責將每個時間步的向量表示映射為輸出結果。

第五個模塊稱為訓練目標模塊(Training Objective module),該模塊負責損失函數的計算。

其中額外輸入模塊,是受控文本生成模型中比較特殊且重要的一個模塊,該模塊通常會提供一個與控制目標相關的向量表示作為受控文本生成的初始信號,從而保證生成的文本滿足預定義的控制目標。另外,輸出模塊也是受控文本生成模型致力于改進的一個模塊。常規的文本生成任務只需要將每個時間步的向量表示映射為詞表分布作為輸出空間即可,而在受控文本生成模型中就需要通過某種方式改變輸出空間的分布去獲得期望的輸出結果。

2. 受控文本生成技術在故事生成任務上的應用

本節介紹一個發表在EMNLP 2020上的利用受控文本生成技術改進故事生成的工作。該工作使用的數據集為ROCStories dataset(該數據集中的每個故事都由5個句子組成),其任務設定為給定故事的第一個句子,機器自動生成后面的句子。

如果不使用受控文本生成技術,該任務就是一個簡單的語言模型式的文本生成任務,直接使用GPT-2就可以完成。但是,直接使用GPT-2生成的故事很難保證生成的結果是語義連貫且邏輯自洽的。因此,將受控文本生成技術引入到故事生成任務中就有可能控制故事生成的內容,從而改進故事生成的效果。

該工作首先使用一個基于GPT-2的關鍵詞預測模型預測出與下一句相關的關鍵詞,然后使用這些關鍵詞去大規模的知識庫中檢索出與這些關鍵詞相關的三元組,這些三元組會通過一些模板被轉化為句子。

由于這些由三元組轉化的句子數量較多且可能存在大量的噪音,因此,還需要一個與下一句信息相關聯的基于BERT的排序模型對這些句子進行排序,從而選擇出與下一句信息最相關的TopN個句子。在獲得這些來源于知識庫的句子后,我們就可以將這些句子作為控制信息并與當前句進行拼接一起作為GPT-2的輸入去生成下一句。上述流程需要循環進行直到生成故事中所有的句子。圖2是該工作整體的流程圖。

e3bc4c42-14b5-11ec-8fb8-12bb97331649.png

圖2 基于知識庫信息控制的故事生成流程圖

這個工作雖然沒有對受控文本生成模型進行改進,但是從大規模知識庫中獲取控制信息進行文本生成的思路還是有一定借鑒意義的。

3. 受控文本生成技術在常識生成任務上的應用

本節介紹一個發表在ACL 2021上將受控文本生成技術應用在常識生成任務上的工作。常識生成任務是一項比較新穎的文本生成任務。該任務的設定為給定一個概念集合,機器需要自動生成一個能夠描述這個概念集合的句子,并且生成的句子不能違背常識。例如,給定一個概念集合{apple, bag, put},理想情況下機器應該生成“A girl puts an apple in her bag”這樣的句子。如果機器生成了“A girl eats an apple”或者“A girl puts a bag in her apple”,都不能算是一個合格的生成結果。因此,要想獲得一個較好的生成結果,我們首先需要保證的就是概念集合里的概念都要出現在輸出結果中。

本節介紹的工作提出了一種名為“Mention Flags”的方法,通過在解碼端引入一個提及標記矩陣(Mention Flag Matrix)來標記輸入項與輸出項的提及關系,從而控制每個時間步解碼時的輸出。提及標記矩陣中的元素共有3種不同的取值,取0時表示該輸入項不是控制項,取1時表示該輸入項是控制項,但在輸出項中未出現。取2時表示該輸入項是控制項,并已經在輸出項中出現。以輸入為{apple, bag, put},輸出為“A girl puts an apple in her bag”為例。

在訓練時,提及標記矩陣可以通過輸入與輸出的對齊數據直接轉換得到。在推理時,我們只需要在每個時間步遞增式地擴充提及標記矩陣的每一列即可。

最后是如何將提及標記矩陣融入到模型中的問題。由于該工作使用的是基于Transformer的文本生成模型,其作者將提及標記矩陣視為輸入項與輸出項的相對位置(Relative Position),在計算輸出項與輸入項的交叉注意力(Cross Attention)時將相對位置信息融入到模型計算中。

4. 小結

本文簡單介紹了受控文本生成與常規文本生成任務的區別,并對受控文本生成模型的一般架構進行了闡述。受控文本生成的特殊點主要在于受控信息的獲取以及對輸出結果的控制。因此,要想獲得一個較好的受控文本生成系統,就可以從這兩點上對文本生成的模型或方案進行改進。另外,文本還介紹了受控文本生成技術在故事生成任務和常識生成任務上的應用,這些方法和思想同樣可以借鑒到其他受控文本生成任務中。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • CMU
    CMU
    +關注

    關注

    0

    文章

    21

    瀏覽量

    15594
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26159
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16836
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23267

原文標題:受控文本生成任務簡述

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模型支撐后勤保障方案生成系統:功能特點與平臺架構解析

    ? ? 大模型支撐后勤保障方案生成系統:功能特點與平臺架構解析 ? ?大模型支撐后勤保障方案生成系統憑借智能預測、動態調度、路徑優化、庫存管
    的頭像 發表于 12-17 15:49 ?287次閱讀

    萬里紅文本生成算法通過國家網信辦備案

    近日,國家互聯網信息辦公室發布了第十四批深度合成服務算法備案信息,北京萬里紅科技有限公司(以下簡稱:萬里紅)自主研發的“萬里紅文本生成算法”正式通過備案。該算法致力于通過自動化的方式,提升知識問答、RAG分類、預測、文檔生成的準確率,確保信息的安全性和合規性,為用戶提供及
    的頭像 發表于 11-14 09:06 ?660次閱讀

    如何讓大模型生成你想要的測試用例?

    應用大模型生成測試用例,常見的知識庫,測試大模型,微調,RAG等技術門檻都不低,甚至很難,因此對于應用者而言,最快的方式就是應用好提示詞,調教屬于個人風格的測試用例智能生成模塊,讓智能
    的頭像 發表于 09-26 10:01 ?915次閱讀
    如何讓大<b class='flag-5'>模型</b><b class='flag-5'>生成</b>你想要的測試用例?

    【Sipeed MaixCAM Pro開發板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統

    能夠有效捕捉AI生成圖像與真實手繪掃描圖像在紋理、筆觸、光影、全局致性等方面的細微差異。 邊緣端部署:將模型量化、編譯,最終高效運行在算力有限的MaixCAM-Pro開發板上。 實時
    發表于 08-21 13:59

    AI生成的測試用例真的靠譜嗎?

    軟件測試正經歷場深刻的技術革命。AI,尤其是以GPT、通義千問、文心言、Claude等為代表的大語言模型(LLM),開始廣泛介入測試流程:從需求分析、測試用例設計,到腳本生成與測試
    的頭像 發表于 08-01 10:02 ?1711次閱讀
    AI<b class='flag-5'>生成</b>的測試用例真的靠譜嗎?

    Copilot操作指南():使用圖片生成原理圖符號、PCB封裝

    “ ?上周推出支持圖片生成模型的華秋發行版之后,得到了很多小伙伴的肯定。但看到更多的回復是:為什么我的 Copilot 無法生成符號?只有普通的文本回復?今天就為大家詳細講解下圖片
    的頭像 發表于 07-15 11:14 ?4503次閱讀
    Copilot操作指南(<b class='flag-5'>一</b>):使用圖片<b class='flag-5'>生成</b>原理圖符號、PCB封裝

    關于鴻蒙App上架中“AI文本生成模塊的資質證明文件”的情況說明

    檢查結果為“通過”或審核狀態為“審核通過”。 那么對于這個問題,我也是嘗試去解決……這里分享下我了解到的情況和方法 首先,這個政策雖然說是針對AI文本生成模塊,但實際上,針對的是所有調用了AI大模型
    發表于 06-30 18:37

    生成式人工智能認證:重構AI時代的人才培養與職業躍遷路徑

    ,恰似座連接技術前沿與個體成長的橋梁,既承載著時代對人才的迫切需求,也指向著未來職場的核心競爭力。 、技術革命的雙重性:賦能與失衡并存 生成式人工智能的突破性,在于其首次讓機器具備了“無中生有”的創造力。從
    的頭像 發表于 05-23 09:29 ?824次閱讀

    小白學大模型:從零實現 LLM語言模型

    在當今人工智能領域,大型語言模型(LLM)的開發已經成為個熱門話題。這些模型通過學習大量的文本數據,能夠生成自然語言
    的頭像 發表于 04-30 18:34 ?1260次閱讀
    小白學大<b class='flag-5'>模型</b>:從零實現 LLM語言<b class='flag-5'>模型</b>

    ?Diffusion生成式動作引擎技術解析

    Diffusion生成式動作引擎 Diffusion生成式動作引擎是種基于擴散模型(Diffusion Models)的生成式人工智能技術
    的頭像 發表于 03-17 15:14 ?2976次閱讀

    NVIDIA RTX 5880 Ada顯卡部署DeepSeek-R1模型實測報告

    DeepSeek-R1 模型在 4 張 NVIDIA RTX 5880 Ada 顯卡配置下,面對短文本生成、長文本生成、總結概括三大實戰場景,會碰撞出怎樣的性能火花?參數規模差異懸殊的 70B
    的頭像 發表于 03-17 11:12 ?3007次閱讀
    NVIDIA RTX 5880 Ada顯卡部署DeepSeek-R1<b class='flag-5'>模型</b>實測報告

    使用OpenVINO GenAI和LoRA適配器進行圖像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無奇的文本提示詞轉換為令人驚艷的視覺效果。
    的頭像 發表于 03-12 13:49 ?1849次閱讀
    使用OpenVINO GenAI和LoRA適配器進行圖像<b class='flag-5'>生成</b>

    stm32cubemx 6.13.0(win)版本生成代碼中文注釋亂碼怎么解決?

    stm32cubemx 6.13.0(win)版本生成代碼中文注釋亂碼
    發表于 03-11 07:10

    《AI Agent 應用與項目實戰》閱讀心得3——RAG架構與部署本地知識庫

    ,提供更穩定的服務質量,但需要考慮API調用成本和網絡延遲等因素。在代碼實現方面,作者提供了相對詳細的示例,包括文本分塊的具體參數設置、向量化過程中的模型選擇、檢索閾值的調優等關鍵技術
    發表于 03-07 19:49

    飛凌RK3588開發板上部署DeepSeek-R1大模型的完整指南(

    DeepSeek作為國產AI大數據模型的代表,憑借其卓越的推理能力和高效的文本生成技術,在全球人工智能領域引發廣泛關注。DeepSeek-R1作為該系列最新迭代版本,實現了長文本處理效能躍遷、多模態擴展規劃、嵌入式適配等技術維度
    的頭像 發表于 02-21 14:55 ?3207次閱讀
    飛凌RK3588開發板上部署DeepSeek-R1大<b class='flag-5'>模型</b>的完整指南(<b class='flag-5'>一</b>)