国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自動跨主題作文屬性評分研究

深度學習自然語言處理 ? 來源:Robert Ridley ? 作者:Robert Ridley ? 2020-12-26 09:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

研究動機

自動作文評分(英文叫Automated Essay Scoring,簡稱AES)旨在使用計算機來根據論文的整體質量或與某些屬性(trait)相關的質量來評分,例如,文章組織、切題程度、敘述性等。現有的大多數研究都是針對同一主題的已評分作文數據集上進行模型的訓練和預測(如圖1左上角和左下角),其中訓練和測試數據都是從同一分布中(DA)提取的。

958cca68-4690-11eb-8b86-12bb97331649.png

圖1: AES任務概覽

然而真實場景中的AES系統通常無法獲得足夠多的目標主題文章,因此有必要研究如何預測訓練數據中不存在的主題的文章分數。因此,最近的一些研究探索了跨主題的AES,即從不同的主題中提取訓練數據和測試數據(圖1的右上角)。跨主題的AES研究目前只關注根據論文的整體性來評分,而我們認為一個有效的AES系統還應該能夠提供屬性級別的反饋,因此,我們引入了一個新的AES任務,即自動跨主題作文屬性評分,該任務要求模型在僅有非目標主題作文進行訓練的前提下,能夠準確預測屬于目標主題的文章的總分以及多個屬性的分數(如圖1右下角),其中訓練和測試數據來自不同的分布,輸出是不同屬性的分數。

這項新的任務表現出兩個主要的挑戰:

第一,模型需要有足夠的泛化能力,才能在新的主題中表現良好;

第二,模型需要能夠從不同的方面表示文章質量,以便有效地對各種文章屬性進行評分。

在探討自動跨主題作文屬性評分的任務中,我們解決了兩個問題:

第一,屬于不同題目的文章有不同的trait集,因此許多trait有部分覆蓋率(論文中叫partial-trait coverage),這會導致某些trait的訓練數據不足。例如,如果只有兩個題目的文章在敘述性trait上有分數(所有其他題目的文章沒有),那一個被訓練為這一trait打分的模型只能在這兩個題目的文章上進行訓練;

第二,不同trait之間存在高度的相關性。例如,一個在word choice的trait上分數高的文章也可以預期在conventions上獲得很好的分數。

為了解決partial-trait coverage的問題,我們引入了一種多任務的方法,即Cross-prompt Trait Scorer(CTS),該方法同時預測總體分數和所有trait的分數。這使得模型能夠對訓練集中的所有數據進行訓練,以學習更魯棒的表示。為了解決trait間關系的問題,我們設計了一個trait-attention機制,利用最相關的trait信息來預測每個trait的分數。

02

貢獻

1.我們提出了一個新的任務,即自動主題作文屬性評分,它將AES解決方案中的兩個重要任務(跨主題作文評分和作文屬性評分)結合起來,從而更貼近真實場景。

2.我們設計了一個新的方法叫Cross-prompt Trait Scorer(CTS),通過使用多任務方法來解決由于partial-trait coverage而導致訓練數據受限的問題。

3.我們設計了一個trait-attention機制來利用不同trait之間存在的關系。

03

解決方案

我們的方法建立在PAES(Ridley et al. 2020,如圖2左)之上,PAES是一個跨主題AES的SOTA方法。該方法利用詞性嵌入來學習廣義句法表示。首先,每個句子都有一個卷積層,通過attention pooling來實現句子級的表示。然后,這些表示被輸入一個recurrent層,該層使用LSTM,然后是第二個attention pooling層來學習完整的文章表示。然后將一組非主題特定的特征與文章表示鏈接起來,最后通過一個線性層和sigmoid激活來預測單個分數。

這類方法通過獨立地對每個trait進行訓練,也可以直接應用于本文提出的新任務中,然而這樣做有兩個問題:首先,如果訓練數據中只有少量的文章擁有目標trait的標簽,那么就沒有足夠的數據來訓練一個魯棒的模型。其次,這些trait并不是相互獨立的,而是相互關聯的。這種簡單的方法不利用任何隱含的trait間的關系。

為了解決上述問題,我們設計了一個名為Cross prompt Trait Scorer(CTS)的模型,如圖2右所示。針對partial-trait coverage導致數據不足的問題,我們采用了基于多任務的體系結構,這使得模型能夠對數據集中的所有樣本進行訓練,以便學習更魯棒的編碼器表示。為了解決trait間的關系問題,我們在模型的低級別實現共享層,然后在高級別實現私有層。共享層旨在學習對所有任務都有用的通用表示。在多任務結構中,高級別的層能夠表示更復雜的信息,因此私有層被用來學習更多的任務特定表示。此外,為了更明確地共享trait之間的信息,我們設計了一個trait-attention機制,允許每個trait集中于其他trait的相關信息。

95a14b96-4690-11eb-8b86-12bb97331649.png

圖2: PAES(左,Ridley et al. 2020)及本文給出的CTS模型(右)

04

實驗

本文的實驗是在Automated Student Assessment Prize(ASAP)數據集上進行的。ASAP數據集包含八個不同的文章集,每個集中的文章都有不同的題目。每一篇文章都會根據文章的整體質量獲得一個人性化的評分,而文章集7和8的文章則會根據評分標準對一些相關trait進行額外評分。由于只有文章集7和8具有trait分數,因此我們還使用了ASAP++數據集,該數據集是在原始ASAP數據集的基礎上構建的。ASAP++的作者為文章集1-6提供了各種相關trait的分數,以補充ASAP的原始總分。

表1: ASAP和ASAP++數據集中的屬性定義

960f9150-4690-11eb-8b86-12bb97331649.png

每個文章集的trait如表1所示,文章集1-6的trait分數來自補充的ASAP++數據集,文章集7和8的trait分數來自ASAP數據集。所有的總分都來自原始的ASAP數據集。

在實驗中,一個文章集的作文被用作測試數據,其余幾組的文章被用作訓練數據。對于每個文章集重復此操作。在每種情況下,開發集包含與訓練集相同集的文章。

我們將CTS與四個baseline模型進行了比較,Hi att和AES aug都是在Prompt-specific Holistic scoring和Prompt-specific Trait Scoring都取得了很好性能的模型,PAES是我們的base模型,是一個面向Cross-prompt Holistic Scoring的SOTA方法,最后,CTS no att是我們的CTS模型的一個消融版本,沒有添加trait-attention機制。

表2:各文章集的平均QWK值

965621d8-4690-11eb-8b86-12bb97331649.png

表3:各屬性的平均QWK值

9681359e-4690-11eb-8b86-12bb97331649.png

在表2中,我們顯示了每個文章集的所有trait的平均分數,在表3中,我們顯示了每個trait的所有文章集的平均分數。從這兩個表來看,我們可以看出兩個面向Prompt-specific的方法(Hi att 和AES aug)都表現不好。這是因為這些模型不是為Cross-prompt的設置設計的,因此它們過擬合很嚴重。

當我們比較三種面向Cross-prompt模型時,我們可以看到,除了文章集5外,CTS在所有文章集上的性能都超過了PAES和CTS no att,而且在大多數文章集中,多任務方法CTS no att的性能都優于單任務方法PAES。這是因為PAES無法利用完整的訓練數據集,它只能在目標trait有標簽的樣本上進行訓練。CTS no att和CTS的多任務結構能夠利用訓練集中的所有樣本進行訓練。

表4:文章集2中每個屬性的平均QWK值

96af94f2-4690-11eb-8b86-12bb97331649.png

我們還通過實驗來驗證可用的訓練數據的數量對模型性能的影響。表4中顯示了PAES、CTS no att和CTS的文章集2的每個屬性的性能。在這個表格中,有Word Choice和Sentence Fluency只出現在另外兩個文章集中。因此,在對這兩個屬性進行評分時,基于單任務方法僅能對訓練集9499篇論文中的2129篇進行訓練,與其他兩個模型相比,這兩個trait的表現顯著降低。

圖3:預測文章集3的總分時所有屬性的注意力權重

為了深入了解trait-attention機制的運作方式,我們將注意力權重可視化。在圖3中,當預測文章集3的總分時,由于這是一個整體評分,應該從多個不同方面考慮文章的質量,因此我們可以看到注意力在所有屬性中的分布相對均勻,基本沒有權重明顯高于其他屬性的屬性。

圖4:預測文章集3的Language分數時的屬性注意權重

圖4則顯示了在預測文章集3的Language分數時的trait注意權重。這是一個比總分更具體、更集中的屬性,此時與語言密切相關的屬性Word Choice的權重要明顯高于其他屬性權重。

05

總結

為了滿足真實場景中AES系統的需求,我們引入了一個新的AES任務,即Automated Cross-prompt Scoring of Essay Traits。此外,我們還提出了一個新的方法(Cross-prompt Trait Scorer),它利用共享和私有層的多任務結構以及trait-attention機制來解決在跨主題設置中某些屬性數據有限以及屬性間關系利用的兩個問題。

責任編輯:xj

原文標題:【AAAI2021】自動跨主題作文屬性評分

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136959
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124400

原文標題:【AAAI2021】自動跨主題作文屬性評分

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA DRIVE AV軟件平臺與Halos架構助力梅賽德斯奔馳CLA車型獲得最高安全評分

    NVIDIA DRIVE AV 軟件平臺與 NVIDIA Halos 架構助力 CLA 車型獲得最高安全評分(top safety rating)。
    的頭像 發表于 02-02 09:28 ?1291次閱讀

    比亞迪ESG評分實現重大突破

    作為全球規模最大、影響力最廣的年度企業可持續發展評估機構,標普全球CSA及明晟(MSCI)ESG評分是國際資本市場衡量企業長期價值的重要基準。?比亞迪自2008年提出“三大綠色夢想”以來,始終
    的頭像 發表于 11-26 17:12 ?1001次閱讀

    CW32L01????????????????????????????????????1的測評分

    的調試模式代碼#else // 此處保留官方原有的、通過外部硬件控制的產品模式代碼#endif在Debug模式下,我們可以解鎖兩個超實用的功能: 功能1:串口自動測量Hall相序 對于有感FOC,正確
    發表于 11-17 08:24

    華為鄭曉龍受邀出席CNCC 2025并發表主題演講

    第22屆中國計算機大會(CNCC2025)在“冰城”哈爾濱盛大啟幕,主題為“數智賦能,無限可能”。華為數據通信產品線研究部部長鄭曉龍在大會上發表題為《大模型推理加速與演進:網絡如何破局?》的演講
    的頭像 發表于 10-30 10:32 ?816次閱讀

    商品類目屬性查詢接口技術實現詳解

    ? ? 一、接口核心功能 該接口用于查詢電商系統中商品類目的屬性信息,支持: 按類目ID查詢屬性集合 按屬性類型過濾(關鍵屬性$K$、銷售屬性
    的頭像 發表于 10-11 15:43 ?463次閱讀
    商品類目<b class='flag-5'>屬性</b>查詢接口技術實現詳解

    手機板 layout 走線分割問題

    初學習layout時,都在說信號線不可分割,但是在工作中為了成本不能分割似乎也非絕對。 在后續工作中,分割的基礎都是相鄰層有一面完整的GND參考,分割發生在相鄰的另外一層。 但
    發表于 09-16 14:56

    天合光能榮登BNEF全球光伏企業ESG評分榜首

    近日,全球權威新能源研究機構彭博新能源財經(BloombergNEF,BNEF)發布最新報告,評估全球七家龍頭光伏企業在市場變化中的韌性與創新。BNEF高度關注天合光能成熟的全球化策略、穩健的融資
    的頭像 發表于 08-22 17:17 ?1347次閱讀

    國家級認證!拓維海云天“中文手寫體作文圖像識別評分生成算法”通過國家網信辦備案

    近日,國家互聯網信息辦公室發布第十二批深度合成服務算法備案公告,拓維海云天自主研發的核心技術成果——“中文手寫體作文圖像識別評分生成算法”成功通過備案(備案編號:250011號)。這是拓維海云天在
    的頭像 發表于 08-15 16:42 ?1353次閱讀
    國家級認證!拓維海云天“中文手寫體<b class='flag-5'>作文</b>圖像識別<b class='flag-5'>評分</b>生成算法”通過國家網信辦備案

    中國科學院自動研究所攜手中科曙光打造高性能工具鏈解決方案

    2019年起,中國科學院自動研究所以語音、文本、圖像等單模態大模型的研究與應用為基石,全力攻關全球首個千億參數多模態大模型。如今,相關產品已突破模態任務泛化與混合模態同步理解的技術
    的頭像 發表于 08-11 11:08 ?1061次閱讀

    喜報!科士達以實力超越期待:EcoVadis評分70分,遠超客戶目標!

    顯示的評分卡上,可以明確看到我司此評分超過88%的同行,屬于前15%。超越客戶期許,責任實力再獲權威印證客戶的嚴格要求是科士達前進的動力。當客戶明確提出希望我司達
    的頭像 發表于 07-17 11:02 ?814次閱讀
    喜報!科士達以實力超越期待:EcoVadis<b class='flag-5'>評分</b>70分,遠超客戶目標!

    連續四年!Splashtop 再度榮膺 TrustRadius 最高評分

    近日,全球領先的商業技術評論平臺TrustRadius正式頒發2025年「最高評分獎」(TopRatedAward2025),Splashtop已連續四年斬獲該獎項。Splashtop在遠程支持
    的頭像 發表于 06-17 17:36 ?1082次閱讀
    連續四年!Splashtop 再度榮膺 TrustRadius 最高<b class='flag-5'>評分</b>獎

    ArkUI-X平臺應用改造指南

    Android/iOS與HarmonyOS Next上能夠擁有相同的展示效果和交互體驗。 1.開發者進行設計時需首先考慮ArkUI-X框架的實際適配狀況,使用支持平臺的UI控件、屬性、方法進行平臺開發
    發表于 06-16 23:05

    ArkUI-X平臺框架接入指南

    ArkUI平臺框架(ArkUI-X)進一步將ArkUI開發框架擴展到了多個OS平臺:目前支持OpenHarmony、Android、 iOS,后續會逐步增加更多平臺支持。開發者基于一套主代碼
    發表于 05-18 18:21

    如何在設備上通過USBEZ-USB?將第二個SPI閃存用作文件系統的應用說明或建議?

    是否有關于如何在 設備上通過 將第二個 SPI 閃存用作文件系統的應用說明或建議?USBEZ-USB?
    發表于 05-09 06:26

    有幾個關于MCUXpresso深色主題(模式)設置的問題求解

    我有幾個關于 MCUXpresso 深色主題(模式)設置的問題。 請參閱附件。 我想修改 C 代碼的注釋顏色和用于在項目資源管理器中突出顯示源文件的顏色。 這些在哪里發生了變化?
    發表于 03-20 06:04