国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

建立計算模型來預測一個給定博文的抱怨強度

深度學習自然語言處理 ? 來源:南大NLP ? 作者:方銘 ? 2022-11-08 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01

研究動機

抱怨是一種表達現實和人類期望之間不一致的言語行為[1]。人們會根據情況的嚴重性和緊迫性,用抱怨來表達他們的擔憂或不滿。輕微的抱怨可以達到發泄情緒以促進心理健康的目的,但嚴重的抱怨可能會導致仇恨甚至欺凌行為[2]。之前的研究主要集中在識別抱怨是否存在或其類型上,但是分析抱怨強度尤其重要,因為一定程度的抱怨可能會對公司或組織造成嚴重的負面后果。

4b63f274-5e9c-11ed-8abf-dac502259ad0.png

圖1 Jin數據集中同類別抱怨博文

在計算語言學中,先前的研究主要集中在建立自動分類模型來識別抱怨是否存在。Jin提供了一個數據集,基于語用學注釋了不同嚴重程度的抱怨博文,分別為“沒有明確的指責”、“反對”、“指責”、“指控”和“責備”[3]。在這些研究中,我們注意到一個缺失的部分是測量抱怨的強度。

為了說明這一點,我們展示了Jin最新數據集中的四個例子,如圖1所示:“我能向你抱怨我剛剛收到的咖啡嗎?”和“維珍媒體如往常一樣充滿謊言謊言謊言!!!”,這兩句話被分為同一類型“指控”,但顯然它們在抱怨的程度上是不同的。另一個例子是,“完全不酷”和“請盡快回復我的消息!!!”,這兩句都被歸類為“反對”,然而,后者明顯提出了更強烈的抱怨。

分析不同的抱怨水平是有利的。公司需要定期監控來自用戶的反饋,因為某些抱怨可能會嚴重影響其產品的聲譽。組織或政府需要監控民眾的抱怨,以了解他們的迫切需求。

02

貢獻

1、我們提出一個新穎的工作:即自動捕捉文本中抱怨強度

2、我們展示了第一個中文抱怨強度數據集,包含來自微博平臺的3103條數據。

3、通過一系列分析實驗進一步證明研究抱怨強度的必要性和重要性,以及一些有趣的實證發現。

4、我們展示了我們的數據集如何幫助預測社交媒體上博文的流行度。

03

數據標注

在這項工作中,我們使用Louviere and Woodworth(1991)提出的最佳最差比例法(Best-Worst Scaling, BWS)[4]注釋了抱怨強度。這種方法通過相互比較,可以比直接評分產生更穩定和細粒度的分數。類似的方法也被廣泛應用于計算語言學的各種任務中,例如測量攻擊性,親密度等等。我們通過簡單的計數百分比統計最終為每個博文分配抱怨強度評分,范圍從-1(最不抱怨)到1(最抱怨)。部分標注結果如圖2所示:

4b71a2a2-5e9c-11ed-8abf-dac502259ad0.png

圖2部分數據標注結果

04

主實驗

我們建立計算模型來預測一個給定博文的抱怨強度,使用SVR,Bidirectional LSTM,和BERT, RoBERTa等預訓練模型。我們在兩種情況下評估模型的性能:(1)混合話題(Mix Hashtag),我們將來自不同話題的微博博文組合在一起;(2)交叉話題(Cross Hashtag),其中訓練、開發和測試集的博文與不同的話題分開。我們使用皮爾遜相關性和MSE(均方誤差)作為我們所有實驗的度量標準。實驗結果如圖3所示:

4ba3f112-5e9c-11ed-8abf-dac502259ad0.png

圖3用于評估預測抱怨強度的Pearson系數的r和均方誤差(MSE)

05

分析實驗

抱怨和情緒之間的差異

我們注意到更強烈的抱怨似乎與消極詞匯有關。先前的研究也指出,抱怨可以被視為一個有影響的情感維度[2].我們展示在標準情緒數據集上訓練的模型在我們的抱怨強度預測任務中表現情況,如圖4所示,使用來自情緒模型的概率分數在我們的抱怨強度預測任務中表現出不錯的表現,這表明了抱怨和情緒之間的明確聯系。同時在我們的標注語料庫上訓練的模型優于情緒模型,這證明了我們的工作的必要性。

4bca3084-5e9c-11ed-8abf-dac502259ad0.png

圖4抱怨強度預測任務中情緒模型和抱怨模型的表現

抱怨可以加強情感分析任務

我們將抱怨分數作為一個附加的特性輸入被添加到模型中。從圖5中,我們觀察到具有抱怨特征的模型比原始模型表現得更好。表明一個簡單的附加組件可以提高非神經模型和傳統神經模型的情緒分類預測精度,分析抱怨可以有助于二元情感分析任務。

4be9dd80-5e9c-11ed-8abf-dac502259ad0.png

圖5二元情緒預測的結果(顯著性測試p-vlaue < 0.01, t-test)

06

跨語言分析

我們最新收集的抱怨強度數據集是中文的,而當前現有的數據集包含英文推文。這為我們提供了一個機會來了解在社交媒體上使用中文和英語的人在抱怨上的語言差異。

(1)直接和間接抱怨:中文博文中80%為間接抱怨;相反,英文推文91%的都是直接抱怨。

(2)策略:圖6顯示了不同語言的策略有所不同。我們發現,中文使用者更傾向于不補償策略,而英文使用者最常用的策略是補償策略。

4bf739bc-5e9c-11ed-8abf-dac502259ad0.png

圖6跨語言分析中不同策略所占百分比。

(3)諷刺:10%的中文數據包含諷刺,26%的英文數據包含諷刺。圖7展示了詞性分析,中文諷刺表達中名詞比例最高,其次是動詞;而在英文諷刺表達中,動詞最多,其次是名詞。此外,英語中的形容詞和副詞比中文的要多。

4c13166e-5e9c-11ed-8abf-dac502259ad0.png

圖7跨語言分析的POS標簽的百分比

07

預測博文流行度

我們設想將抱怨強度分數納入現有的社交媒體監控系統中,以提高它們的預測準確性,證明了來自我們的計算模型的抱怨強度得分可以幫助估計社交媒體上的帖子流行度。

我們遵循Szabo的流行度計算方法[5],使用早期流行度進行預測的基線,為了顯示我們的抱怨分數的有效性,我們添加了抱怨強度作為一個新的術語來估計最終的對數流行度,公式如下所示:

4c3c4ef8-5e9c-11ed-8abf-dac502259ad0.png

圖8顯示,我們結合了抱怨密度的方法優于基線方法。

4c5bd6b0-5e9c-11ed-8abf-dac502259ad0.png

圖8 RMSE和MAE的流行度預測

我們還展示了隨時間變化的單一話題下的流行度預測,如圖9所示。我們觀察到,增加了抱怨分數有助于更好地估計發布后的流行度,特別是在早期階段。這可能是因為抱怨可能會吸引用戶的注意力,以便參與討論,從而提高活動的流行度。

4c6e7ef0-5e9c-11ed-8abf-dac502259ad0.png

圖9比較實際的博文流行度和對單一話題的流行度預測

08

總結

我們提出了第一個測量文本抱怨強度的研究。我們構建了一個包含3103篇關于抱怨的中國微博文章的語料庫,并使用BWS方法標注了抱怨強度評分。然后,我們證明了我們的語料庫支持自動計算模型的發展,以準確的抱怨強度預測。此外,我們還研究了抱怨與情緒之間的聯系,并對中文和英文之間的抱怨表達進行了跨語言比較。我們最終證明,我們的抱怨強度得分有助于更好地估計社交媒體上的博文的流行度。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • SVR
    SVR
    +關注

    關注

    0

    文章

    7

    瀏覽量

    10994

原文標題:NAACL'22 Findings | 社交媒體上的抱怨強度分析

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RDMA設計37:RoCE v2 子系統模型設計

    主要交流設計思路,在本博客已給出相關160多篇,希望對初學者有用。注意這里只是拋磚引玉,切莫認為參考這就可以完成商用IP設計。 RoCE v2 子系統
    發表于 02-06 16:19

    電子發燒友榮獲電子工業出版社視點 “2025 年度卓越合作伙伴”

    近日,憑借過去年在書籍測評活動等方面的深度合作與卓越表現,電子發燒友榮膺電子工業出版社視點 “2025 年度卓越合作伙伴” 的殊榮,表彰電子發燒友在過去年中與
    發表于 02-06 11:58

    百度心大模型5.0正式版上線

    今天,在百度心Moment大會現場,心大模型5.0正式版上線。
    的頭像 發表于 01-23 16:48 ?1286次閱讀

    從數據到模型:如何預測細節距鍵合的剪切力?

    在微電子封裝領域,細節距鍵合工藝的開發與質量控制面臨著巨大挑戰。工程師們常常需要在缺乏大量破壞性測試的前提下,快速評估或預測鍵合點的剪切力性能。能否根據焊球的表觀尺寸,通過
    發表于 01-08 09:45

    百度心大模型5.0 Preview榮登LMArena文本榜國內第

    12月23日,LMArena大模型競技場發布最新排名,心新模型ERNIE-5.0-Preview-1203以1451分登上LMArena文本榜,排名國內第
    的頭像 發表于 12-23 15:02 ?537次閱讀

    模型賦能物資需求精準預測與采購系統:功能特點與平臺架構解析

    ? ? 大模型賦能物資需求預測與采購智能化:核心功能與價值解析 ? ?大模型賦能物資需求精準預測與采購系統通過深度整合多源數據、構建動態預測
    的頭像 發表于 12-16 11:54 ?296次閱讀

    世界模型是讓自動駕駛汽車理解世界還是預測未來?

    做了什么? 世界模型,其實是“內部表征+動態預測”的組合。簡單理解,世界模型就是將感知到的東西(圖像、點云、雷達、文本、動作歷史)壓縮成
    的頭像 發表于 12-16 09:27 ?867次閱讀
    世界<b class='flag-5'>模型</b>是讓自動駕駛汽車理解世界還是<b class='flag-5'>預測</b>未來?

    百度心大模型5.0-Preview文本能力國內第

    11月8日凌晨,LMArena大模型競技場最新排名顯示,心全新模型ERNIE-5.0-Preview-1022登上文本排行榜全球并列第二、中國第
    的頭像 發表于 11-11 17:15 ?1453次閱讀

    蜂鳥E203簡單分支預測的改進

    ): BHT中包含系列的雙模態預測器Bimodal Counter, 用他們預測分支指令(branch)是否需要跳轉(taken or not taken) 我們將有限
    發表于 10-24 07:45

    基于全局預測歷史的gshare分支預測器的實現細節

    GShare預測機制簡介 GShare預測機制作為種常用的分支預測機制,通過基于分支歷史和分支地址
    發表于 10-22 06:50

    讀懂大模型常見的10核心概念

    如今高效智能的AI大模型,正如雨后春筍般破土而出,人們對于AI大模型的學習與探索之路,也愈發寬闊平坦。雖然AI工具已不再陌生,但其中關于AIPrompt、大模型的吞吐量、蒸餾與量化、私有化知識庫等
    的頭像 發表于 09-22 17:02 ?1282次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>讀懂大<b class='flag-5'>模型</b>常見的10<b class='flag-5'>個</b>核心概念

    寧暢與與百度心大模型展開深度技術合作

    與部署。 憑借覆蓋訓練、推理、微調全流程的AI?服務器產品矩陣,寧暢幫助企業在大模型時代鍵打通算力與應用“任督二脈”,顯著縮短模型落地周期。 在已啟動的深度技術合作中,雙方將基于
    的頭像 發表于 07-07 16:26 ?871次閱讀

    模型推理顯存和計算量估計方法研究

    方法。 、引言 大模型推理是指在已知輸入數據的情況下,通過深度學習模型進行預測或分類的過程。然而,大模型的推理過程對顯存和
    發表于 07-03 19:43

    預測性維護實戰:如何通過數據模型實現故障預警?

    預測性維護正逐步成為企業降本增效的核心手段,通過數據驅動的故障預警邏輯框架,可以預測設備是否正常運行,提前預警并避免損失。案例中,通過振動傳感器采集數據,發現軸承故障,通過隨機森林模型建立
    的頭像 發表于 03-21 10:21 ?3014次閱讀
    <b class='flag-5'>預測</b>性維護實戰:如何通過數據<b class='flag-5'>模型</b>實現故障預警?

    《中國電機工程學報》網絡首發論文:基于數據驅動觀測器的永磁同步電機顯式模型預測直接速度控制

    步驟:構造預測模型。 考慮參數變化和外部擾動,表貼式 PMSM 的數 學方程為 (1) 其中,id、iq 和 ud、uq 分別為定子電流和電壓的 d、 q 軸分量;?和?e 分別為機械角速度和電
    發表于 03-07 15:07