国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

針對電商場景調優BERT的論文

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2020-09-25 16:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近跟幾個做電商NLP的朋友們聊天,有不少收獲。我之前從來沒想過【搜索】在電商里的地位是如此重要,可能GMV的50%以上都是從搜索來的。巨大的經濟價值也極大地推動了技術的發展,他們的工作做得很細致,畢竟一個百分點的點擊率后購買率提升也許對應的就是幾百億的成交額。

其實之前做的汽車領域NLP工作跟電商有很多相似的地方,場景先驗都非常重要。直接使用開放域語料預訓練的語言模型效果并不好。我們也嘗試過一些方法,例如用本領域語料訓練語言模型,結合一些詞庫詞典等等。今天介紹最近看到的一篇針對電商場景調優BERT的論文《E-BERT: Adapting BERT to E-commerce with Adaptive Hybrid Masking and Neighbor Product Reconstruction》[1],其中的一些方法應該對細分領域NLP有一些啟發。

方法

論文的創新方法主要有兩個:Adaptive Hybrid Masking(AHM,自適應混合掩碼)和Neighbor Product Reconstruction(NPR,相似商品重構)。

E-BERT總覽

AHM

第一個方法AHM其實是對已有掩碼方式的改進。原始版本的BERT采用的是隨機mask,這個大家應該都比較清楚。這種mask方式針對的是token,而眾所周知token是由單詞通過wordpiece tokenizer分割而來。所以這種方式遮蓋住的可能是單詞的一個部分,學習這種類似看三個字母猜剩下四個字母的任務不是很符合大家的直覺。隨后就誕生了更加符合人類認知的Whole Word Masking,這個方法就是說要遮就遮整個詞。這里用一個網上的例子幫大家理解

InputText:themanjumpedup,puthisbasketonphil##am##mon'shead OriginalMaskedInput:[MASK]man[MASK]up,puthis[MASK]onphil[MASK]##mon'shead WholeWordMaskedInput:theman[MASK]up,puthisbasketon[MASK][MASK][MASK]'shead

philammon是一個詞,他會被tokenizer分解成三個token,這時就體現了普通mask和WWM的區別。

怎么繼續改進遮蓋方法呢,一個比較直觀的方向是繼續提高遮蓋的整體性。前面是從token走到了word,可以繼續往前走一步到phrase。這個方向其實之前有人做了,比如SpanBert[2]隨機mask一小段,ERNIE[3]mask實體等等。這篇論文做了兩個工作,一個是進一步提升遮蓋phrase的質量,用了一種叫AutoPhrase[4]的方法來構建高質量的電商短語集合;第二個是設計了一套自適應機制,讓模型訓練在詞語遮蓋和短語遮蓋間切換,兩個方面合在一起就叫做AHM。

AHM總體的流程如下圖所示。對于一句輸入,首先用兩種方式進行mask,左邊是常規word mask,右邊是phrase mask,然后輸入到BERT,分別得到MLM的loss,Lw和Lp。然后用一個函數f,根據兩個loss計算變量,跟預設的超參數進行比較,如果就用word masking,反之就用phrase masking。的計算其實可以有很多方法,論文也沒有在這塊做對比實驗,我也就不展開,大家有興趣可以去看原文。

AHM總體流程

NPR

NPR是個比較有意思的部分,直觀的解釋是希望能通過一個商品重建出另一個相似商品的隱空間表示。具體的做法是把兩個商品a和b的文本內容送進Bert,得到各自的embedding矩陣;然后對這兩個句子做交叉注意力,得到注意力矩陣,然后用注意力矩陣加權a的embedding得到重構后的b的embedding,反過來也從b重構a。得到重構后的embedding后再和原embedding計算距離作為loss,論文采用的是歐氏距離。只做相似商品重構還不夠,論文還引入了不相似商品(隨機采樣)作為負樣本,采用triplet loss來計算最終的重構損失。

NPR示意圖

效果

論文的實驗和結果比較部分做的比較全面。

先介紹一下對照實驗涉及的模型。baseline是裸BERT(BERT Raw),用電商數據finetune過的Bert外加SpanBERT作為對照組,finetune有兩種方法,分別是word masking的Bert和phrase masking的Bert-NP。實驗組是各種配置的E-Bert,包括只使用phrase masking的E-Bert-DP,使用AHM的E-Bert-AHM和AHM+NPR的E-Bert。

評估效果使用了4個電商場景場景的下游任務,Review-based Question Answering(基于評論的問答),Review Aspect Extraction(評論方面抽取?),Review Aspect Sentiment Classification(評論情感分類)和Product Classification(商品類別分類)。

不同模型在不同任務上的結果如下圖

模型結果比較

從結果可以看出E-BERT在各種任務上都大幅領先裸BERT,甚至也大幅領先基于領域語料預訓練過的BERT。文章的方法其實可以在任何的垂直領域中使用,可以說相當的實用。

最近一個討論比較多的問題是在BERT時代,NLP算法工程師的價值是什么?我想這個結果可以從一個側面給答案,知道如何在模型中引入行業先驗知識是可以大大提高模型在特定場景的表現的,即使如BERT這樣自身很強的超級模型也不例外。

參考資料

[1]

E-BERT: Adapting BERT to E-commerce with Adaptive Hybrid Masking and Neighbor Product Reconstruction: https://arxiv.org/pdf/2009.02835

[2]

SpanBERT: Improving Pre-training by Representing and Predicting Spans: http://arxiv.org/abs/1907.10529

[3]

ERNIE: Enhanced Language Representation with Informative Entities: http://arxiv.org/abs/1905.07129

[4]

AutoPhrase: https://github.com/shangjingbo1226/AutoPhrase

責任編輯:xj

原文標題:E-BERT: 電商領域語言模型優化實踐

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    571

    瀏覽量

    11319
  • AHM
    AHM
    +關注

    關注

    0

    文章

    2

    瀏覽量

    7605
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23281

原文標題:E-BERT: 電商領域語言模型優化實踐

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    解鎖Zephyr實時操作系統深度調能力

    可以說,代碼編寫只是項目開發的起點,而隨之而來的資源分析與性能調才是確保系統穩定可靠的關鍵環節。
    的頭像 發表于 01-30 09:16 ?5667次閱讀

    Linux系統內核參數調實戰指南

    Linux 內核參數調是系統性能優化的核心環節。隨著云原生架構的普及和硬件性能的飛速提升,默認的內核參數配置往往無法充分發揮系統潛力。在高并發 Web 服務、大數據處理、容器化部署等場景下,合理的內核參數調整可帶來 30%-2
    的頭像 發表于 01-28 14:27 ?446次閱讀

    性能測試調實戰與探索(存儲模型優化+調用鏈路分析)

    分析、流量分析、壓測實施和剖解調優等主要環節中,引發對于系統能力底盤夯實和測試策略改進的諸多思考。 在性能測試階段,剖析系統能力實現及調方案,探索更優解及性能測試策略的提升空間。 ? ? 二、熱點數據存儲模型壓測
    的頭像 發表于 01-12 14:46 ?1484次閱讀
    性能測試<b class='flag-5'>調</b><b class='flag-5'>優</b>實戰與探索(存儲模型優化+調用鏈路分析)

    實戰RK3568性能調:如何利用迅為資料壓榨NPU潛能-在Android系統中使用NPU

    《實戰RK3568性能調:如何利用迅為資料壓榨NPU潛能-在Android系統中使用NPU》
    的頭像 發表于 11-07 13:42 ?666次閱讀
    實戰RK3568性能<b class='flag-5'>調</b><b class='flag-5'>優</b>:如何利用迅為資料壓榨NPU潛能-在Android系統中使用NPU

    破解工業商痛點:vipmro 商品詳情接口技術方案與性能調指南

    vipmro工業MRO商品詳情接口針對參數嵌套、大文件加載、批量查詢等痛點,構建多維參數解析、分級緩存、標準化錯誤三大引擎,實現高并發下毫秒級響應,助力商接口高效適配工業品復雜場景
    的頭像 發表于 10-29 17:32 ?213次閱讀

    天翼云基于開源歐拉的智能調實踐

    在數字經濟加速滲透的當下,操作系統作為底層基礎設施的核心,其穩定性與適配性直接關系到行業數字化進程。隨著CentOS停止維護,國內企業面臨操作系統遷移的緊迫需求,天翼云基于開源歐拉研發的CTyunOS,不僅成為這一遷移浪潮中的關鍵解決方案,更通過智能調實踐,為數字經濟筑
    的頭像 發表于 10-17 11:04 ?677次閱讀

    HarmonyOSAI編程智慧調

    DevEco Studio提供智慧調能力,支持通過自然語言交互,分析并解釋當前實例或項目中存在的性能問題,幫助開發者快速定位影響性能的具體原因。該功能從DevEco Studio 6.0.0
    發表于 09-01 15:15

    HarmonyOS AI輔助編程工具(CodeGenie)智慧調

    DevEco Studio提供智慧調能力,支持通過自然語言交互,分析并解釋當前實例或項目中存在的性能問題,幫助開發者快速定位影響性能的具體原因。該功能從DevEco Studio 6.0.0
    發表于 08-14 11:12

    Linux網絡性能調方案

    在當今高并發、大流量的互聯網環境下,網絡性能往往成為系統的瓶頸。作為一名資深運維工程師,我在生產環境中遇到過無數次因為TCP/IP參數配置不當導致的性能問題。今天分享一套完整的Linux網絡性能調方案,幫助大家徹底解決網絡性能瓶頸。
    的頭像 發表于 08-06 18:01 ?1334次閱讀

    Linux內核參數調方案

    在高并發微服務環境中,網絡性能往往成為K8s集群的瓶頸。本文將深入探討如何通過精細化的Linux內核參數調,讓你的K8s節點網絡性能提升30%以上。
    的頭像 發表于 08-06 17:50 ?958次閱讀

    Linux系統性能調方案

    關鍵要點預覽:本文將深入解析Linux系統性能瓶頸的根本原因,提供可直接落地的調方案,讓你的系統性能提升30-50%!
    的頭像 發表于 08-06 17:49 ?884次閱讀

    MySQL配置調技巧

    上個月,我們公司的核心業務系統突然出現大面積超時,用戶投訴電話不斷。經過緊急排查,發現是MySQL服務器CPU飆升到99%,大量慢查詢堆積。通過一系列配置調和SQL優化,最終在30分鐘內恢復了服務。
    的頭像 發表于 07-31 10:27 ?621次閱讀

    Nginx在企業環境中的調策略

    Nginx作為現代互聯網架構中最重要的Web服務器和反向代理服務器,其性能調對企業級應用的穩定性和效率至關重要。本指南將從運維實踐角度出發,詳細介紹Nginx在企業環境中的各種調
    的頭像 發表于 07-14 11:13 ?636次閱讀

    手把手教你如何調Linux網絡參數

    在高并發網絡服務場景中,Linux內核的默認網絡參數往往無法滿足需求,導致性能瓶頸、連接超時甚至服務崩潰。本文基于真實案例分析,從參數解讀、問題診斷到優化實踐,手把手教你如何調Linux網絡參數,支撐百萬級并發連接。
    的頭像 發表于 05-29 09:21 ?972次閱讀

    HJ55系列三相變頻電源 電壓可分調可統調

    的詳細說明:1.分調功能定義:分調功能允許用戶對三相電源的每一相電壓和頻率進行獨立調節。應用場景:適用于需要精確控制每一相電壓和頻率的場景,例如三相不平衡負載測試、
    的頭像 發表于 03-26 11:55 ?2599次閱讀
    HJ55系列三相變頻電源 電壓可分<b class='flag-5'>調</b>可統<b class='flag-5'>調</b>