国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自然語言處理BERT中CLS的效果如何?

深度學習自然語言處理 ? 來源:AI自然語言處理與知識圖譜 ? 作者:Elesdspline ? 2021-04-04 17:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

要說自然語言處理在18年最奪目閃耀的是什么事情,那當屬 BERT 刷新各個任務的記錄了,至今已經過去了近兩年半的時間,但其影響力未曾衰減,無論學術界還是工業界,很多的工作與部署都圍繞其展開,對很多的下游任務都有舉足輕重的作用,真的是里程碑啊。

相信大家都有過BERT、ALBERT等預訓練語言模型應用在自己任務上的實踐經歷,可能是情感分析、分類、命名實體識別、閱讀理解、相似度計算等等,使用的方法也無非是在自己任務上 fine-tune 或者作為預訓練Embedding,使用的預訓練模型大多是公開的,大佬們(財大氣粗、資源無數)訓練好的。(有錢真好)

在用預訓練模型的時候,根據任務的不同,用到信息也不同,有的需要是詞表示,比如命名實體識別、詞性標注等任務,有的需要的是句子表示,比如分類、句子語意匹配等。這里我要說的句子表示這一類的任務,大家經常會用到的 [CLS] 特征信息作為句子向量表示,CLS 作為 BERT/ALBERT序列信息中特殊的一個存在,在最開始設計模型的時候便考慮將其作為后續文本分類的表示,然而直接使用 CLS 的效果真的會滿足我們的預期嘛?相信大家在實踐的過程中都有所體會~,另外 ALBERT 和 BERT 在下游任務應用上面孰好孰壞,是否有一個定論?

我最近看到了一篇 Arxiv 的文章,題目是 《Evaluation of BERT and ALBERT Sentence Embedding Performance on Downstream NLP Tasks》,這篇文章在 BERT/ALBERT 提取信息作為句子信息表示應用在下游任務,對其效果進行了評測,或許會解答我們實踐中的疑惑,也或者會給我們一些預訓練模型在下游任務應用的啟發,讓我們來看下~

評測對比

有一系列的對比實驗,來看在下游任務上面的效果~

[CLS] embeddings

CLS 通過 Self-Attention 機制來獲取句子級別的信息表示,在不同的任務上 Fine-tune 之后,CLS 會捕捉特定環境下的上下文信息表示。

Pooled embeddings

將文本中的所有詞做 Avg-pooling 或者 max-pooling。

Sentence-X(SBERT/ALBERT)

BERT 在語義相似度任務上面也取得了很不錯的效果,然后其內部的結構在計算過程中會導致非常耗時,不適合做語義相似度匹配任務,特別是在工業界,BERT 的耗時無法滿足上線的需要。針對這個問題,有人提出 Sentence-BERT,采用孿生網絡模型框架,將不同的句子輸入到參數共享的兩個BERT模型中,獲取句子信息表示,用于語義相似度計算,最終相比BERT效率大大提升,滿足工業界線上需要。SBERT 從65小時降到5秒,具體詳見參考資料2。

99cb1f6c-88e9-11eb-8b86-12bb97331649.png

CNN-SBERT/SALBERT

在上圖中,SBERT 采用 Avg-pooling 獲取句子向量表示,本文將其替換成 CNN 網絡結構獲取句子向量表示。

99fe6886-88e9-11eb-8b86-12bb97331649.png

結果分析

評測任務

STS:Semantic Textual Similarity

NLI:Natural Language Inference

評測指標

Pearson and Spearman’s rank coefficients(皮爾遜和斯皮爾曼相關系數)

評測數據

Semantic Textual Similarity benchmark(STSb)

Multi-Genre Natural Language Inference(MultiNLI)

Stanford Natural Language Inference(SNLI)

上面列出來相關的評測任務、評測指標以及評測所用到的數據,下面先給出一張結果表,然后再詳細分析~

9a3609a8-88e9-11eb-8b86-12bb97331649.png

詳細分析

微調有效:這個是符合我們認知的,肯定是微調的效果要好。

CLS 效果:CLS 的效果要遜色很多,無論是在微調上面,還是不微調上面,CLS的效果都要遠遜色于平均池化操作或者其他方法。

不同方法效果:總體上來看,CNN-BERT > SBERT > Avg pooling > CLS

BERT 與 ALBERT:從上圖中大概能夠看出,不微調的情況下,兩者的效果差不多,但是微調之后,ALBERT的效果要比BERT差很多,僅僅在STSb上微調的時候,CLS 和平均池化的方法要好于BERT。

CNN的效果

從上圖來看,最好的結果是采用了 CNN 網絡結構,說明 CNN 起到了正向的作用,仔細觀察發現,CNN 對 ALBERT 的改進要遠大于對 BERT 的改善提高。ALBERT 由于內部參數共享,可能存在不穩定性,CNN 網絡結構或許可以減緩這種不穩定性。

下圖也進行了一些對比,在幾個不同的數據集上驗證 CNN 的有效性,從最終的 Avg 結果來看,CNN 網絡結構對 ALBERT 有改善提升。

9a91a5e2-88e9-11eb-8b86-12bb97331649.png

以上是根據實驗結果進行的簡單分析,其中有一些結論和對比可以在我們日常的實踐中借鑒并嘗試,說不定會有不錯的效果~

原文標題:【BERT】BERT中CLS效果真的好嘛?這篇文章告訴你答案

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265276
  • 自然語言
    +關注

    關注

    1

    文章

    292

    瀏覽量

    13986

原文標題:【BERT】BERT中CLS效果真的好嘛?這篇文章告訴你答案

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個分支,它會教計算機如何理解口頭和書面形式的人類語言自然語言處理將計算
    的頭像 發表于 01-29 14:01 ?357次閱讀
    <b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>NLP的概念和工作原理

    Neway電機方案在實際應用效果如何?

    Neway電機方案在實際應用效果如何?Neway電機方案是深圳市立維創展科技有限公司推出的電機驅動與控制系統解決方案,具有高穩定性、高性價比、小型化等特點,Neway電機方案在實際應用效果
    發表于 12-03 09:23

    云知聲論文入選自然語言處理頂會EMNLP 2025

    近日,自然語言處理(NLP)領域國際權威會議 ——2025 年計算語言學與自然語言處理國際會議(EMNLP 2025)公布論文錄用結果,云知
    的頭像 發表于 11-10 17:30 ?800次閱讀
    云知聲論文入選<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>頂會EMNLP 2025

    格靈深瞳突破文本人物檢索技術難題

    格靈深瞳參與研究的GA-DMS框架,為攻破上述技術難題提供了全新解決方案。研究團隊通過數據構建和模型架構的協同改進,推動CLIP在人物表征學習的應用,顯著提升了基于文本的人物檢索效果。該成果已入選EMNLP 2025 主會(自然語言
    的頭像 發表于 09-28 09:42 ?628次閱讀
    格靈深瞳突破文本人物檢索技術難題

    LCD屏幕無法正確顯示效果如何解決?

    : 4.通過修改link文件將LCD緩存數組定義到SDRAM里面去: 5.在main線程初始化和寫一個小方塊函數: 6.下載后效果不理想。 這塊驅動是正點的官方例程,在裸機的時候是沒有問題
    發表于 09-25 08:16

    HarmonyOSAI編程自然語言代碼生成

    安裝CodeGenie后,在下方對話框內,輸入代碼需求描述,將根據描述智能生成代碼,生成內容可一鍵復制或一鍵插入至編輯區當前光標位置。 提問示例 使用ArkTs語言寫一段代碼,在頁面中間部分
    發表于 09-05 16:58

    北斗生態環境監測站:讀懂自然的 “語言

    北斗生態環境監測站:讀懂自然的 “語言”柏峰【BF-BDQX】當生態監測遇上北斗技術,一場關于 “精準守護自然” 的變革正悄然發生 ——北斗生態環境監測站以北斗定位導航系統為核心
    的頭像 發表于 09-04 10:59 ?502次閱讀
    北斗生態環境監測站:讀懂<b class='flag-5'>自然</b>的 “<b class='flag-5'>語言</b>”

    【HZ-T536開發板免費體驗】5- 無需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開發板上搭建 MCP 服務器,自然語言輕松控板

    引言:為什么需要 “自然語言控板”? 痛點引入 :嵌入式開發,開發者常需通過 SSH 等工具登錄開發板,手動輸入復雜的 Linux 命令(如ls -l、gpio readall、ifconfig等
    發表于 08-23 13:10

    超聲波清洗設備的清洗效果如何?

    超聲波清洗設備是一種常用于清洗各種物體的技術,它通過超聲波振蕩產生的微小氣泡在液體破裂的過程來產生高能量的沖擊波,這些沖擊波可以有效地去除表面和細微裂縫的污垢、油脂、污染物和雜質。超聲波清洗設備
    的頭像 發表于 06-06 16:04 ?852次閱讀
    超聲波清洗設備的清洗<b class='flag-5'>效果如</b>何?

    人工智能浪潮下,制造企業如何借力DeepSeek實現數字化轉型?

    DeepSeek,憑借其強大的深度學習和自然語言處理能力,能夠理解復雜問題并提供精準解決方案。它不僅能夠作為學習、工作、生活的助手,滿足用戶在不同場景下的需求,更能在制造業中發揮重要作用。通過自然語言交互,用戶無需學習復雜的操作
    的頭像 發表于 05-29 16:17 ?649次閱讀

    云知聲四篇論文入選自然語言處理頂會ACL 2025

    近日,第63屆國際計算語言學年會ACL 2025(Annual Meeting of the Association for Computational Linguistics,簡稱ACL)論文接收
    的頭像 發表于 05-26 14:15 ?1310次閱讀
    云知聲四篇論文入選<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>頂會ACL 2025

    自然語言處理的發展歷程和應用場景

    你是否曾經對著手機說:“嘿,Siri,今天天氣怎么樣?”或者在出國旅行時,打開翻譯軟件,對著菜單說:“請把這道菜翻譯成英文”。
    的頭像 發表于 04-17 11:40 ?1327次閱讀

    自然語言提示原型在英特爾Vision大會上首次亮相

    在英特爾Vision大會上,Network Optix首次展示了自然語言提示原型,該方案將重新定義視頻管理,為各行各業由AI驅動的洞察和效率提速。
    的頭像 發表于 04-09 09:30 ?959次閱讀

    ?VLM(視覺語言模型)?詳細解析

    視覺語言模型(Visual Language Model, VLM)是一種結合視覺(圖像/視頻)和語言(文本)處理能力的多模態人工智能模型,能夠理解并生成與視覺內容相關的自然語言。以下
    的頭像 發表于 03-17 15:32 ?8823次閱讀
    ?VLM(視覺<b class='flag-5'>語言</b>模型)?詳細解析

    智慧路燈的照明效果如何?

    引言 在智慧城市建設的進程,叁仟智慧路燈已逐漸成為城市道路照明的主力軍。其照明效果不僅關系到市民夜間出行的安全與便捷,更對城市的整體形象和生活品質有著深遠影響。相較于傳統路燈,叁仟智慧路燈借助
    的頭像 發表于 03-16 16:10 ?837次閱讀