国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何簡單粗暴的提升NER效果?

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:船長尼莫 ? 2022-12-12 14:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在NLP的基礎任務中,NER無疑很難做,但是做好了,會提升下游的很多效果。那么如何提升NER的效果呢?數據增強無疑是一種簡單粗暴的方式。船長這次帶著大家簡單過一下,本文無公式!

ca888e24-79d2-11ed-8abf-dac502259ad0.png

首先我們的著重考慮對象是有詞庫的,在工業界詞庫是必備的,沒有標注詞庫,這個NER的任務可能會做的很不好。我們從以下的三種數據增強trick來逐步介紹。

實體替換

如果我們有一個訓練數據集,比方說一個case:“海底撈的主要食物是火鍋”,在NER的任務中,標注成為“{海底撈^飯店}的主要食物是{火鍋^食物}”,其中海底撈的實體為飯店,而火鍋的為食物。

那么為了擴大我們的訓練數據集,我們會隨機的對同類型的實體進行替換,例如“海底撈”替換成為“肯德基”,也即“肯德基的主要食物是火鍋”。有意思的地方來了,很明顯我們都知道肯德基是沒有火鍋的,那么這樣造的case會有問題嗎?答案是從常識的角度是有問題的,所以我們盡量要挑出和火鍋相關的實體,利用知識圖譜的方式,搭建出更合理的訓練集。

邊界噪聲

比方說文本“這家飯店的爆品是火鍋啦”,結果模型把火鍋啦整體識別成為食物實體,那就很不對勁了。在這種情況下,屬于NER的一個悠久遺留問題,邊界預測問題,NER很難識別到實體的真正邊界,解決這種的方法也是利用人工造的一些噪聲。

比較簡單的方式,是可以從字表里面隨機的抽樣字,再隨機的加到邊界處。變成,讓模型自主的去學習到實體的邊界,這種方式簡單但是效果一般,為什么這么講?因為這種隨機的采樣對于模型來說,很好學習,我們應該嘗試去構造再難一點的數據。

這家飯店的爆品是火鍋嘿

比較可行的方式,是在模版數據中利用N-Gram挖掘到噪聲詞語/字,再利用頻率的高低構建出現的概率,以這種概率進行替換,舉例來說,飯店類的模版有很多是圍繞著詞語“食物”展開,那么這時候我們可以把“食物”插入到實體的邊界,成為:

這家飯店的爆品是火鍋食物

對于模型來講,再難一點的方式,可以從訓練數據中,挖掘到和火鍋相關的噪聲,再把它插入進去。例如,根據詞語火鍋進行展開,利用5-Gram搜索到附近的詞語,找到一些和火鍋相關,但是不是強相關的詞語,比方說辣椒,那這時候就會形成:

這家飯店的爆品是火鍋辣椒

不得不說,這種文本對于機器來講已經很難識別了,但是這種方式的時間開銷很大,需要提前離線找到和每個實體相關的詞語,再進行噪聲的插入。

模版構造樣本

什么意思呢?我們先利用實體,在線上的日志中挖掘到很多模版,再利用這批模版隨機的進行填充,形成最后的訓練數據,這批訓練的數據量會很大,但是樣本的質量是一般的。例如我們可以對模版“這家飯店的爆品是{食物}”進行隨機的食物實體填充,成為:

這家飯店的爆品是榴蓮

但是當一個模版有多個實體槽位的時候,隨機的進行實體填充往往有很大的問題,比方說模版“這家{飯店}的爆品是{食物}”,如果我們填充成為“這家海底撈的爆品是榴蓮”,雖然對于NER的任務來講沒有太大的問題,但是從常識角度來說,未免也太差了些。

這種情況下,我們需要批判性的思考,這種數據是否有利于提升我線上的效果,如果線上的要求并不包含常識,那這就是個好模型,反之亦然。我們也可以根據知識圖譜來進行填充,增加常識信息。

cab11268-79d2-11ed-8abf-dac502259ad0.png

這次船長主要帶大家過了一些簡單高效的NER數據增強Trick,有什么問題就寫下你的疑惑,我們討論一下~

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26194
  • NER
    NER
    +關注

    關注

    0

    文章

    7

    瀏覽量

    6460
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23280

原文標題:如何簡單粗暴的提升NER效果?一文告訴你如何用詞庫來做NER數據增強

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    簡單高效的鴻蒙編譯提速技巧

    在鴻蒙應用開發中編譯構建是開發者最頻繁的操作,每一次編譯提速都能顯著提升項目整體開發效率。本次分享幾個簡單卻高效的鴻蒙編譯提速技巧,從編譯配置、構建方式等維度進行優化,讓你的開發流程更快捷高效。 1
    的頭像 發表于 03-04 16:09 ?43次閱讀
    <b class='flag-5'>簡單</b>高效的鴻蒙編譯提速技巧

    PID調參實用方法

    控制算法的情況下,我們可以通過簡單的閾值判斷法來控制溫度,一個if判斷語句,當采集到的溫度大于100時,單片機控制加熱頭關閉,當采集的溫度小于100度時,單片機則控制加熱頭開啟,簡單粗暴,但這樣的控制
    發表于 11-28 07:17

    浮思特 | NMB散熱風扇靜音如何?卓越靜音效果提升散熱性能

    隨著現代電子設備的不斷發展,散熱風扇在保證設備穩定運行方面的作用愈發重要。尤其是在高性能計算、工業設備及服務器等領域,如何在確保散熱效果的同時降低噪音,成為了設計中的關鍵問題。作為全球知名的散熱方案
    的頭像 發表于 11-06 14:15 ?564次閱讀
    浮思特 | NMB散熱風扇靜音如何?卓越靜音<b class='flag-5'>效果</b><b class='flag-5'>提升</b>散熱性能

    5大X-ray影像優化技巧提升工業檢測效果

    檢測效果,成為眾多行業內人士關注的重點。通過本篇文章,我們將探討五大技巧,幫助您更有效地提高X-ray影像的質量,解決用戶痛點,并提升產品質量。 1. 選擇合適的X-ray設備 選擇適合特定工業需求的X-ray設備至關重要。目前市場上存在多種型號
    的頭像 發表于 10-10 11:40 ?536次閱讀

    tSGTools--表盤控件--輕松實現儀表盤顯示效果

    使用TOPWAY廠家的SGTools開發, 沒有寫任何代碼,很簡單實現了儀表盤的顯示效果。 圖片屏幕7寸: HMT070ATA-9C
    發表于 09-15 15:41

    機器人看點:宇樹新專利可提升機器人表演效果 蔚來資本入股具身智能公司原力靈機 美信科技新設機器人制

    給大家帶來一些機器人相關訊息: 宇樹新專利可提升機器人表演效果 據企查查APP信息顯示,宇樹科技股份有限公司“一種基于數字孿生的機器人運動控制方法和電子設備”專利公布;該新專利可提升機器人表演
    的頭像 發表于 09-01 16:55 ?1986次閱讀

    如何評估通信協議優化對數據傳輸效率的提升效果?

    評估通信協議優化對數據傳輸效率的提升效果,核心邏輯是 “控制變量 + 多維度量化對比”—— 即通過定義明確的評估目標、構建一致的測試環境、選取關鍵效率指標,對比優化前后的協議表現,最終驗證優化是否達到預期(如降低延遲、提升吞吐量
    的頭像 發表于 08-29 17:52 ?1195次閱讀

    根據標題利用API優化電商搜索功能:提升轉化率

    ? 在電商平臺中,搜索功能是用戶發現商品的核心入口。一個高效的搜索系統不僅能提升用戶體驗,還能顯著提高轉化率——即用戶從搜索到實際購買的比率。然而,傳統搜索往往依賴簡單的關鍵詞匹配,導致結果不相關
    的頭像 發表于 07-21 16:23 ?576次閱讀
    根據標題利用API優化電商搜索功能:<b class='flag-5'>提升</b>轉化率

    5個大型超聲波清洗機使用技巧,提升清洗效果

    的日益重視。在使用大型超聲波清洗機時,如何最大化清洗效果,成為了眾多用戶關注的重點。本文將為您介紹5個實用技巧,幫助您提升超聲波清洗機的清洗效果。1.選擇合適的清洗
    的頭像 發表于 07-17 16:22 ?860次閱讀
    5個大型超聲波清洗機使用技巧,<b class='flag-5'>提升</b>清洗<b class='flag-5'>效果</b>

    5個關鍵技巧,提升超聲波真空清洗機使用效果

    充分發揮其清洗優勢。結合行業最新發展趨勢和用戶反饋,本文將深入探討提升超聲波真空清洗機使用效果的5個關鍵技巧,幫助您解決清洗難題,提高生產效率與產品質量。無論您是初次
    的頭像 發表于 07-15 17:33 ?708次閱讀
    5個關鍵技巧,<b class='flag-5'>提升</b>超聲波真空清洗機使用<b class='flag-5'>效果</b>

    探索吉他音色與效果器的奇妙世界(3)- 時延和哇音效果

    本文是第二屆電力電子科普征文大賽的獲獎作品,來自上海科技大學李晨曦的投稿。時延類效果器如果失真類效果器是拿信號的幅值開刀,那么時延類效果器則是在信號的時域特性上做文章。根據原理的不同,可以將時延類
    的頭像 發表于 06-14 10:00 ?1528次閱讀
    探索吉他音色與<b class='flag-5'>效果</b>器的奇妙世界(3)- 時延和哇音<b class='flag-5'>效果</b>器

    探索吉他音色與效果器的奇妙世界(2)- 失真類效果

    的音量下得到失真音色呢?隨著半導體技術的發展,失真類效果器應運而生。在介紹失真類效果器之前,需要先簡單介紹一下二極管削波電路。二極管削波電路通常由一個或多個二極管、
    的頭像 發表于 06-07 08:34 ?1459次閱讀
    探索吉他音色與<b class='flag-5'>效果</b>器的奇妙世界(2)- 失真類<b class='flag-5'>效果</b>器

    效果器的基礎知識

    電子發燒友網站提供《效果器的基礎知識.doc》資料免費下載
    發表于 03-26 14:30 ?7次下載

    智慧路燈的照明效果如何?

    先進技術,在照明性能上實現了顯著提升。深入了解叁仟智慧路燈的照明效果,對于評估其在智慧城市照明系統中的價值具有重要意義。接下來,讓我們一同探究叁仟智慧路燈卓越的照明表現。 ? ?一、優質燈具奠定照明基礎 叁仟智慧路
    的頭像 發表于 03-16 16:10 ?852次閱讀

    不到千元輕松入手!華為云 Flexus 數字人制作簡單、效果極佳

    在數字化浪潮的席卷下,越來越多的數字人如雨后春筍般出現在大眾視野中,數字人熱度持續提升。然而,在這炙手可熱的背后,是數字人便捷的制作流程和逼真效果二者不可兼得的矛盾,這就直接將廣大中小企業隔絕在數
    的頭像 發表于 03-10 11:05 ?1300次閱讀
    不到千元輕松入手!華為云 Flexus 數字人制作<b class='flag-5'>簡單</b>、<b class='flag-5'>效果</b>極佳