国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于改進文本分類的特征投影

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2021-03-05 15:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

TL; DR

在情感分類中,一些good features,比如”good“、”nice“表示積極,”bad“、“terrible”表示消極。但是,還有許多common features,比如voice、screen就沒有特別的情感性。

盡管深度學習擁有強大的representation learning(表征學習,即同一個數據用不同的表示形式)。但我們認為還有可以改進的地方。

在本文中,我們提出了一種新的角度來進一步改善這種表示學習,即特征投影(feature projection):將現有特征投影到common特征的正交空間中。

所得的投影向量垂直于common特征,能更好的進行分類。

將該方法用于改進基于CNN,RNN,Transformer和Bert的文本分類模型,獲得更好的結果。

網絡結構

Feature Purification Network 特征凈化網絡

模型分為兩部分:

projection network (P-net);

common feature learning network (C-net)

P-net:計算凈化的向量特征,通過將學習到的輸入文本的信息向量投影到更具區分性的語義空間中來消除共同特征的影響。

C-net:提取common features。

P-net由四部分組成:

輸入層X

特征提取器Fp

正交投影層(OPL,Orthogonal Projection Layer)

分類層Cp

C-net也由四部分組成:

輸入層X

特征提取器Fc(Fp和Fc的參數不共享)

漸變反向層(GRL,Gradient Reverse Layer)

分類層Cc

技術的關鍵思想如下:

P-Net中特征向量fp投影到C-Net的fc的正交方向上。也就是說,將fp(從輸入文檔中提取的完整信息)投影到更具區分性的語義空間中,以進行最終分類。

圖2:正交投影層的工作方式。這里的示例是在二維空間中。

fp表示傳統特征向量;

fc表示公共特征向量;

fp?是投影特征向量;

fp~是最終的正交投影特征向量。

我們首先將傳統特征向量fp投影到共同特征向量fc,得到fp?。

等式9中的fp?即表示對共同特征向量fc的約束。

再將fp投影到fp-fp*得到fp~

也就是說:通過將輸入的傳統特征向量fp投影到公共特征向量fc來限制公共特征向量的模,因此新的公共特征向量fp*的語義信息僅包含xi的公共語義信息。

這使得最終的純化特征向量fp~來自傳統特征向量fp,而不是與公共特征向量fc正交的任何平面中的任何向量。

最后,我們使用純化的特征向fp~進行分類。

Experiments實驗

1 實驗使用數據集

2 Baselines模型

用LSTM、CNN、Transformer和BERT等基準模型進行對比實驗,已驗證特征投射的有效性。

3 實施細節

首先,我們將實驗中的所有詞嵌入隨機初始化為200維向量,然后在訓練過程中進行修改(Bert除外)。對于每種類型的特征提取器,我們具有以下配置:

對于RNN模型,使用兩層LSTM進行特征提取,每層的hidden state=256;

對于CNN模型,為了獲得更多的細粒度特征,我們分別使用了[2,3,4,5,6]的濾波器大小,每個濾波器都有100個特征圖。

對于Transformer的模型,我們使用Transformer的編碼器作為特征提取器,使用單頭和3個block。

對于Bert模型,我們微調了預訓練的基于Bert的參數。這些設置與FP-Net中的基線完全相同。

在C-net模塊的訓練中,我們以0.9為初始學習率的隨機梯度和隨后的退火學習率(Ganin and Lempitsky,2014)。

其中,訓練進度p從0線性變化為1,l0 = 0.01,α= 10和β= 0.75。在GRL中,超參數λ為[0.05,0.1,0.2,0.4,0.8,1.0]。

4 實驗結果

5 消融實驗與分析

消融實驗類似于“控制變量法”。假設在某任務中,使用了A,B,C,取得了不錯的效果,但是這個時候你并不知道效果是由A,B,C中哪一個起的作用,于是你保留A,B,移除C進行實驗來看一下C在整個任務中所起的作用。

結論

在本文中,我們提出了一種新的特征凈化網絡(FP-Net),以改進文本分類的表示;

該方法基于特征投影。所提出的模型使用兩個子網,一個用于識別對分類沒有區別的共同特征common features,另一個用于將傳統特征投射到共同特征的正交方向的特征投影;

我們當前的方法僅用于傳統文本分類方法,例如LSTM,CNN和Transformer。在未來的工作中,我們將考慮將其擴展到基于圖的方法(例如用于圖形數據的GCN),以及擴展到基于生成的方法(例如用于對抗性學習的GAN)。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 文本分類
    +關注

    關注

    0

    文章

    18

    瀏覽量

    7468
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124398
  • cnn
    cnn
    +關注

    關注

    3

    文章

    355

    瀏覽量

    23425

原文標題:【ACL2020】用于改進文本分類的特征投影

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    激光投影儀 CE 認證的特殊測試要求

    激光投影儀因亮度高、壽命長、體積小,已成為歐盟市場的主流產品之一。但與傳統燈泡投影儀相比,激光投影在 CE 認證中有更嚴格、也更容易踩坑的合規要求。如果只按普通投影儀思路去做 CE,很
    的頭像 發表于 02-10 17:48 ?359次閱讀
    激光<b class='flag-5'>投影</b>儀 CE 認證的特殊測試要求

    機器學習特征工程:分類變量的數值化處理方法

    編碼是機器學習流程里最容易被低估的環節之一,模型沒辦法直接處理文本形式的分類數據,尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發表于 02-10 15:58 ?339次閱讀
    機器學習<b class='flag-5'>特征</b>工程:<b class='flag-5'>分類</b>變量的數值化處理方法

    詳解DBC的Signal與JSON文本結合

    為了優化CAN數據發送與接收的操作流程,更改以前手動輸入狀態對應數據的模式,采用下拉列表選擇內容,但這需要用到超出DBC原有承載能力的信息。因此,將JSON與其結合,采用JSON格式文本寫入Signal的Comment屬性,將Comment屬性的字符串通過JSON文本拓展
    的頭像 發表于 01-06 10:57 ?301次閱讀
    詳解DBC的Signal與JSON<b class='flag-5'>文本</b>結合

    投影儀NOM認證

    投影儀出口墨西哥需要進行NOM認證(NormaOficialMexicana),以確保產品符合墨西哥在電氣安全、電磁兼容性(EMC)以及能效等方面的強制性標準。此外,如果投影儀帶有無線功能(如
    的頭像 發表于 10-31 14:28 ?574次閱讀
    <b class='flag-5'>投影</b>儀NOM認證

    基于級聯分類器的人臉檢測基本原理

    本次分享的內容是基于級聯分類器的人臉檢測基本原理 1) 人臉檢測概述 關于人臉檢測算法,目前主流方法分為兩類,一類是基于知識,主要方法包括模板匹配,人臉特征,形狀和邊緣,紋理特征,顏色特征
    發表于 10-30 06:14

    多光譜圖像顏色特征用于茶葉分類的研究進展

    多光譜成像技術結合顏色特征分析為茶葉分類提供了高效、非破壞性的解決方案。本文系統綜述了該技術的原理、方法、應用案例及挑戰,探討了其在茶葉品質分級、品種識別和產地溯源中的研究進展,并展望了未來發展方向
    的頭像 發表于 10-17 17:09 ?587次閱讀
    多光譜圖像顏色<b class='flag-5'>特征用于</b>茶葉<b class='flag-5'>分類</b>的研究進展

    格靈深瞳突破文本人物檢索技術難題

    格靈深瞳參與研究的GA-DMS框架,為攻破上述技術難題提供了全新解決方案。研究團隊通過數據構建和模型架構的協同改進,推動CLIP在人物表征學習中的應用,顯著提升了基于文本的人物檢索效果。該成果已入選EMNLP 2025 主會(自然語言處理領域的頂級國際會議之一)。
    的頭像 發表于 09-28 09:42 ?632次閱讀
    格靈深瞳突破<b class='flag-5'>文本</b>人物檢索技術難題

    星空投影燈方案開發設計案例

    在科技與浪漫的交匯處,一款能夠將浩瀚星空濃縮于掌心的投影儀,無疑是現代生活中的點睛之筆。無論是為臥室增添一抹夢幻色彩,還是作為一份獨特的禮物。然而,如何在有限的成本內實現卓越的投影效果,一直是行業
    發表于 09-03 15:45

    NanoEdge AI生成的模型庫,在keil里面編譯后運行,返回都是0,沒挑出單分類,怎么解決?

    我打算識別具有特定特征的曲線,我按照單分類進行訓練。2維數據,輸入時間序列數據,得分90+分,得到模型后。驗證得分90+,我就在keil里面使用驗證所用的數據,挑選了一些無特征和有特征
    發表于 08-12 07:52

    飛書開源“RTV”富文本組件 重塑鴻蒙應用富文本渲染體驗

    近日,飛書正式將其自研的富文本組件庫?RichTextVista(簡稱“RTV”)開源,并上線OpenHarmony?三方庫中心倉。該組件以領先的性能、流暢的渲染體驗與高度的開放性,為鴻蒙生態提供了
    的頭像 發表于 07-11 15:20 ?640次閱讀
    飛書開源“RTV”富<b class='flag-5'>文本</b>組件 重塑鴻蒙應用富<b class='flag-5'>文本</b>渲染體驗

    風華貼片電感的標準分類體系

    作為國內電子元器件領域的領軍企業,風華高科通過構建多維度分類體系,實現了貼片電感產品的精準定位與高效應用。其分類邏輯融合了結構特征、功能特性及場景適配性,形成了涵蓋產品形態、技術參數、應用領域
    的頭像 發表于 05-19 14:04 ?664次閱讀
    風華貼片電感的標準<b class='flag-5'>分類</b>體系

    在友晶LabCloud平臺上使用PipeCNN實現ImageNet圖像分類

    利用深度卷積神經網絡(CNN)進行圖像分類是通過使用多個卷積層來從輸入數據中提取特征,最后通過分類層做決策來識別出目標物體。
    的頭像 發表于 04-23 09:42 ?1083次閱讀
    在友晶LabCloud平臺上使用PipeCNN實現ImageNet圖像<b class='flag-5'>分類</b>

    把樹莓派打造成識別文本的“神器”!

    在許多項目中,RaspberryPi被用作監控攝像頭或執行機器學習任務。在這些場景中,圖像中經常包含應用程序感興趣的文本信息。我們希望提取這些信息并將其轉換,以便通過程序分析文本
    的頭像 發表于 03-25 09:30 ?982次閱讀
    把樹莓派打造成識別<b class='flag-5'>文本</b>的“神器”!

    ?VLM(視覺語言模型)?詳細解析

    的詳細解析: 1. 核心組成與工作原理 視覺編碼器 :提取圖像特征,常用CNN(如ResNet)或視覺Transformer(ViT)。 語言模型 :處理文本輸入/輸出,如GPT、BERT等,部分模型
    的頭像 發表于 03-17 15:32 ?8847次閱讀
    ?VLM(視覺語言模型)?詳細解析