国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何給工業大數據降維去噪,你可以試試特征選擇

格創東智 ? 2018-12-18 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者:格創東智OT團隊 (轉載請注明來源及作者)


在之前格物匯的文章中,我們介紹了特征構建的幾種常用方法。特征構建是一種升維操作,針對特征解釋能力不足,可以通過特征構建的方法來增加特征解釋力,從而提升模型效果。隨著近幾年大數據技術的普及,我們可以獲取海量數據,但是這些海量數據帶給我們更多信息的同時,也帶來了更多的噪音和異常數據。如何降維去噪成為很多企業關注的焦點,今天我們將介紹特征工程中的一種降維方法——特征選擇


什么是特征選擇

特征選擇( Feature Selection )也稱特征子集選擇( FeatureSubset Selection , FSS ),或屬性選擇( Attribute Selection )。是指從已有的N個特征(Feature)中選擇M個特征使得系統的特定指標最優化。

圖1.jpg



特征選擇主要有兩個功能

  • 減少特征數量、降維,使模型泛化能力更強,減少過擬合

  • 增強對特征和特征值之間的理解


特征選擇的流程


特征選擇的目標是尋找一個能夠有效識別目標的最小特征子集。尋找的一般流程可用下圖表示:


一般來說,通過枚舉來對特征子集進行選擇是一個比較費時的步驟,所以應使用一些策略來進行特征選擇,通常來說,我們會從兩個方面考慮來選擇特征:

>>>>

特征是否發散

如果一個特征不發散,例如方差接近于0,也就是說樣本在這個特征上基本上沒有差異,這個特征對于樣本的區分并沒有什么用。

>>>>

特征與目標的相關性

這點比較顯見,與目標相關性高的特征,應當優選選擇。除方差法外,本文介紹的其他方法均從相關性考慮。

根據特征選擇的形式又可以將特征選擇方法分為3種:

  • Filter

  • Wrapper

  • Embedded

特征選擇的方法


01

Filter


過濾法,按照發散性或者相關性對各個特征進行評分,設定閾值或者待選擇閾值的個數,選擇特征。

評分指標有:

  • 方差:評價指標的離散程度,越離散說明包含的信息越多。

  • 相關性:衡量特征對目標的解釋能力,相關系數越大說明解釋能力越強。

  • 卡方檢驗:檢驗定性自變量對定性因變量的相關性。

圖3.jpg

  • 互信息:也是評價定性自變量對定性因變量的相關性的。

圖4.jpg


02

Wrapper

包裝法,根據目標函數(通常是預測效果)評分,每次選擇若干特征,或者排除若干特征,主要的方法是遞歸特征消除法。遞歸消除特征法使用一個基模型來進行多輪訓練,每輪訓練后,減少若干特征,或者新增若干特征,進行評估看新增的特征是否需要保留,剔除的特征是否需要還原。最后再基于新的特征集進行下一輪訓練。

03

Embedded


嵌入法,先使用某些機器學習算法和模型進行訓練,得到各個特征的權值系數,根據系數從大到小選擇特征。類似于Filter方法,但是是通過訓練來確定特征的優劣。

一般分為如下兩大類:

>>>>

基于懲罰項的特征選擇法

這個方法可以用線性回歸模型來舉例說明,我們在線性模型的目標函數中增加L1正則項(實際上這就是lasso模型)。由于該正則項的存在,某些與目標y不太相關的特征的系數將縮減至0,而保留的特征系數將相應調整,從而達到了對特征進行篩選的效果,L1正則項系數越大,篩選的力度也就越大。

>>>>

基于樹模型的特征選擇法

在我們之前的文章中介紹過隨機森林,GDBT等等基于樹的模型,他們均有一個特點就是模型可以計算出特征的重要性。決策樹會優先將對預測目標y幫助最大的特征放在模型的頂端,因此根據這個效果我們計算得到特征的重要性,進而我們可以根據特征重要性對特征進行選擇。


今天我們大致了解了如何給工業大數據降維去噪,進行特征選擇,在后續文章中,我們將繼續帶大家了解特征工程的另一個內容——特征抽取,敬請期待。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 特征選擇
    +關注

    關注

    0

    文章

    12

    瀏覽量

    7399
  • 大數據
    +關注

    關注

    64

    文章

    9063

    瀏覽量

    143761
  • 智能制造
    +關注

    關注

    48

    文章

    6236

    瀏覽量

    79941
  • 工業互聯網
    +關注

    關注

    28

    文章

    4394

    瀏覽量

    96275
  • 工業大數據
    +關注

    關注

    0

    文章

    72

    瀏覽量

    8185
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大數據平臺運營的基礎是什么

    在數聚股份看來,越來越多的企業開始搭建自己的大數據平臺體系,并傾注大量資源用于平臺的迭代和運營。那么大數據平臺作為越來越被關注的企業新興價值點,它應該以何種方式看待,并且以什么樣的方式建設和運營
    的頭像 發表于 12-23 16:07 ?233次閱讀

    北京工業大學開源鴻蒙技術俱樂部正式揭牌成立

    2025年10月29日上午,由OpenAtom OpenHarmony(以下簡稱“開源鴻蒙”)項目群技術指導委員會和北京工業大學計算機學院共同舉辦的“北京工業大學開源鴻蒙技術俱樂部成立大會暨智能物聯
    的頭像 發表于 11-04 09:23 ?1090次閱讀
    北京<b class='flag-5'>工業大</b>學開源鴻蒙技術俱樂部正式揭牌成立

    湖北大數據集團到訪智科技參觀交流

    近日,湖北大數據集團有限公司黨委書記、董事長汪小波率隊到訪智科技。雙方圍繞時空數據融合、公共數據授權運營及行業應用場景開發等議題展開深入探討。
    的頭像 發表于 11-03 10:02 ?636次閱讀

    產教融合新落地!視智造與安徽工業大學共建智能視覺實驗室

    近日,視智造與安徽工業大學電氣與信息工程學院達成深度合作,共建智能視覺實驗室,并于今年完成了MV-VS1100S-VB機器視覺應用教學實驗平臺的交付,為該校智能感知工程專業的教學實踐注入“工業級”力量。
    的頭像 發表于 10-29 15:27 ?325次閱讀

    工業數據云平臺有哪些好用的?

    )。 華為云:華為云工業互聯平臺專注于工業數字化轉型,提供工業物聯網、邊緣計算和工業大數據分析等服務。其應用場景廣泛,涵蓋制造業、能源、交通等領域。華為云憑借強大的生態系統和持續的技術
    的頭像 發表于 10-20 17:25 ?593次閱讀
    <b class='flag-5'>工業</b><b class='flag-5'>數據</b>云平臺有哪些好用的?

    工業大舵機和普通舵機的區別?

    工業大舵機和普通舵機在設計定位、性能參數、應用場景等多方面存在顯著差異,以下是具體對比: 核心性能參數 精度控制 工業大舵機 :配備高精度位置傳感器(如磁阻式絕對值編碼器),精度可達 0.1 度以下
    的頭像 發表于 09-25 10:41 ?924次閱讀

    御控工業物聯網大數據解決方案:排水設備遠程監控與大數據統計系統

    御控工業物聯網推出排水設備遠程監控與大數據統計系統,通過物聯網、大數據、云計算等技術構建“感知-傳輸-分析-決策”閉環管理體系,助力排水行業數字化轉型。
    的頭像 發表于 09-12 10:04 ?669次閱讀

    智科技榮獲2025年第七屆浦東新區大數據創新應用競賽優勝獎

    智科技憑借基于時空AI技術打造的“城市時空智能服務平臺",榮獲第七屆浦東新區大數據創新應用競賽——城市數字化轉型場景創新賽《優勝獎》。
    的頭像 發表于 09-06 16:47 ?1528次閱讀

    智科技亮相2025中國國際大數據產業博覽會

    近日,全球大數據領域矚目的盛會——2025中國國際大數據產業博覽會隆重開幕。作為華為重要生態合作伙伴,智科技作為時空人工智能與城市數字化領域的領先企業,受邀參加展覽展示。
    的頭像 發表于 09-04 18:03 ?1439次閱讀

    數據中臺可以接入哪些物聯網云平臺

    : 一、工業互聯網平臺 工業互聯網平臺聚焦制造業場景,提供設備連接、協議解析、邊緣計算及工業大數據分析能力,與數據中臺結合可實現生產數據全鏈
    的頭像 發表于 08-19 15:22 ?763次閱讀

    工業組態云平臺可以實現哪些功能

    工業組態云平臺可以實現數據采集與監控、報警通知、遠程控制與運數據分析與決策、組態設計與可視化等多種功能,以下是具體介紹: 1、
    的頭像 發表于 08-18 14:36 ?477次閱讀

    工業大模型利用全流程數據采集推動顯示行業生產制造升級

    挖掘與智能分析,顯示工業大模型能夠突破傳統生產模式的局限,在工藝優化、質量管控、設備運等關鍵環節實現智能化躍升,推動顯示制造向更高效率、更高質量、更低成本的方向發展。 全流程數據:顯示工業大
    的頭像 發表于 07-28 10:37 ?608次閱讀

    歐菲光榮獲第七屆“深圳工業大獎” 深圳工業界最高榮譽

    近日,第七屆“深圳工業大獎”名單公示,經深圳工業大獎獨立評審團成員認真審議、記名投票,分別評選產生第七屆“深圳工業大獎”企業10家、工業家10位、項目10個。其中,歐菲光集團股份有限公
    的頭像 發表于 07-15 18:07 ?1566次閱讀

    工業大數據管理平臺是什么?有什么功能?

    PLC跨網段通信網關是一種用于解決工業自動化領域中不同網絡段內PLC(可編程邏輯控制器)設備通信問題的關鍵設備,其核心作用是實現不同網絡協議、IP網段之間的數據交互與信息傳輸,下面從多個方面詳細介紹
    的頭像 發表于 06-13 15:43 ?426次閱讀

    京東工業大模型Joy industrial重磅發布

    京東工業多年深耕工業數智供應鏈領域形成的經驗積累和數據沉淀,通過“工業大模型+供應鏈場景應用”雙引擎,構建從底層算力、算法、數據到應用的全棧
    的頭像 發表于 05-28 17:12 ?978次閱讀