国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

快速掌握特征構建的常用方法

格創東智 ? 2018-12-12 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在之前格物匯的文章中,我們介紹了工業數據預處理的方法以及特征工程的基本知識,今天要帶大家來了解如何做特征構建。


特征構建常用方法


特征構建的常用方法是屬性分割和結合,這一般根據我們具體的問題所決定。我們通過具體的應用場景來看看:


時間列處理

時間戳屬性通常需要分離成多個維度比如年、月、日、小時、分鐘、秒鐘。通常時間序列數據會含有一定的趨勢和周期性,這時需要我們去構建趨勢因子和周期因子。


分解類別屬性

一些屬性是類別型而不是數值型,舉一個簡單的例子,由{紅,綠、藍}組成的顏色屬性,最常用的方式是把每個類別屬性轉換成二元屬性,即從{0,1}取一個值。因此基本上增加的屬性等于相應數目的類別,并且對于你數據集中的每個實例,只有一個是1(其他的為0),這也就是獨熱(one-hot)編碼方式。我們在前面的文章中介紹過了,在此不再贅述。


分箱和分區

有時候,將數值型屬性轉換成類別呈現更有意義,同時能使算法減少噪聲的干擾,通過將一定范圍內的數值劃分成確定的塊。舉個例子,我們預測一個人是否擁有某款衣服,這里年齡是一個確切的因子。其實年齡組是更為相關的因子,所以我們可以將年齡分布劃分成1-10,11-18,19-25,26-40等年齡段,分別表示 幼兒,青少年,青年,中年四個年齡組,讓相近的年齡組表現出相似的屬性。此外,我們還可以對分箱,分區做一些統計量字段作為數據的特征。


只有在了解屬性的領域知識的基礎,確定屬性能夠劃分成簡潔的范圍時分區才有意義。即所有的數值落入一個分區時能夠呈現出共同的特征。在實際應用中,當你不想讓你的模型總是嘗試區分值之間是否太近時,分區能夠避免出現過擬合。例如,如果你所感興趣的是將一個城市作為整體,這時你可以將所有落入該城市的維度值進行整合成一個整體。分箱也能減小小錯誤的影響,通過將一個給定值劃入到最近的塊中。如果劃分范圍的數量和所有可能值相近,或對你來說準確率很重要的話,此時分箱就不適合了。

交叉特征

交叉特征是特征工程中重要的方法之一,交叉特征是一種很獨特的方式,它將兩個或更多的類別屬性組合成一個。當組合的特征要比單個特征更好時,這是一項非常有用的技術。數學上來說,是對類別特征的所有可能值進行交叉相乘。當然我們不僅僅會去查找交叉項關系,還可以去尋找更加復雜的二次項,三次項乃至更復雜的關系,這根據問題求解的需要決定。


經度與緯度的組合便是交叉特征的應用實例,一個相同的經度對應了地圖上很多的地方,緯度也是一樣。但是一旦你將經度和緯度組合到一起,它們就代表了地理上特定的一塊區域,區域中每一部分是擁有著類似的特性。

小結

一般我們會收集與問題相關的數據作為我們的特征,但是這些特征有時不足以解釋我們的問題,我們還是會通過特征構建來增加解釋能力。這其實是對數據進行升維操作,總的來說,特征構建可以給我們的模型提供一些關鍵的信息,來解決模型解釋能力不足的情況。但如果我們收集的數據包含了過多的特征,如何對這些特征進行提純呢?請繼續關注格物匯,我們將在之后的文章中詳細講解。


本文作者:格創東智 OT團隊 (轉載請注明來源及作者)


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能制造
    +關注

    關注

    48

    文章

    6236

    瀏覽量

    79941
  • 工業互聯網
    +關注

    關注

    28

    文章

    4394

    瀏覽量

    96275
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    嵌入式驅動開發,需要掌握哪些技能?

    。 4、 熟悉驅動開發常用工具做驅動開發,會牽涉到很多軟硬件工具。比如:VS Code、Keil、 J-Link、Git等。 5、 調試和故障排除嵌入式軟件的測試和調試非常重要,需要掌握各種測試方法,如
    發表于 01-20 16:46

    學習單片機快速方法

    學習單片機的快速方法 先介紹下單片機。把單片機說成是電子信息類專業最重要的一門課程一點也不為過,你在街上看到的廣告彩燈、煙花表演、紅綠燈、自動開關門這些都可以用單片機實現。有了單片機,你就可以寫程序
    發表于 01-14 07:42

    嵌入式應掌握的幾種能力

    中,也會選擇使用C++來進行開發。 補充編程語言的知識時,除了掌握語言本身的知識之外。還需要同時學習:編譯、構建、調試等方面的相關知識。這類很重要的知識一般C語言課程都沒教: 2. 芯片
    發表于 12-08 06:05

    新手速成:掌握TTS/文件播放/錄音核心,構建完整音頻處理功能

    剛接觸音頻開發時,TTS播放、文件播放與錄音功能看似復雜,實則是實現完整音頻處理的基礎。本文從新手視角出發,拆解這三大功能的核心邏輯——資源管理、播放控制與狀態反饋,幫你快速掌握核心并整合為完整
    的頭像 發表于 11-21 19:26 ?292次閱讀
    新手速成:<b class='flag-5'>掌握</b>TTS/文件播放/錄音核心,<b class='flag-5'>構建</b>完整音頻處理功能

    諧波源定位常用方法有哪些?

    諧波源定位的核心是通過 “信號測量→特征分析→邏輯判斷”,確定電網中產生諧波的具體設備、用戶或區域,常用方法可按 “原理差異” 分為功率流向類、暫態對比類、阻抗分析類、相位判斷類、數據驅動類五大類
    的頭像 發表于 10-13 16:41 ?960次閱讀

    掌握數字設計基礎:邁向芯片設計的第一步

    核心原理,幫助你快速理解數字設計的基本方法。 1、二進制:數字世界的語言 所有數字電路的底層邏輯,都源自最簡單的 二進制系統。0和1看似簡單,卻是信息編碼的唯一符號。每一個二進制位(bit)都代表一個
    發表于 10-09 21:11

    使用jQuery的常用方法與返回值分析

    使用jQuery的常用方法與返回值分析 jQuery是一個輕量級的JavaScript庫,旨在簡化HTML文檔遍歷和操作、事件處理以及動畫效果的創建。本文將介紹一些常用的jQuery方法
    發表于 10-01 20:18

    新手如何快速掌握電磁閥氣密性檢測設備的操作?

    對于剛接觸工業檢測的新手來說,面對一臺電磁閥氣密性檢測設備可能會感到無從下手。但其實,只要掌握正確的學習方法和操作流程,快速上手并非難事。今天就為大家帶來一份實用的入門指南。首先,做好充分的準備工作
    的頭像 發表于 09-25 15:02 ?467次閱讀
    新手如何<b class='flag-5'>快速</b><b class='flag-5'>掌握</b>電磁閥氣密性檢測設備的操作?

    如何構建高績效智能體

    當智能體成為每位員工的專屬團隊,你的角色正從執行者升級為“智能體管理者”:指揮AI工具完成工作、擴大影響力已成職場新剛需。如何構建高績效智能體?如何配置人機協作黃金比例?如何量化智能體的業務回報?掌握“前沿企業”的智能體管理實踐,快速
    的頭像 發表于 09-10 15:24 ?1191次閱讀

    【「Yocto項目實戰教程:高效定制嵌入式Linux系統」閱讀體驗】+基礎概念學習理解

    軟件包的依賴關系、編譯選項、配置參數等。掌握元數據的使用方法對于定制和優化嵌入式 Linux 系統至關重要。 BitBake BitBake 是 Yocto 項目的構建工具。通過學習這部分內容,我深入
    發表于 08-04 22:29

    變頻器維修需掌握方法

    變頻器維修需要掌握方法多種多樣,以下是一些關鍵的維修方法。 ? 一、報警參數檢查法 變頻器通常會針對電壓、電流、溫度、通訊等故障給出相應的報錯信息。維修人員應首先查看變頻器的報警參數,了解故障
    的頭像 發表于 08-03 07:38 ?1544次閱讀

    一文掌握Linux命令

    作為一名運維工程師,熟練掌握Linux命令是基本功中的基本功。無論是日常工作中的系統維護,還是面試時的技術考核,Linux命令都是繞不開的核心技能。本文將從實戰角度出發,系統梳理運維工程師必須掌握的Linux命令,并結合實際場景解析其應用
    的頭像 發表于 07-22 15:23 ?624次閱讀

    PLC梯形圖編程方法(PPT版)

    梯形圖經驗設計法 經驗設計方法也叫試湊法,經驗設計方法需要設計者掌握大量的典型電路,在掌握這些典型電路的基礎上,充分理解實際的控制問題,將實際控制問題分解成典型控制電路,然后用典型電路
    發表于 05-30 16:46

    瑞芯微RK平臺開發必備的20個常用命令,幫您效率翻倍

    本文將系統地梳理飛凌嵌入式RK平臺主控產品在開發過程中常用的命令,助力更多開發者快速掌握RK系列芯片的開發方法。
    的頭像 發表于 04-16 15:36 ?1435次閱讀
    瑞芯微RK平臺開發必備的20個<b class='flag-5'>常用</b>命令,幫您效率翻倍

    一種基于點、線和消失點特征的單目SLAM系統設計

    本文提出了一種穩健的單目視覺SLAM系統,該系統同時利用點、線和消失點特征來進行精確的相機位姿估計和地圖構建,有效解決了傳統基于點特征的SLAM的局限性。
    的頭像 發表于 03-21 17:07 ?1051次閱讀
    一種基于點、線和消失點<b class='flag-5'>特征</b>的單目SLAM系統設計