国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

想掌握機器學習技術?從了解特征工程開始

格創東智 ? 2018-12-05 09:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者:格創東智科技有限公司 OT團隊


人工智能是過去兩到三年時間內科技行業最熱的話題。而人工智能技術進步的背后,實質上是機器學習快速發展后所帶來的巨大提升。


機器學習被廣泛定義為“利用經驗來改善計算機系統的自身性能”。事實上,“經驗”在計算機中主要是以數據的形式存在的,因此數據是機器學習的前提和基礎。

在第一期格物匯的文章中,我們介紹了工業數據預處理的方法,主要針對數據格式異常,數據內容異常等問題進行了簡要探討。做數據預處理的主要目的是將雜亂無章的數據規整成我們想要的矩陣、表格、張量等結構,方便在之后的機器學習中進行模型訓練。然而數據中的問題還包含了冗余,噪聲,高維度,體量大等很多問題。解決這些問題的方法與數據預處理的方法在機器學習中被統稱為特征工程,今天我們就來了解一下吧。


特征工程是什么


當你想要你的預測模型性能達到最佳時,你要做的不僅是要選取最好的算法,還要盡可能的從原始數據中獲取更多的信息。那么問題來了,你應該如何為你的預測模型得到更好的數據呢?這就是特征工程要做的事,它的目的就是獲取更好的訓練數據

維基百科中給特征工程做出了簡單定義:特征工程是利用數據領域的相關知識來創建能夠使機器學習算法達到最佳性能的特征的過程。簡而言之,特征工程就是一個把原始數據轉變成特征的過程,這些特征可以很好的描述這些數據,并且利用它們建立的模型在未知數據上的表現性能可以達到最優(或者接近最佳性能)。從數學的角度來看,特征工程就是人工地去設計輸入變量X


特征工程的重要性


關于特征工程(Feature Engineering),已經是很古老很常見的話題了,坊間常說:“數據和特征決定了機器學習的上限,而模型和算法只是逼近這個上限而已”。由此可見,特征工程在機器學習中占有相當重要的地位


1、特征越好,靈活性越強

只要特征選得好,即使是一般的模型(或算法)也能獲得很好的性能,因為大多數模型(或算法)在好的數據特征下表現的性能都還不錯。好特征的靈活性在于它允許你選擇不復雜的模型,同時運行速度也更快,也更容易理解和維護。


2、特征越好,構建的模型越簡單

有了好的特征,即便你的參數不是最優的,你的模型性能也能仍然會表現的很nice,所以你就不需要花太多的時間去尋找最有參數,這大大的降低了模型的復雜度,使模型趨于簡單。


3、特征越好,模型的性能越出色

顯然,這一點是毫無爭議的,我們進行特征工程的最終目的就是提升模型的性能。


特征工程怎么做

既然特征工程這么重要,那么我們就來看看特征工程到底是如何實現或者工作的。特征工程到底分為哪些內容?我們大致可以參考如下流程圖來看看。



簡單來說,特征處理主要分如下三個方法:

特征構建

特征構建是指從原始數據中人工的找出一些具有實際意義的特征。需要花時間去觀察原始數據,思考問題的潛在形式和數據結構,對數據敏感性和機器學習實戰經驗能幫助特征構建。除此之外,屬性分割和結合是特征構建時常使用的方法。特征構建是個非常麻煩的問題,書里面也很少提到具體的方法,需要對問題有比較深入的理解。

特征抽取

一些觀測數據如果直接建模,其原始狀態的數據太多。像圖像、音頻和文本數據,如果將其看做是表格數據,那么其中包含了數以千計的屬性。特征抽取是自動地對原始觀測降維,使其特征集合小到可以進行建模的過程。通常可采用主成分分析(PCA)、線性判別分析(LDA))等方法;對于圖像數據,可以進行線(line)或邊緣(edge)的提取;根據相應的領域,圖像、視頻和音頻數據可以有很多數字信號處理的方法對其進行處理。

特征選擇

不同的特征對模型的準確度的影響不同,有些特征與要解決的問題不相關,有些特征是冗余信息,這些特征都應該被移除掉。特征選擇是自動地選擇出對于問題最重要的那些特征子集的過程。常用的特征選擇方法可以分為3類:過濾式(filter)、包裹式(wrapper)和嵌入式(embedding)。


小結

總的來說,數據會存在各種各樣的問題,針對這些問題我們的特征工程給出了相應的解決辦法:1.特征解釋能力不足,我們可以嘗試使用特征構建,對數據進行升維來提升特征解釋能力;2.特征冗余,維度太高,噪聲太多,我們可以通過特征抽取和特征選擇,來對數據進行降維去噪,提煉特征。當然還有其他的特征處理方法,一般需要根據具體問題而定。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136929
  • 智能制造
    +關注

    關注

    48

    文章

    6235

    瀏覽量

    79921
  • 工業互聯網
    +關注

    關注

    28

    文章

    4394

    瀏覽量

    96263
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學科的技能,涵蓋數學基礎、編程能力、算法理論、工程實踐以及業務理解等多個方面。 以下是具體技能及學習建議: 線性代數核心內容:矩陣運算、
    發表于 02-27 10:53

    機器學習特征工程:分類變量的數值化處理方法

    編碼是機器學習流程里最容易被低估的環節之一,模型沒辦法直接處理文本形式的分類數據,尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發表于 02-10 15:58 ?329次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>特征</b><b class='flag-5'>工程</b>:分類變量的數值化處理方法

    嵌入式單片機開發學習路徑

    路徑,讓你的學習過程更加輕松有趣。 1. 入門基礎 1.1 了解嵌入式系統 在開始學習之前,首先需要了解什么是嵌入式系統以及它的基本構
    發表于 02-09 15:42

    嵌入式應掌握的幾種能力

    、能力。 我覺得牢牢地掌握這些99.99999%的概率都會用得上的嵌入式軟件基礎對找工作才比較有利。其它一些技術可以再用的時候再去了解學習。 特別是一些行業相關知識,可以入行之后
    發表于 12-08 06:05

    0到1,10+年資深LabVIEW專家,手把手教你攻克機器視覺+深度學習(5000分鐘實戰課)

    ;完整技術鏈,帶你掌握工業4.0硬核技能!LabVIEW視覺學習困境1.技術體系復雜,學習路徑模糊LabVIEW視覺開發需同時
    的頭像 發表于 12-02 08:07 ?518次閱讀
    <b class='flag-5'>從</b>0到1,10+年資深LabVIEW專家,手把手教你攻克<b class='flag-5'>機器</b>視覺+深度<b class='flag-5'>學習</b>(5000分鐘實戰課)

    學習Linux應該哪里開始

    、交叉編譯、網絡棧、文件系統……到底哪里開始學,才能既不繞彎路,又能學得“有感覺”? 今天, 深圳市鋇錸技術有限公司 就來帶你拆解這個問題。 一、先理解:Linux 到底是什么? 很多人學 Linux,一上來就打開虛擬機敲命令
    的頭像 發表于 10-16 09:51 ?452次閱讀
    <b class='flag-5'>學習</b>Linux應該<b class='flag-5'>從</b>哪里<b class='flag-5'>開始</b>?

    學習物聯網怎么入門?

    隨著物聯網技術的不斷發展,越來越多的人開始關注學習這一領域。但是對于初學者來說,物聯網似乎是一個龐雜的概念,學習起來很困難。因此,哪里
    發表于 10-14 10:34

    如何在機器視覺中部署深度學習神經網絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術機器視覺(乃至生產自動化)帶來的潛力,因為深度
    的頭像 發表于 09-10 17:38 ?900次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b>神經網絡

    ARM入門學習方法分享

    )架構。學習ARM的開始可以學習RISC和CISC架構的基礎知識開始。 二、學習匯編語言:A
    發表于 07-23 10:21

    電子硬件工程師如何從零開始學習?(文末免費分享從零開始學習資料)

    經常有用戶咨詢,如何學習和提升電子硬件能力,有沒有適合小白學習的資料等等;電子硬件工程師是一個結合理論、實踐和創新能力的職業,需要掌握電路設計、元器件選型、PCB設計、嵌入式系統、測試
    的頭像 發表于 06-04 07:36 ?2174次閱讀
    電子硬件<b class='flag-5'>工程</b>師如何從零<b class='flag-5'>開始</b><b class='flag-5'>學習</b>?(文末免費分享從零<b class='flag-5'>開始</b><b class='flag-5'>學習</b>資料)

    【「# ROS 2智能機器人開發實踐」閱讀體驗】機器人入門的引路書

    的限制和調控) 本書還有很多前沿技術項目的擴展 比如神經網絡識別例程,機器學習圖像識別的原理,yolo圖像追蹤的原理 機器學習訓練三大點:
    發表于 04-30 01:05

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例

    的知識,還需要對ROS 2的節點通信和數據處理有一定的了解。通過實踐這一部分內容,我掌握了如何在ROS 2中實現二維碼識別,這對于提高機器人的智能性和交互性具有重要意義。 地圖構建:SLAM
    發表于 04-27 11:42

    如何成為一名合格的KaihongOS北向應用開發工程

    如何使用 KaihongOS 的 SDK 和工具鏈進行開發和調試 。 2. 特定技術棧 KaihongOS 框架:深入了解 KaihongOS 操作系統的架構和開發框架。 ArkUI:學習
    發表于 04-23 06:46

    推薦電子電路入門到精通

    的識別與檢測,要認識常用電子元器件的外形,了解它 們的結構和標識,知道它們的功能和技術參數,并學會對它們的檢測。應有一塊 較好的萬用表,并學會使用它。單純地去學元件測量是比較乏味,可以在學習理 論的同時
    發表于 04-15 15:00

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    傳感器數據采集與AI機器學習領域的明星產品。深入了解?快來評論區交流,或點擊[鏈接]獲取更多技術細節! ? #nRF54 #AI
    發表于 04-01 00:00