国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習特征工程的五個方面優點

汽車玩家 ? 來源:今日頭條 ? 作者:不一樣的程序猿 ? 2020-03-15 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特征工程是用數學轉換的方法將原始輸入數據轉換為用于機器學習模型的新特征。特征工程提高了機器學習模型的準確度和計算效率,體現在以下五個方面

1、把原始數據轉換成與目標相關的數據

我們可以使用特征工程對原始數據進行轉換,使其更接近目標變量,轉換后的特征對目標更有預測性。在這種情況下,雖然未加工輸入出現在原始數據集中,但如果將轉換后的特征作為輸入,則機器學習將提高預測的準確性。

2、引入額外的數據源

特征工程可以使從業者向機器學習模型引入額外的數據源。對于首次注冊的用戶,我們可以猜測該用戶的終生價值。在眾多指標中,我們可以捕捉每個用戶的地理位置。雖然這個數據可以直接作為分類特征(例如,IP地址和郵政編碼)提供,但模型基于這些來確定位置信息仍存在困難。

通過第三方的人口統計數據,我們可以做的更好。例如,這將允許我們計算每個用戶區域的平均收入和人口密度,并把這些因素直接插入到訓練集中?,F在,這些預測性因素立即變得更容易推斷,而不是依賴模型從原始位置數據推斷這種微妙的關系。更進一步,位置信息轉換成收入和人口密度的特征工程,可使我們估計這些位置衍生出的特征哪一個更為重要。

3、使用非結構化的數據源

特征工程可使我們在機器學習模型中使用非結構化的數據源。許多數據源本質上并不是結構化的特征向量。非結構化數據,如文本、時間序列、圖像、視頻、日志數據和點擊流等,占創建數據的絕大多數。特征工程使從業者從上述原始數據流中產生機器學習的特征向量。

4、創建更容易解釋的特征

特征工程使機器學習的從業者能夠創建更易于解釋和實用的特征。通常,使用機器學習發現數據中的模式,對于產生精確的預測十分有用,但會遇到模型的可解釋性和模型的最終應用的一些限制。這些情況下,在驅動數據生成、鏈接原始數據和目標變量的過程中,產生更有指示性的新特征,這樣更有價值。

5、用大特征集提高創造性

特征工程使得我們可以扔進大量的特征,觀察它們代表了什么。我們能創建盡可能多的數據,觀察在訓練模型中哪些更有預測力。這使得機器學習的從業者在創建和測試特征時擺脫僵化心理,并能夠發現新的趨勢和模式。

雖然當幾十個甚至上百個特征用于訓練機器學習模型時,過擬合成為一個問題,但嚴謹的特征選擇算法,可減少特征使其易于管理。例如,我們可以自主選擇前10個特征的預測,與所有1000個特征的預測是一樣好,還是優于后者。

特征工程

引自《機器學習實戰》

在機器學習應用領域中,特征工程扮演著非常重要的角色,可以說特征工程是機器學習應用的基礎。在機器學習業界流傳著這樣一句話:“數據和特征決定了機器學習算法的上限,而模型和算法只是不斷逼近而已?!痹跈C器學習應用中,特征工程介于“數據”和“模型”之間,特征工程是使用數據的專業領域知識創建能夠使機器學習算法工作的特征的過程,而好的數據勝于多的數據。美國計算機科學家Peter Norvig有兩句經典名言:“基于大量數據的簡單模型勝于少量數據的復雜模型?!币约啊案嗟臄祿儆诼斆鞯乃惴ǎ玫臄祿儆诙嗟臄祿!币虼?,特征工程的前提是收集足夠多的數據,其次是從大量數據中提取關鍵信息并表示為模型所需要的形式。合適的特征可以讓模型預測更加容易,機器學習應用更有可能成功。

引自《美團機器學習》

在監督機器學習過程中,我們使用數據教自動系統如何做出準確的決策。機器學習算法被設計成發現模式和歷史訓練數據間的聯系;它們從數據中學習并將學習結果編碼到模型中,從而對新數據的重要屬性做出準確的預測。因此,訓練數據是機器學習中的基本問題。有了高質量的數據,就可以捕捉到細微的差別和關聯關系,從而建立高保真的預測系統。相反,若訓練數據質量不佳,則再好的機器學習算法也無濟于事。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136931
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學科的技能,涵蓋數學基礎、編程能力、算法理論、工程實踐以及業務理解等多個方面。 以下是具體技能及學習建議: 線性代數核心內容:矩陣運算、
    發表于 02-27 10:53

    機器學習特征工程:分類變量的數值化處理方法

    編碼是機器學習流程里最容易被低估的環節之一,模型沒辦法直接處理文本形式的分類數據,尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類
    的頭像 發表于 02-10 15:58 ?329次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>特征</b><b class='flag-5'>工程</b>:分類變量的數值化處理方法

    機器學習和深度學習中需避免的 7 常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?187次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    方面幫您分辨光纜是否優質?

    光纜是由纜芯、加強鋼絲、填充物和護套等幾部分組成,另外根據需要還有防水層、緩沖層、絕緣金屬導線等構件。 方面幫您分辨光纜是否優質? 1、填充物油膏:它是存在于松套管中的物質,主要含有纖膏與纜膏
    的頭像 發表于 12-25 10:05 ?49次閱讀

    工程師實戰指南:關于離子捕捉劑應用的關鍵問題與解答

    在考慮使用離子捕捉劑時,工程師們常有一些具體的實操疑問。本文收集了最具代表性的問題,并結合東亞合成IXE系列的產品特性,給出清晰的技術解答,為您掃清應用障礙。
    的頭像 發表于 12-08 16:38 ?337次閱讀
    <b class='flag-5'>工程</b>師實戰指南:關于離子捕捉劑應用的<b class='flag-5'>五</b><b class='flag-5'>個</b>關鍵問題與解答

    自動駕駛中常提的“強化學習”是啥?

    [首發于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學習(Reinforcement Learning,簡稱RL)”,強化學習是一類讓機器通過試錯來學會做決策的技術。簡單理解
    的頭像 發表于 10-23 09:00 ?662次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是<b class='flag-5'>個</b>啥?

    大電磁頻譜管理監測系統軟件:有哪些優點和缺點

    大電磁頻譜管理監測系統軟件:有哪些優點和缺點
    的頭像 發表于 09-28 16:50 ?818次閱讀
    <b class='flag-5'>五</b>大電磁頻譜管理監測系統軟件:有哪些<b class='flag-5'>優點</b>和缺點

    大海上安全事件應急處置系統:有哪些優點和缺點

    大海上安全事件應急處置系統:有哪些優點和缺點
    的頭像 發表于 09-04 17:09 ?991次閱讀
    <b class='flag-5'>五</b>大海上安全事件應急處置系統:有哪些<b class='flag-5'>優點</b>和缺點

    【Sipeed MaixCAM Pro開發板試用體驗】 + 04 + 機器學習YOLO體驗

    、 機器學習YOLO體驗 1.在線訓練 Sipeed矽速科技擁有自研搭建的MaixHub平臺,可以快速簡單的完成yolo訓練。 下面我將展示訓練集拍攝標注和訓練的相關圖片 數據集有直接上傳和拍攝2種
    發表于 07-24 21:35

    FPGA在機器學習中的具體應用

    ,越來越多地被應用于機器學習任務中。本文將探討 FPGA 在機器學習中的應用,特別是在加速神經網絡推理、優化算法和提升處理效率方面的優勢。
    的頭像 發表于 07-16 15:34 ?2885次閱讀

    電子硬件工程師如何從零開始學習?(文末免費分享從零開始學習資料)

    經常有用戶咨詢,如何學習和提升電子硬件能力,有沒有適合小白學習的資料等等;電子硬件工程師是一結合理論、實踐和創新能力的職業,需要掌握電路設計、元器件選型、PCB設計、嵌入式系統、測試
    的頭像 發表于 06-04 07:36 ?2174次閱讀
    電子硬件<b class='flag-5'>工程</b>師如何從零開始<b class='flag-5'>學習</b>?(文末免費分享從零開始<b class='flag-5'>學習</b>資料)

    玻璃通孔技術的獨特優勢

    TGV(Through Glass Via)工藝之所以選擇在玻璃上打孔,主要是因為玻璃在以下方面相較于硅具有獨特優勢。
    的頭像 發表于 05-23 16:32 ?1089次閱讀
    玻璃通孔技術的<b class='flag-5'>五</b><b class='flag-5'>個</b>獨特優勢

    SOLIDWORKS教育版——全方面學習資源與教程

    功能,更以其全方面學習資源與教程,為學生構建了一從理論到實踐、從基礎到進階的完整學習體系。本文將深入探討SOLIDWORKS教育版如何憑借其豐富的
    的頭像 發表于 04-23 11:03 ?878次閱讀
    SOLIDWORKS教育版——全<b class='flag-5'>方面</b>的<b class='flag-5'>學習</b>資源與教程

    機器視覺系統中如何評價光源的好壞

    從對比度、魯棒性、亮度、均勻性和可維護性方面探討了光源在機器視覺系統中的重要性。
    的頭像 發表于 04-14 13:38 ?669次閱讀

    面向AI與機器學習應用的開發平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是一款面向AI與機器學習應用的開發平臺,專為邊緣計算場景優化設計。以下從核心配置、技術特性、應用場景及開發支持等方面進行詳細
    的頭像 發表于 04-11 18:33 ?2435次閱讀
    面向AI與<b class='flag-5'>機器</b><b class='flag-5'>學習</b>應用的開發平臺 AMD/Xilinx Versal? AI Edge VEK280