国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何將機器學習模型的準確性從80%提高到90%以上

電子設計 ? 來源: 電子設計 ? 作者: 電子設計 ? 2020-12-10 14:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數據科學工作通常需要大幅度提高工作量才能提高所開發模型的準確性。這五個建議將有助于改善您的機器學習模型,并幫助您的項目達到其目標。

如果您已經完成了一些自己的數據科學項目,那么您現在可能已經意識到,達到80%的準確性還不錯!但是在現實世界中,有80%不會削減它。實際上,我工作過的大多數公司都期望至少90%的最低準確性(或他們所關注的任何度量標準)。
因此,我將討論可以極大地提高準確性的5件事。 我強烈建議您仔細閱讀所有五點內容, 因為其中包含了許多大多數初學者都不知道的細節。
到此為止,您應該理解,在決定機器學習模型的性能方面,有比您想象的更多的變量。
話雖如此,您可以做以下五件事來改善您的機器學習模型!

1.處理缺失值

我看到的最大錯誤之一是人們如何處理缺失的價值觀,這不一定是他們的錯。網絡上有很多資料說,您通常通過均值插補來處理缺失值 , 將空值替換為給定特征的均值,這通常不是最佳方法。
例如,假設我們有一個顯示年齡和健身得分的表,并且假設一個八十歲的孩子缺少健身得分。如果我們將平均健身得分從15到80歲的年齡范圍內進行計算,那么八十歲的孩子似乎將獲得比他們實際應該更高的健身得分。
因此,您要問自己的第一個問題是 為什么 數據一開始會丟失。

接下來,考慮除均值/中位數插補外的其他處理丟失數據的方法:
特征預測建模:回到我關于年齡和健身得分的示例,我們可以對年齡和健身得分之間的關系進行建模,然后使用該模型查找給定年齡的預期健身得分。這可以通過多種技術來完成,包括回歸,ANOVA等。

K最近鄰插補:使用KNN插補,缺失數據中填充了另一個相似樣本中的值,對于不知道的數據,KNN中的相似性使用距離函數(即歐幾里德距離)確定。

刪除行:最后,您可以刪除該行。通常不建議這樣做,但是當您有大量數據開始時,它是可以接受的 。

2.特征工程

可以顯著改善機器學習模型的第二種方法是通過特征工程。特征工程是將原始數據轉換為更好地表示人們正在試圖解決的潛在問題的特征的過程。沒有具體的方法可以執行此步驟,這就是使數據科學與科學一樣多的藝術。話雖如此,以下是您可以考慮的一些事項:

轉換DateTime變量以僅提取一周中的一天,一年中的月份等。

為變量創建箱或桶。(例如,對于高度變量,可以為100–149厘米,150–199厘米,200–249厘米等)

組合多個功能和/或值以創建一個新功能。例如,針對泰坦尼克號挑戰的最準確模型之一設計了一個新變量“ Is_women_or_child”,如果該人是女人還是孩子,則為True,否則為false。

3.特征選擇

可以大大提高模型準確性的第三個領域是特征選擇,即選擇數據集中最相關/最有價值的特征。特征太多會導致算法過擬合,而特征太少會導致算法不足。

我喜歡使用兩種主要方法來幫助您選擇功能:

功能重要性:某些算法(例如隨機森林或XGBoost)可讓您確定哪些功能在預測目標變量的值時最“重要”。通過快速創建這些模型之一并進行功能重要性,您將了解哪些變量比其他變量更有用。

降維:主成分分析(PCA)是最常見的降維技術之一,它具有大量特征,并使用線性代數將其簡化為更少的特征。

4.集成學習算法

改善機器學習模型的最簡單方法之一就是簡單地選擇更好的機器學習算法。如果您還不知道什么是集成學習算法,那么現在該學習它了!
集合學習 是一種結合使用多種學習算法的方法。這樣做的目的是,與單獨使用單個算法相比,它可以實現更高的預測性能。
流行的整體學習算法包括隨機森林,XGBoost,梯度提升和AdaBoost。為了解釋為什么集成學習算法如此強大,我將以隨機森林為例:

隨機森林涉及使用原始數據的自舉數據集創建多個決策樹。然后,模型選擇每個決策樹的所有預測的模式(多數)。這有什么意義?通過依靠“多數勝利”模型,它降低了單個樹出錯的風險。

例如,如果我們創建一個決策樹,第三個決策樹,它將預測0。但是,如果我們依靠所有4個決策樹的模式,則預測值為1。這就是集成學習的力量!

5.調整超參數

最后,調整模型的超參數并不經常被談論,但仍然非常重要。在這里,必須清楚地了解正在使用的ML模型。否則,可能很難理解每個超參數。

看一下隨機森林的所有超參數:

class sklearn.ensemble.RandomForestClassifier(n_estimators=100, *, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None, bootstrap=True, oob_score=False, n_jobs=None, random_state=None, verbose=0, warm_start=False, class_weight=None, ccp_alpha=0.0, max_samples=None)

例如,了解什么是min_impurity_decrease可能是一個好主意,這樣,當您希望機器學習模型更加寬容時,可以調整此參數!;)

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98044
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136940
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于ETAS嵌入式AI工具鏈機器學習模型部署量產ECU

    AI在汽車行業的應用日益深化,如何將機器學習領域的先進模型(如虛擬傳感器)集成ECU軟件中,已成為業界面臨的核心挑戰。
    的頭像 發表于 12-24 10:55 ?6105次閱讀
    基于ETAS嵌入式AI工具鏈<b class='flag-5'>將</b><b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>部署<b class='flag-5'>到</b>量產ECU

    如何確保電能質量在線監測裝置運行日志的準確性

    電能質量在線監測裝置運行日志的準確性直接影響故障溯源、合規審計和運維決策,需 “數據采集源頭、記錄過程、存儲傳輸、校驗維護、管理流程” 五大維度構建閉環保障體系,結合技術手段與行業標準,實現日志
    的頭像 發表于 12-17 11:08 ?571次閱讀
    如何確保電能質量在線監測裝置運行日志的<b class='flag-5'>準確性</b>?

    確保X光設備檢測的有效準確性的關鍵技巧

    行業關注的重點。本文圍繞“X光設備檢測有效”和“X光檢測準確性提升”這兩個核心長尾關鍵詞,深入解析5個關鍵技巧,幫助企業提升設備性能,降低誤差率,滿足更高的檢測需求。無論是制造業的質量控制還是安全檢查場景,
    的頭像 發表于 11-18 11:27 ?395次閱讀

    如何降低環境干擾強度對諧波檢測設備準確性的影響?

    ? 降低環境干擾強度對諧波檢測設備準確性的影響,需圍繞 “ 阻斷干擾傳播路徑→優化設備自身抗擾能力→修正干擾導致的誤差→合理布局規避干擾 ” 四大核心思路,硬件防護、信號處理、安裝布局、設備
    的頭像 發表于 10-13 17:32 ?982次閱讀

    電能質量在線監測裝置的精度等級對其測量結果的準確性有何影響?

    級),誤差限值寬松,準確性越低。這種影響體現在 所有關鍵監測參數 (穩態參數如電壓、諧波,暫態參數如暫降幅值)中,且隨應用場景的風險等級(如貿易結算、故障溯源)放大差異。以下 “參數維度、場景維度、技術本質” 三方面詳細解
    的頭像 發表于 09-26 17:40 ?1318次閱讀

    電能質量在線監測裝置定位諧波源的準確性有多高?

    網、測點密集、同步精準),準確性可達到 90% 以上;在復雜場景(如廣域電網、背景諧波波動大、測點稀疏),準確性可能降至 70% 以下。以下
    的頭像 發表于 09-26 15:20 ?592次閱讀

    如何保障電能質量監測裝置的準確性

    保障電能質量監測裝置(以下簡稱 “裝置”)的準確性,需貫穿其 “ 選型→安裝→運行維護→校準→報廢 ” 全生命周期,核心是通過 “ 源頭把控硬件精度、過程規避干擾與退化、定期驗證與修正 ”,確保裝置
    的頭像 發表于 09-23 16:03 ?899次閱讀

    如何保證數據校驗系統的時間同步以提高準確性

    在電能質量監測的數據校驗系統中, 時間同步的準確性直接決定了多監測點數據的時空一致、暫態事件的時序匹配度,以及校驗結果的可信度 。要保證時間同步以提升數據校驗準確性,需 “協議選擇
    的頭像 發表于 09-19 11:28 ?649次閱讀

    電能質量監測中,有哪些方法可以提高數據校驗系統的準確性

    在電能質量監測中,數據校驗系統的準確性是保障監測數據可信度的核心,需 “標準源精度、校準流程、硬件適配、算法優化、時間同步、運維管理” 等多維度構建提升方案,針對解決 “信號失真、參數偏差、環境
    的頭像 發表于 09-19 10:03 ?613次閱讀

    如何設置高轉換速率控制寄存器SPI頻率提高到36 MHz而不引起波形失真?

    如何設置高轉換速率控制寄存器,SPI頻率提高到36 MHz而不引起波形失真?
    發表于 08-28 07:23

    如何設置高轉換速率控制寄存器,SPI頻率提高到36 MHz而不引起波形失真?

    如何設置高轉換速率控制寄存器,SPI頻率提高到36 MHz而不引起波形失真
    發表于 08-21 07:33

    測縫計測量數據的準確性和校準方法解析

    在結構物安全監測領域,數據準確性是評估工程健康狀態的核心依據。振弦式測縫計作為主流裂縫監測設備,其測量精度直接影響裂縫發展趨勢的判斷。那么如何確保測縫計測量數據的準確性以及如何校準?下面是南京峟思給
    的頭像 發表于 07-07 13:56 ?664次閱讀
    測縫計測量數據的<b class='flag-5'>準確性</b>和校準方法解析

    必知!影響手機氣密檢測準確性的重要因素

    移動設備防水防塵技術升級,手機氣密檢測成保障產品可靠的關鍵。但檢測準確性受設備精度、環境穩定性、操作規范性及手機結構設計局限等因素干擾,影響測試結果、產品良品率和用戶體驗。影響手機氣密
    的頭像 發表于 07-04 14:26 ?899次閱讀
    必知!影響手機氣密<b class='flag-5'>性</b>檢測<b class='flag-5'>準確性</b>的重要因素

    模型推理顯存和計算量估計方法研究

    上進行了實驗。實驗結果表明,所提出的估計方法具有較高的準確性和實用。 五、結論 本文針對大模型推理的顯存和計算量估計問題,提出了基于模型結構和硬件加速的估計方法。實驗結果表明,這些方
    發表于 07-03 19:43

    如何使用POT準確性檢查器?

    :95:0.00% 分辨率視覺對象等級挑戰 (VOC) 數據集未經英特爾驗證。如 Yolo-v4-tf 文檔 中所提到,英特爾已使用上下文中常見的對象 (COCO) 數據集驗證了準確性。通過
    發表于 03-06 08:04