国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

<tfoot id="7tmno"></tfoot>

<form id="7tmno"></form>

<th id="7tmno"><kbd id="7tmno"></kbd></th>

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

XGBoost號稱“比賽奪冠的必備大殺器”，橫掃機器學習競賽罕逢敵手

XGBoost號稱“比賽奪冠的必備大殺器”，橫掃機器學習競賽罕逢敵手，堪稱機器學習算法中的新女王！

在涉及非結構化數據（圖像、文本等）的預測問題中，人工神經網絡顯著優于所有其他算法或框架。但當涉及到中小型結構/表格數據時，基于決策樹的算法現在被認為是最佳方法。而基于決策樹算法中最驚艷的，非XGBoost莫屬了。

打過Kaggle、天池、DataCastle、Kesci等國內外數據競賽平臺之后，一定對XGBoost的威力印象深刻。XGBoost號稱“比賽奪冠的必備大殺器”，橫掃機器學習競賽罕逢敵手。最近甚至有一位大數據/機器學習主管被XGBoost在項目中的表現驚艷到，盛贊其為“機器學習算法中的新女王”！

XGBoost最初由陳天奇開發。陳天奇是華盛頓大學計算機系博士生，研究方向為大規模機器學習。他曾獲得KDD CUP 2012 Track 1第一名，并開發了SVDFeature，XGBoost，cxxnet等著名機器學習工具，是Distributed (Deep) Machine Learning Common的發起人之一。

XGBoost實現了高效、跨平臺、分布式gradient boosting (GBDT, GBRT or GBM) 算法的一個庫，可以下載安裝并應用于C++，Python，R，Julia，Java，Scala，Hadoop等。目前Github上超過15700星、6500個fork。

項目主頁：

https://XGBoost.ai/

XGBoost是什么

XGBoost全稱：eXtreme Gradient Boosting，是一種基于決策樹的集成機器學習算法，使用梯度上升框架，適用于分類和回歸問題。優點是速度快、效果好、能處理大規模數據、支持多種語言、支持自定義損失函數等，不足之處是因為僅僅推出了不足5年時間，需要進一步的實踐檢驗。

XGBoost選用了CART樹，數學公式表達XGBoost模型如下：

K是樹的數量，F表示所有可能的CART樹，f表示一棵具體的CART樹。這個模型由K棵CART樹組成。

模型的目標函數，如下所示：

XGBoost具有以下幾個特點：

靈活性：支持回歸、分類、排名和用戶定義函數

跨平臺：適用于Windows、Linux、macOS，以及多個云平臺

多語言：支持C++, Python, R, Java, Scala, Julia等

效果好：贏得許多數據科學和機器學習挑戰。用于多家公司的生產

云端分布式：支持多臺計算機上的分布式訓練，包括AWS、GCE、Azure和Yarn集群。可以與Flink、Spark和其他云數據流系統集成

下圖顯示了基于樹的算法的發展歷程：

決策樹：由一個決策圖和可能的結果（包括資源成本和風險）組成，用來創建到達目標的規劃。

Bagging：是一種集合元算法，通過多數投票機制將來自多決策樹的預測結合起來，也就是將弱分離器 f_i(x) 組合起來形成強分類器 F(x) 的一種方法

隨機森林：基于Bagging算法。隨機選擇一個包含多種特性的子集來構建一個森林，或者決策樹的集合

Boosting：通過最小化先前模型的誤差，同時增加高性能模型的影響，順序構建模型

梯度上升：對于似然函數，要求最大值，叫做梯度上升

XGBoost：極端梯度上升，XGBoost是一個優化的分布式梯度上升庫，旨在實現高效，靈活和跨平臺

為什么XGBoost能橫掃機器學習競賽平臺？

下圖是XGBoost與其它gradient boosting和bagged decision trees實現的效果比較，可以看出它比R, Python，Spark，H2O的基準配置都快。

XGBoost和Gradient Boosting Machines（GBMs）都是集合樹方法，使用梯度下降架構來提升弱學習者（通常是CART）。而XGBoost通過系統優化和算法增強改進了基礎GBM框架，在系統優化和機器學習原理方面都進行了深入的拓展。

系統優化：

并行計算：

由于用于構建base learners的循環的可互換性，XGBoost可以使用并行計算實現來處理順序樹構建過程。

外部循環枚舉樹的葉節點，第二個內部循環來計算特征，這個對算力要求更高一些。這種循環嵌套限制了并行化，因為只要內部循環沒有完成，外部循環就無法啟動。

因此，為了改善運行時，就可以讓兩個循環在內部交換循環的順序。此開關通過抵消計算中的所有并行化開銷來提高算法性能。

Tree Pruning：

GBM框架內樹分裂的停止標準本質上是貪婪的，取決于分裂點的負損失標準。XGBoost首先使用'max_depth'參數而不是標準，然后開始向后修剪樹。這種“深度優先”方法顯著的提高了計算性能。

硬件優化：

該算法旨在有效利用硬件資源。這是通過在每個線程中分配內部緩沖區來存儲梯度統計信息來實現緩存感知來實現的。諸如“核外”計算等進一步增強功能可優化可用磁盤空間，同時處理不適合內存的大數據幀。

算法增強：

正則化：

它通過LASSO（L1）和Ridge（L2）正則化來懲罰更復雜的模型，以防止過擬合。

稀疏意識：

XGBoost根據訓練損失自動“學習”最佳缺失值并更有效地處理數據中不同類型的稀疏模式。

加權分位數草圖：

XGBoost采用分布式加權分位數草圖算法，有效地找到加權數據集中的最優分裂點。

交叉驗證：

該算法每次迭代時都帶有內置的交叉驗證方法，無需顯式編程此搜索，并可以指定單次運行所需的增強迭代的確切數量。

為了測試XGBoost到底有多快，可以通過Scikit-learn的'Make_Classification'數據包，創建一個包含20個特征（2個信息和2個冗余）的100萬個數據點的隨機樣本。

下圖為邏輯回歸，隨機森林，標準梯度提升和XGBoost效率對比：

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4838

瀏覽量
107849
機器學習

機器學習

+關注

關注
66

文章
8554

瀏覽量
136986
大數據

大數據

+關注

關注
64

文章
9065

瀏覽量
143784

原文標題：陳天奇做的XGBoost為什么能橫掃機器學習競賽平臺？

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉載請注明出處。

評論

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视