伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

<center id="k2ypy"><strong id="k2ypy"></strong></center>

<rp id="k2ypy"></rp>

<rp id="k2ypy"><acronym id="k2ypy"></acronym></rp><rp id="k2ypy"><acronym id="k2ypy"></acronym></rp>

<fieldset id="k2ypy"><optgroup id="k2ypy"></optgroup></fieldset>

<samp id="k2ypy"><acronym id="k2ypy"></acronym></samp>

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

建立決策樹的邏輯

一個小故事

zenRRan二十出頭了，到了婚配的年齡啦。又因為家是名門望族，所以一堆人搶著想來應聘配偶的職位。但是zenRRan比較挑剔，必須達到他的要求才能有機會成為他的另一半，要求為：

1. 性別女，非女性不要

于是刷刷刷走了一半人，剩下的全部為女性。

2.身高必須要在150-165cm

于是又走了一堆人，剩下的為160-165cm之間的女生。

3.性格要溫柔賢惠

聽到這些，又走了一些人，最后留下的極為最后的應聘候選人。

上述過程可以用樹來表示：

像上面的這樣的二叉樹狀決策在我們生活中很常見，而這樣的選擇方法就是決策樹。機器學習的方法就是通過平時生活中的點點滴滴經驗轉化而來的。

建立決策樹的邏輯

正如上述樹狀圖所示，我們最終會通過特征：

性別，身高，性格

得到了4種分類結果，都存在于葉子節點。

非女生，身高不符合的女生，身高符合性格不符合的女生，都符合的最佳候選人。

現在我們來回想下上面的建立決策的流程：

首先在一群給定數據（應聘者）中，我們先通過一個特征（性別）來進行二分類。當然選取這個特征也是根據實際情況而定的，比如zenRRan選取第一個條件為性別的原因是，來的男的太多了，比例占的有點大，所以先給他分成類放到一邊，剩下的更加好分類而已。

然后，對葉子節點（那些還想繼續分類的節點們）繼續進行上述的流程。

那么怎么選取特征作為當前的分類依據呢？有兩種方法：

信息熵和基尼系數。

信息熵

熵這個概念想必大家都不陌生，熵用來表示數據的確定性程度。研究一個詞，就要從他的來源說起，熵，來自熱動力學，表示原子或者一個事物的穩定程度，溫度越高，原子越活躍，越不穩定；反而溫度越低，就越穩定，越保持不動。所以慢慢的這個概念被用到各個方向，也就有了新的定義詞匯，但是它的本意沒變，就是穩定程度大小的表示。

那么在決策樹里面，我們用的是一種熵，信息熵，來表示類別的穩定程度。

公式為：

注：p為一個類的占比

什么意思呢？具體用數字表示下：

比如一個分類結果由三個類組成，占比為1/3 1/31/3，那么它們的信息熵為:

如果占比為1/10 2/10 7/10，那么它的信息熵為：

那再舉一個極端情況，也就是我們想要得到的類，只包含一種情況，其他的比例為0，那么比如占比情況為：1 0 0，那么它的信息熵為：

我們會發現一個分類結果里，里面的類別比例越是接近，信息熵也就越大，反之越是趨向于一個值，越是小，會達到0。

如果將所有的情況考慮在內的話，就能繪成一個圖（為了好畫，以該分好的類別里有兩種事物為例）：

我們會發現，當占比為0.5的時候，也就是另一個事物的占比也是0.5的時候信息熵最高，當傾向于一個事物的時候，信息熵最小，無限接近并達到0。

為什么都占比一樣的時候信息熵最大呢？也就是說最不穩定呢？因為當每個事物都占比一樣的時候，一個小事物進來，不清楚它到底屬于哪一類；如果只有一類事物或者一類事物居多數，那么也就比較明確該屬于哪類，也就穩定，確定了。

那么怎么用呢？

我們通過計算機分類，因為有很多種分類情況，不是每一次分類都是直接將同一類分到一個類別里，而是將該分好的兩個類的信息熵總和最小為依據，不斷地通過暴力尋找最佳選擇。然后遞歸進行對分好類的數據進行再分類。

基尼系數

基尼系數和信息熵在這里具有同樣的性質。先看看它的公式：

公式看不出什么特色之處，就繼續用數字展示下：

比如依然是三分類，類別占比為1/3 1/3 1/3，基尼系數為:

類別占比為1/10 2/10 7/10，基尼系數為：

如果是極端情況下占比為1 0 0，那么基尼系數為;

我們根據公式其實就能看出來，平方的函數為凸函數，而該公式在都相等的時候值最大。

代碼實現

再重說下流程：

通過對每個特征進行嘗試分類，記錄當前分類最小的信息熵（或基尼系數）的特征為當前分類結果。

選取一些點，初始化數據：

X為二維平面的數據點，Y為類別。

數據點分布情況：

信息熵函數：

基尼系數函數：

二者使用一個即可。

下面是一個分類核心的流程：

文字描述為：

對數據點的特征0維進行嘗試分類，先按照0維數據排序，然后取每相鄰的中點值，然后以0維該值分界線，處于分界線兩側的數據分別求信息熵（或基尼系數），如果比之前的小，這就保存該值和當前維度。然后選取第1維進行相同操作，最終的最小信息熵（或基尼系數）最小對應的值為本次分類的結果。

但是這個僅僅是一層分類，如果還子節點還有要分類的數據，繼續上述操作即可。

分類代碼：

分類效果流程圖：

決策樹第一層分類結果為：

當前線為最佳值，1維的數據就是分過的，但是沒有當前的值好，也就沒顯示。

現在已經分出了兩類，左邊的紅色和右邊的綠色+藍色。那么還要對上述的右邊進行分類，獲取該數據，并且繼續進行分類，分類流程圖為：

最終得出的分類結果為上述兩條線。其中粉色為第一層分類，紫色為第二層分類。

批判性思維看決策樹

看到上述的分類結果，其實你心里也想到了決策樹的缺點了，就是分類總是橫平豎直的，不能是曲線。

比如

該四個數據的分類最佳理想條件下應該為上述紫色線條，但是決策樹的結果為;

如果存在數據在：

明明應該屬于藍色點的，但是被劃分到紅色點里。

所以可以看出，決策樹對數據的要求是是苛刻的。

另一個問題是，決策樹的學習問題，從上述代碼實現過程能夠看出來，可以說是暴力求解了。

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

二叉樹

二叉樹

+關注

關注
0

文章
74

瀏覽量
12985
機器學習

機器學習

+關注

關注
67

文章
8560

瀏覽量
137166
決策樹

決策樹

+關注

關注
3

文章
96

瀏覽量
14095

原文標題：【機器學習】決策樹的理論與實踐

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

評論

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视