国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

決策樹C4.5算法屬性取值優化研究

大小:0.36 MB 人氣: 2017-12-12 需要積分:1

  決策樹算法是一種最簡單、最直接、最有效的文本分類算法。最早的決策樹算法是ID3算法,于1986年由Quinlan提出,該算法是一種基于信息熵的決策樹分類算法。由于該算法是以信息熵作為屬性選擇的標準,偏向于選擇屬性取值較多的屬性,而屬性取值較多的屬性往往分類的貢獻不大。因此,于1993年Quinlan在ID3算法的基礎上又提出了一種改進算法,即C4.5算法。該算法采用信息增益率作為屬性選擇的標準,繼承了ID3算法的所有優點,克服了ID3算法中偏向于選擇屬性取值較多的屬性作為測試屬性的不足,同時還能對連續屬性與未知屬性進行處理,在剪枝方面也有很大的改進。

  C4.5算法作為經典的決策樹分類算法,己被廣泛的應用到各個領域。但其仍然存在以下不足之處:1)在計算信息增益的過程中(包括:分類所需信息量、信息熵、分割信息量)涉及的復雜的對數運算,計算機每一次計算都需要調用庫函數,增大了生成決策樹所需的時間開銷;2)生成決策樹中分支數量過多,部分分支還能進行合并,進一步精簡生成決策樹的結構。

  本文針對生成決策樹分支數量過多的不足,提出了一種新的屬性取值優化方法,并用實例分析驗證了該方法的有效性。
?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?