国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于樹的方法和神經網絡方法

新機器視覺 ? 來源:新機器視覺 ? 作者:新機器視覺 ? 2022-07-27 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

樹模型和神經網絡,像一枚硬幣的兩面。在某些情況下,樹模型的性能甚至優于神經網絡。

由于神經網絡的復雜性,它們常常被認為是解決所有機器學習問題的「圣杯」。而另一方面,基于樹的方法并未得到同等重視,主要原因在于這類算法看起來很簡單。然而,這兩種算法看似不同,卻像一枚硬幣的正反面,都很重要。

樹模型 VS 神經網絡

基于樹的方法通常優于神經網絡。本質上,將基于樹的方法和基于神經網絡的方法放在同一個類別中是因為,它們都通過逐步解構來處理問題,而不是像支持向量機或 Logistic 回歸那樣通過復雜邊界來分割整個數據集。

很明顯,基于樹的方法沿著不同的特征逐步分割特征空間,以優化信息增益。不那么明顯的是,神經網絡也以類似的方式處理任務。每個神經元監視特征空間的一個特定部分(存在多種重疊)。當輸入進入該空間時,某些神經元就會被激活。

神經網絡以概率的視角看待這種逐段模型擬合 (piece-by-piece model fitting),而基于樹的方法則采用確定性的視角。不管怎樣,這兩者的性能都依賴于模型的深度,因為它們的組件與特征空間的各個部分存在關聯。

包含太多組件的模型(對于樹模型而言是節點,對于神經網絡則是神經元)會過擬合,而組件太少的模型根本無法給出有意義的預測。(二者最開始都是記憶數據點,而不是學習泛化。)

要想更直觀地了解神經網絡是如何分割特征空間的,可閱讀這篇介紹通用近似定理的文章:https://medium.com/analytics-vidhya/you-dont-understand-neural-networks-until-you-understand-the-universal-approximation-theory-85b3e7677126。

雖然決策樹有許多強大的變體,如隨機森林、梯度提升、AdaBoost 和深度森林,但一般來說,基于樹的方法本質上是神經網絡的簡化版本。

基于樹的方法通過垂直線和水平線逐段解決問題,以最小化熵(優化器和損失)。神經網絡通過激活函數來逐段解決問題。

基于樹的方法是確定性的,而不是概率性的。這帶來了一些不錯的簡化,如自動特征選擇。

決策樹中被激活的條件節點類似于神經網絡中被激活的神經元(信息流)。

神經網絡通過擬合參數對輸入進行變換,間接指導后續神經元的激活。決策樹則顯式地擬合參數來指導信息流。(這是確定性與概率性相對應的結果。)

信息在兩個模型中的流動相似,只是在樹模型中的流動方式更簡單。

樹模型的 1 和 0 選擇 VS 神經網絡的概率選擇

當然,這是一個抽象的結論,甚至可能是有爭議的。誠然,建立這種聯系有許多障礙。不管怎樣,這是理解基于樹的方法何時以及為什么優于神經網絡的重要部分。

對于決策樹而言,處理表格或表格形式的結構化數據是很自然的。大多數人都同意用神經網絡執行表格數據的回歸和預測屬于大材小用,所以這里做了一些簡化。選擇 1 和 0,而不是概率,是這兩種算法之間差異的主要根源。因此,基于樹的方法可成功應用于不需要概率的情況,如結構化數據。

例如,基于樹的方法在 MNIST 數據集上表現出很好的性能,因為每個數字都有幾個基本特征。不需要計算概率,這個問題也不是很復雜,這就是為什么設計良好的樹集成模型性能可以媲美現代卷積神經網絡,甚至更好。

通常,人們傾向于說「基于樹的方法只是記住了規則」,這種說法是對的。神經網絡也是一樣,只不過它能記住更復雜的、基于概率的規則。神經網絡并非顯式地對 x》3 這樣的條件給出真 / 假的預測,而是將輸入放大到一個很高的值,從而得到 sigmoid 值 1 或生成連續表達式。

另一方面,由于神經網絡非常復雜,因此使用它們可以做很多事情。卷積層和循環層都是神經網絡的杰出變體,因為它們處理的數據往往需要概率計算的細微差別。

很少有圖像可以用 1 和 0 建模。決策樹值不能處理具有許多中間值(例如 0.5)的數據集,這就是它在 MNIST 數據集上表現很好的原因,在 MNIST 中,像素值幾乎都是黑色或白色,但其他數據集的像素值不是(例如 ImageNet)。類似地,文本有太多的信息和太多的異常,無法用確定性的術語來表達。

這也是神經網絡主要用于這些領域的原因,也是神經網絡研究在早期(21 世紀初之前)停滯不前的原因,當時無法獲得大量圖像和文本數據。神經網絡的其他常見用途僅限于大規模預測,比如 YouTube 視頻推薦算法,其規模非常大,必須用到概率。

任何公司的數據科學團隊可能都會使用基于樹的模型,而不是神經網絡,除非他們正在建造一個重型應用,比如模糊 Zoom 視頻的背景。但在日常業務分類任務上,基于樹的方法因其確定性特質,使這些任務變得輕量級,其方法與神經網絡相同。

在許多實際情況下,確定性建模比概率建模更自然。例如,預測用戶是否從某電商網站購買一樣商品,這時樹模型是很好的選擇,因為用戶天然地遵循基于規則的決策過程。用戶的決策過程可能看起來像這樣:

我以前在這個平臺上有過愉快的購物經歷嗎?如果有,繼續。

我現在需要這件商品嗎?(例如,冬天我應該買太陽鏡和泳褲嗎?)如果是,繼續。

根據我的用戶統計信息,這是我有興趣購買的產品嗎?如果是,繼續。

這個東西太貴嗎?如果沒有,繼續。

其他顧客對這個產品的評價是否足夠高,讓我可以放心地購買它?如果是,繼續。

一般來說,人類遵循基于規則和結構化的決策過程。在這些情況下,概率建模是不必要的。

結論

最好將基于樹的方法視為神經網絡的縮小版本,以更簡單的方式進行特征分類、優化、信息流傳遞等。

基于樹的方法和神經網絡方法在用途的主要區別在于確定性(0/1)與概率性數據結構。使用確定性模型可以更好地對結構化(表格)數據進行建模。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107750
  • 函數
    +關注

    關注

    3

    文章

    4417

    瀏覽量

    67501
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136929

原文標題:機器學習算法終極對比:樹模型VS神經網絡

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經網絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經網絡的實現。什么是神經網絡神經網絡的核心思想是模仿生物神經系統的結構,特別是大腦中神經
    的頭像 發表于 12-17 15:05 ?323次閱讀
    <b class='flag-5'>神經網絡</b>的初步認識

    自動駕駛中常提的卷積神經網絡是個啥?

    在自動駕駛領域,經常會聽到卷積神經網絡技術。卷積神經網絡,簡稱為CNN,是一種專門用來處理網格狀數據(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像素排列成的二維網格。
    的頭像 發表于 11-19 18:15 ?2072次閱讀
    自動駕駛中常提的卷積<b class='flag-5'>神經網絡</b>是個啥?

    4種神經網絡不確定性估計方法對比與代碼實現

    患者血壓,假設輸出是120/80這樣的正常值,表面看沒問題。但如果模型其實對這個預測很不確定呢?這時候光看數值就不夠了。神經網絡有幾種方法可以在給出預測的同時估計不
    的頭像 發表于 11-10 10:41 ?487次閱讀
    4種<b class='flag-5'>神經網絡</b>不確定性估計<b class='flag-5'>方法</b>對比與代碼實現

    NMSIS神經網絡庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經網絡內核,旨在最大限度地提高 Nuclei N 處理器內核上的神經網絡的性能并最??大限度地減少其內存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發表于 10-29 06:08

    在Ubuntu20.04系統中訓練神經網絡模型的一些經驗

    本帖欲分享在Ubuntu20.04系統中訓練神經網絡模型的一些經驗。我們采用jupyter notebook作為開發IDE,以TensorFlow2為訓練框架,目標是訓練一個手寫數字識別的神經網絡
    發表于 10-22 07:03

    CICC2033神經網絡部署相關操作

    在完成神經網絡量化后,需要將神經網絡部署到硬件加速器上。首先需要將所有權重數據以及輸入數據導入到存儲器內。 在仿真環境下,可將其存于一個文件,并在 Verilog 代碼中通過 readmemh 函數
    發表于 10-20 08:00

    液態神經網絡(LNN):時間連續性與動態適應性的神經網絡

    1.算法簡介液態神經網絡(LiquidNeuralNetworks,LNN)是一種新型的神經網絡架構,其設計理念借鑒自生物神經系統,特別是秀麗隱桿線蟲的神經結構,盡管這種微生物的
    的頭像 發表于 09-28 10:03 ?1197次閱讀
    液態<b class='flag-5'>神經網絡</b>(LNN):時間連續性與動態適應性的<b class='flag-5'>神經網絡</b>

    神經網絡的并行計算與加速技術

    隨著人工智能技術的飛速發展,神經網絡在眾多領域展現出了巨大的潛力和廣泛的應用前景。然而,神經網絡模型的復雜度和規模也在不斷增加,這使得傳統的串行計算方式面臨著巨大的挑戰,如計算速度慢、訓練時間長等
    的頭像 發表于 09-17 13:31 ?1124次閱讀
    <b class='flag-5'>神經網絡</b>的并行計算與加速技術

    基于神經網絡的數字預失真模型解決方案

    在基于神經網絡的數字預失真(DPD)模型中,使用不同的激活函數對整個系統性能和能效有何影響?
    的頭像 發表于 08-29 14:01 ?3471次閱讀

    無刷電機小波神經網絡轉子位置檢測方法的研究

    MATLAB/SIMULINK工具對該方法進行驗證,實驗結果表明該方法在全程速度下效果良好。 純分享帖,點擊下方附件免費獲取完整資料~~~ *附件:無刷電機小波神經網絡轉子位置檢測方法
    發表于 06-25 13:06

    神經網絡專家系統在電機故障診斷中的應用

    摘要:針對傳統專家系統不能進行自學習、自適應的問題,本文提出了基于種經網絡專家系統的并步電機故障診斷方法。本文將小波神經網絡和專家系統相結合,充分發揮了二者故障診斷的優點,很大程度上降低了對電機
    發表于 06-16 22:09

    神經網絡RAS在異步電機轉速估計中的仿真研究

    眾多方法中,由于其結構簡單,穩定性好廣泛受到人們的重視,且已被用于產品開發。但是MRAS仍存在在低速區速度估計精度下降和對電動機參數變化非常敏感的問題。本文利用神經網絡的特點,使估計更為簡單、快速
    發表于 06-16 21:54

    基于FPGA搭建神經網絡的步驟解析

    本文的目的是在一個神經網絡已經通過python或者MATLAB訓練好的神經網絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe文件,(coe
    的頭像 發表于 06-03 15:51 ?1194次閱讀
    基于FPGA搭建<b class='flag-5'>神經網絡</b>的步驟解析

    NVIDIA實現神經網絡渲染技術的突破性增強功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經網絡渲染技術的突破性增強功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預覽版中增加神經網絡著色技術,讓開
    的頭像 發表于 04-07 11:33 ?1163次閱讀

    神經網絡壓縮框架 (NNCF) 中的過濾器修剪統計數據怎么查看?

    無法觀察神經網絡壓縮框架 (NNCF) 中的過濾器修剪統計數據
    發表于 03-06 07:10