數(shù)據(jù)挖掘中應(yīng)用較多的技術(shù)機器學(xué)習(xí)。
機器學(xué)習(xí)主流算法包括三種:關(guān)聯(lián)分析、分類分析、聚類分析。本文主要介紹分類分析、聚類分析。

圖片來源:來自網(wǎng)絡(luò)
一、分類分析
(1)分類分析概念 分類分析是指算法通過學(xué)習(xí)得出“某種分類依據(jù)”,該分類依據(jù)可以判斷一個新事物的類別(含個人理解)。
(2)分類分析過程 分類分析包括兩個過程:
1)通過大量樣本的訓(xùn)練,使算法可以建立準(zhǔn)確率超過某值的分類依據(jù)。
2)算法根據(jù)分類依據(jù)對新事物分類。
(3)分類分析過程與學(xué)生學(xué)習(xí)過程對比
1)學(xué)生本身具有學(xué)習(xí)能力,但不會做某一類型的題。這類似于機器學(xué)習(xí)算法具有學(xué)習(xí)能力,但不會對某一事物進行分類。
2)學(xué)生在學(xué)習(xí)過程中需要做大量習(xí)題,而且還需要根據(jù)標(biāo)準(zhǔn)答案確定每道題的正誤,學(xué)生在該過程逐步調(diào)整其知識體系。這類似于機器學(xué)習(xí)算法需要通過大量樣本的訓(xùn)練,機器學(xué)習(xí)的每個樣本均包含輸入和輸出,機器學(xué)習(xí)可以通過將樣本輸入其建立模型得出的輸出與樣本輸出(樣本輸出類似標(biāo)準(zhǔn)答案)進行對比,判斷其建立模型的準(zhǔn)確性,不斷調(diào)整其建立的模型。
3)當(dāng)學(xué)生掌握所學(xué)的知識后,其就具備了在考試中解答新的同類型問題的能力。這類似于機器學(xué)習(xí)算法通過其建立的模型對新事物分類。
(4)分類分析算法
常見的分類分析算法包括:決策樹、K近鄰法(kNN)、樸素貝葉斯、感知機、支持向量機(SVM)。
更高級的分類分析方法包括:邏輯斯諦回歸(Logistic回歸)、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)路等。
二、聚類分析
(1)聚類分析概念
聚類分析是將一群物理對象劃分成相似的對象集合的過程。在聚類分析中,各個聚類內(nèi)的數(shù)據(jù)對象是相似的,不同聚類間的對象是相異的。 
圖片來源:來自網(wǎng)絡(luò)
(2)聚類分析與分類分析對比
與分類分析類似,聚類分析的目的也是將樣本劃分至不同的子集。兩者不同的是:分類分析需要大量樣本訓(xùn)練,分類分析的算法在學(xué)習(xí)過程中需被告知每個樣本的類別;聚類分析不需要訓(xùn)練樣本,聚類分析的算法學(xué)習(xí)的數(shù)據(jù)是沒有指導(dǎo)信息的數(shù)據(jù),聚類分析的算法通過其內(nèi)部機制對樣本進行劃分,將“它”認為同類的數(shù)據(jù)進行聚類。
(3)聚類分析與日常事物分類方式對比 聚類分析的分類方式使其對事物的分類方式可能有別于日常生活中對事物的劃分。
例如,日常生活中如果對香蕉、草莓、木塊分類,人們可能更容易將香蕉和草莓劃分為水果一類,將木塊劃分為另外的類別;但聚類分析算法可能將香蕉和木塊劃分為一類,將草莓劃分為另外的類別,分類依據(jù)是香蕉和木塊都是黃色的。

圖片來源:來自網(wǎng)絡(luò)
(4)聚類分析方法
聚類分析的常用方法包括:K-means算法、K中心點算法、層次聚類算法等。
審核編輯:劉清
-
SVM
+關(guān)注
關(guān)注
0文章
154瀏覽量
33694 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8553瀏覽量
136929 -
神經(jīng)網(wǎng)路
+關(guān)注
關(guān)注
0文章
8瀏覽量
2749
原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(25)——機器學(xué)習(xí)之分類分析、聚類分析
文章出處:【微信號:行業(yè)學(xué)習(xí)與研究,微信公眾號:行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
機器學(xué)習(xí)特征工程:分類變量的數(shù)值化處理方法
如何使用機器人分析儀EtherCAT-Analyzer抓取主從站數(shù)據(jù)?
半導(dǎo)體“基礎(chǔ)FMEA和家族?FMEA”分析的詳解;
如何深度學(xué)習(xí)機器視覺的應(yīng)用場景
【新啟航】深度學(xué)習(xí)在玻璃晶圓 TTV 厚度數(shù)據(jù)智能分析中的應(yīng)用
如何分析負載特性來調(diào)整報警閾值?
XKCON祥控輸煤皮帶智能機器人巡檢系統(tǒng)對監(jiān)測數(shù)據(jù)進行挖掘分析
光伏電站智能分析決策的系統(tǒng)化應(yīng)用工具
大模型在半導(dǎo)體行業(yè)的應(yīng)用可行性分析
基本電路分析(經(jīng)典學(xué)習(xí)指導(dǎo)系列)
電阻器在導(dǎo)電材料上之分類
TDengine 發(fā)布時序數(shù)據(jù)分析 AI 智能體 TDgpt,核心代碼開源
機器學(xué)習(xí)之分類分析與聚類分析
評論