資料介紹
聚類分析是將研究對象分為相對同質的群組的統計分析技術,聚類分析的核心就是發現有用的對象簇。K-means聚類算法由于具有出色的速度和良好的可擴展性,一直備受廣大學者的關注。然而,傳統的K-means算法,未考慮各個屬性對于最終聚類結果的影響差異性,這使得聚類的精度有一定的影響。針對上述問題,本文提出一種改進的特征加權算法。改進算法通過采用信息熵和ReliefF特征選擇算法對特征進行加權選擇,修正聚類對象間的距離函數,使算法達到更準確更高效的聚類效果。仿真實驗結果表明,與傳統的K-means算法相比,改進后的算法聚類結果穩定,聚類的精度有明顯提升。
數據挖掘是目前人工智能和數據庫領域研究的熱點問題,指從大量的數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。聚類分析現在已經成為數據挖掘領域中一個非常重要的研究方向。MacQueen 提出的K-means 算法是聚類分析中最常用的方法之一。它采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。該算法認為簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作為最終目標。K-means 算法假設樣本的每個特征對最終聚類的貢獻程度一樣,但在實際情況中某些特征在聚類的過程中起到很大的作用,而某些特征的作用卻很小,甚至對聚類過程沒有影響。
?
針對傳統K-means 算法的這一問題,學者們進行了大量研究,研究表明:通過對特征賦予不同的特征權值,能夠有效解決上述問題并提高聚類性能。目前,計算特征權重的算法有很多種:等人提出一種結合限制數據的特征權值量化函數,該函數通過用戶指定的限制數據進行特征權值量化并對不同的限制數據賦予不同的置信度,解決了限制數據分布不均勻和限制數據中可能包含不一致性的問題;LiJie 等人提出將針對分類問題的ReliefF 算法應用于聚類問題,通過ReliefF 算法計算特征權重值,并對各維特征進行加權,提高聚類的性能;Meng Qian 等人提出通過梯度下降技術最小化特征評估函數FLearning (w)為每個特征分配權重并進行加權,該算法采用遺傳算法和模擬退火算法的優點,減弱冗余特征的影響,解決了容易陷入局部最優解的問題。Songtao Shang 等人提出一種改進的基尼指數算法計算特征權重,該算法克服了原始Gini 的缺點,將條件概率與后驗概率結合,抑制訓練集不平衡時的影響。利用信息論中的信息熵計算特征權重并對各位特征加權,有效的解決了特征對聚類的影響。
綜上所述,為了提高傳統K-means 算法的聚類精度,國內外學者對K-means 算法進行了大量改進探索研究,并取得了一些階段性的成果。本文擬研究傳統K-means 算法在聚類過程中聚類對象的每個特征對聚類結果的貢獻度,使貢獻程度大的特征優先利用,理論上講可以有效提升K-means 算法聚類的準確率和精度。因此,本文提出將熵值法和ReliefF 特征選擇算法有機融合,通過采用信息熵和ReliefF 特征選擇算法對特征進行加權選擇,修正聚類對象間的距離函數,使算法達到更準確更高效的聚類效果。實驗結果表明,改進后的算法聚類結果穩定,且具有較高的準確率,達到預期目的。
- 基于特征和實例遷移的加權多任務聚類算法 3次下載
- 集成簇內和簇間距離的加權k-means聚類方法 1次下載
- 針對高維稀疏數據的可重疊子空間K-Means聚類算法 13次下載
- 基于距離和密度的并行二分K-means算法 17次下載
- 一種改進的聚類聯合相似度推薦算法 10次下載
- 如何使用多維網格空間進行改進K-means聚類算法資料概述 1次下載
- 基于改進k-means算法的MANET異常檢測方法 0次下載
- 基于聚類集成技術的在線特征選擇 0次下載
- 基于改進K_means聚類的欠定盲分離算法_柴文標 0次下載
- 特征加權和優化劃分的模糊C均值聚類算法 0次下載
- 混合細菌覓食和粒子群的k_means聚類算法 0次下載
- 基于最小生成樹的層次K_means聚類算法 5次下載
- K-means+聚類算法研究綜述
- 改進的k-means聚類算法在供電企業CRM中的應用
- 一種增強的K-means聚類算法在入侵檢測中的應用
- 基于K-means聚類算法的圖像分割 3.4k次閱讀
- 如何在 Python 中安裝和使用頂級聚類算法 1.2k次閱讀
- 10種頂流聚類算法Python實現(附完整代碼) 2.5k次閱讀
- 基于距離的聚類算法K-means的設計實現 3k次閱讀
- 基本的k-means算法流程 2w次閱讀
- PLC常用基本環節梯形圖和詳細文字說明詳細資料概述 1.1w次閱讀
- K-Means算法的簡單介紹 5.4k次閱讀
- 人工智能機器學習之K近鄰算法(KNN) 3.4k次閱讀
- Python無監督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述 3.2w次閱讀
- 一種基于MapReduce模型的并行化k-medoids聚類算法 6k次閱讀
- 基于密度DBSCAN的聚類算法 2.3w次閱讀
- k means聚類算法實例 1.6w次閱讀
- K-means的優缺點及改進 3.3w次閱讀
- k-means算法原理解析 8.9k次閱讀
- 關聯規則挖掘——Apriori算法的基本原理以及改進 9.8k次閱讀
下載排行
本周
- 1MDD品牌三極管MMBT3906數據手冊
- 2.33 MB | 次下載 | 免費
- 2MDD品牌三極管S9012數據手冊
- 2.62 MB | 次下載 | 免費
- 3聯想flex2-14D/15D說明書
- 4.92 MB | 次下載 | 免費
- 4收音環繞擴音機 AVR-1507手冊
- 2.50 MB | 次下載 | 免費
- 524Pin Type-C連接器設計報告
- 1.06 MB | 次下載 | 免費
- 6新一代網絡可視化(NPB 2.0)
- 3.40 MB | 次下載 | 免費
- 7MS1000TA 超聲波測量模擬前端芯片技術手冊
- 0.60 MB | 次下載 | 免費
- 8MS1022高精度時間測量(TDC)電路數據手冊
- 1.81 MB | 次下載 | 免費
本月
- 1愛華AIWA HS-J202維修手冊
- 3.34 MB | 37次下載 | 免費
- 2PC5502負載均流控制電路數據手冊
- 1.63 MB | 23次下載 | 免費
- 3NB-IoT芯片廠商的資料說明
- 0.31 MB | 22次下載 | 1 積分
- 4H110主板CPU PWM芯片ISL95858HRZ-T核心供電電路圖資料
- 0.63 MB | 6次下載 | 1 積分
- 5UWB653Pro USB口測距通信定位模塊規格書
- 838.47 KB | 5次下載 | 免費
- 6技嘉H110主板IT8628E_BX IO電路圖資料
- 2.61 MB | 4次下載 | 1 積分
- 7蘇泊爾DCL6907(即CHK-S007)單芯片電磁爐原理圖資料
- 0.04 MB | 4次下載 | 1 積分
- 8100W準諧振反激式恒流電源電路圖資料
- 0.09 MB | 2次下載 | 1 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935137次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191439次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183353次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81602次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73822次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65991次下載 | 10 積分
電子發燒友App





創作
發文章
發帖
提問
發資料
發視頻
上傳資料賺積分
評論