国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺析特征抽取的經典算法PCA

格創東智 ? 2019-01-07 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者:格創東智OT團隊(轉載請注明作者及來源)


之前格物匯的文章給大家介紹過,隨著近幾年大數據技術的普及,企業可以獲取海量數據,但是這些海量數據帶給我們更多信息的同時,也帶來了更多的噪音和異常數據,如何降維去噪成為很多企業關注的焦點。而特征抽取和特征選擇都是降維的重要方法,針對于the curse of dimensionality(維數災難),都可以達到降維的目的,但是這兩種方法有所不同。

>>>>

特征抽取(Feature Extraction)

Creatting a subset ofnew features by combinations of the exsiting features.也就是說,特征抽取后的新特征是原來特征的一個映射。

>>>>

特征選擇(Feature Selection)

choosing a subset of allthe features(the ones more informative。也就是說,特征選擇后的特征是原來特征的一個子集。

特征抽取是如何對數據進行變換的呢?其兩個經典的方法:主成分分析(Principle Components Analysis ,PCA)和線性評判分析(LinearDiscriminant Analysis,LDA)給出了解答,今天我們就先來看一下什么是主成分分析。

什么是主成分分析

主成分分析(principal component analysis),PCA是其縮寫。此方法是一種無監督線性轉換技術,其目標是找到數據中最主要的元素和結構,去除噪音和冗余,將原有的復雜數據降維,揭露出隱藏在復雜數據背后的簡單結構。

主成分分析就是試圖在力保數據信息丟失最少的原則下,對這種多變量的數據表進行最佳綜合簡化。這些綜合指標就稱為主成分,也就是說,對高維變量空間進行降維處理,從線性代數角度來看,PCA目標是找到一組新正交基去重新描述得到的數據空間,這些新維度就是主成分。

PCA的原理

我們現在來看一下PCA算法是如何實現的,我們通過一個具體實例來理解,假設我們有這樣一些標準化后的數據:[-1,-2],[-1,0],……,[2,1],[0,1]。我們寫成向量的形式如下:

1.jpg

我們還可以在二維坐標系中畫出來:

2.jpg

PCA主要的目的是降維簡化數據,這些數據本就是二維,想要再降維則需要重新找一個方向,并把這些點映射到這個方向上(降到1維)。試想,怎么才能找到這個方向,且不損失大部分信息呢?PCA的做法是,找到新映射的方法需要滿足如下兩個原則:

在新映射的方向上每個數據的映射點方差盡可能大。因為方差大的數據所包含的信息量越大。

新映射的方向應彼此正交,這樣映射出的坐標點選取才更有意義。


尋找新映射也可以看作基變換,我們可以不斷旋轉基,尋找滿足上面兩個原則的情況。如下圖所示,中間的映射方向圖里數據在新基上映射點的方差就比右邊圖映射點方差大的多。而方差大則表示該數據在該方向上含有的信息量多,反之另一個新基的方向上含有的信息量就少的多。如果這個方向上的信息量非常少,即使舍去也無傷大雅,我們就可以考慮將其舍去,實現降維的操作。

3.jpg


新基可以看成是由以前標準直角坐標系旋轉而成,在線性代數中,這樣的坐標軸旋轉操作可以通過原本直角坐標系坐標乘轉換矩陣得到:

4.jpg

所以我們就將問題轉換成找轉移矩陣W上,如何去求W呢?我們希望降維后的數據要盡可能的與原數據非常接近(不丟失信息)。我們可以計算轉換后的坐標Z與轉換之前的坐標X之間的距離:

5.jpg

因此為了讓轉換距離最小,我們可以將問題等價轉換成:

6.jpg

由于中間推導過程較為復雜,故在此省略,最后求解推導的結果為:

7.jpg

這不正是特征值的定義公式嗎?所以只需要對協方差矩陣進行特征值分解,并將求得的特征值排序,取前N(PCA所要降低的目標維度)個特征值構成的向量W,即為PCA的解。

PCA優缺點


優點

(1)它是無監督學習,只與數據相關,無參數限制。

(2)通過PCA降維,可以達到簡化模型和對數據進行壓縮的效果。同時最大程度的保持了原有數據的信息。

(3)各主成分之間正交,可消除原始數據成分間的相互影響

(4)計算方法簡單,易于在計算機上實現。

缺點

(1)如果用戶對觀測對象有一定的先驗知識,掌握了數據的一些特征,卻無法通過參數化等方法對處理過程進行干預,可能會得不到預期的效果,效率也不高

(2)貢獻率小的主成分往往可能含有對樣本差異的重要信息

好了,今天格物匯的內容就到這里,近期我們還將介紹特征抽取的另一種方法LDA(線性評判分析),敬請期待。



聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能制造
    +關注

    關注

    48

    文章

    6236

    瀏覽量

    79936
  • 工業互聯網
    +關注

    關注

    28

    文章

    4394

    瀏覽量

    96272
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學科的技能,涵蓋數學基礎、編程能力、算法理論、工程實踐以及業務理解等多個方面。 以下是具體技能及學習建議: 線性代數核心內容:矩陣運算、特征值分解、向量空間等。應用場
    發表于 02-27 10:53

    探索PCA9547:8通道I2C總線復用器的設計奧秘

    探索PCA9547:8通道I2C總線復用器的設計奧秘 在電子設計領域,I2C總線是一種廣泛應用的通信協議,而PCA9547作為一款8通道I2C總線復用器,為我們在多設備通信中提供了強大的解決方案
    的頭像 發表于 02-26 17:45 ?1004次閱讀

    探索PCA9665/PCA9665A:Fm+并行總線到I2C總線控制器的深度解析

    探索PCA9665/PCA9665A:Fm+并行總線到I2C總線控制器的深度解析 在電子設計領域,總線控制器扮演著至關重要的角色,它能夠實現不同類型總線之間的通信,為系統的集成和擴展提供了強大的支持
    的頭像 發表于 01-29 15:00 ?173次閱讀

    PID控制的算法

    當中,PID控制算法又是最簡單,最能體現反饋思想的控制算法,可謂經典中的經典經典的未必是復雜的,經典
    發表于 01-23 08:18

    PCA9534APWR 具有中斷和配置寄存器的 8 位 2.3V 至 5.5V I2C/SMBus I/O 擴展器

    /O擴展器PCA9534APWR特征●低功耗設計,待機電流最大值1μA,工作電壓2.3V-5.5V,I/O端口耐受5V電壓,適配多電壓系統●支持400kHz快速I
    的頭像 發表于 01-22 11:43 ?404次閱讀
    <b class='flag-5'>PCA</b>9534APWR   具有中斷和配置寄存器的 8 位 2.3V 至 5.5V I2C/SMBus I/O 擴展器

    深入剖析PCA82C250 CAN控制器接口:性能、應用與設計要點

    深入剖析PCA82C250 CAN控制器接口:性能、應用與設計要點 在汽車電子以及工業自動化等領域,控制器局域網(CAN)由于其可靠性、實時性和抗干擾能力,得到了廣泛應用。而PCA82C250作為
    的頭像 發表于 12-30 16:30 ?452次閱讀

    PCA9545A:低電壓4通道I2C和SMBus開關的深度解析

    PCA9545A:低電壓4通道I2C和SMBus開關的深度解析 引言 在電子設計領域,I2C和SMBus接口的應用極為廣泛。PCA9545A作為一款低電壓4通道I2C和SMBus開關,憑借其出色
    的頭像 發表于 12-29 09:30 ?370次閱讀

    PCA9548A:低電壓8通道I2C開關的技術解析與應用指南

    PCA9548A:低電壓8通道I2C開關的技術解析與應用指南 在電子設計領域,I2C總線的應用極為廣泛,而PCA9548A作為一款低電壓8通道I2C開關,為解決I2C總線應用中的諸多問題提供了有效
    的頭像 發表于 12-27 09:45 ?837次閱讀

    PCA9543A:2通道I2C總線開關的深度解析與應用指南

    PCA9543A:2通道I2C總線開關的深度解析與應用指南 在電子設計領域,I2C總線的應用極為廣泛,而PCA9543A作為一款2通道I2C總線開關,憑借其獨特的性能和豐富的功能,在眾多應用場景中發
    的頭像 發表于 12-26 11:30 ?440次閱讀

    探索PCA9955BTW - ARD評估板:開啟LED驅動設計新征程

    探索PCA9955BTW - ARD評估板:開啟LED驅動設計新征程 引言 在電子設計領域,LED驅動的性能和靈活性至關重要。NXP Semiconductors推出的PCA
    的頭像 發表于 12-25 10:10 ?769次閱讀

    PCA9617ADP - ARD評估板:功能、配置與使用指南

    PCA9617ADP - ARD評估板:功能、配置與使用指南 在電子設計領域,評估板是驗證和開發新器件的重要工具。今天,我們就來深入了解一下NXP Semiconductors推出
    的頭像 發表于 12-25 09:30 ?656次閱讀

    PCA9958HN - ARD評估板:24通道SPI總線LED驅動評估利器

    PCA9958HN - ARD評估板:24通道SPI總線LED驅動評估利器 在電子設計領域,LED驅動的評估和設計是一個重要的環節。NXP的PCA9958HN - ARD評估板為工程師們提供了一個
    的頭像 發表于 12-24 11:50 ?619次閱讀

    PCA9958HN-ARD】GUI工具的使用

    一、說明 PCA9958HN-ARD評估板是可以通過NXP官方的GUI上位機來進行控制的,但是需要使用另外的官方指定的MCU開發板。 例如下圖就是通過LPC55S69-EVKMCU板來演示
    發表于 06-29 10:07

    同步電機失步淺析

    純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:同步電機失步淺析.pdf【免責聲明】本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容!
    發表于 06-20 17:42

    RTC芯片有Linux PCA2131驅動程序嗎?

    RTC 芯片有 Linux PCA2131驅動程序嗎? 1) 如果沒有,我可以使用任何兼容的驅動程序來驅動這個 RTC 芯片嗎? 2) 如果是,我在哪里可以找到它?
    發表于 03-31 06:22