国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一文帶你快速讀懂支持向量機 SVM 算法

h1654155999.2342 ? 來源:博客園 ? 作者: JerryLead ? 2021-08-26 15:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

簡介

支持向量機基本上是最好的有監督學習算法了。最開始接觸SVM是去年暑假的時候,老師要求交《統計學習理論》的報告,那時去網上下了一份入門教程,里面講的很通俗,當時只是大致了解了一些相關概念。

這次斯坦福提供的學習材料,讓我重新學習了一些SVM知識。我看很多正統的講法都是從VC 維理論和結構風險最小原理出發,然后引出SVM什么的,還有些資料上來就講分類超平面什么的。

這份材料從前幾節講的logistic回歸出發,引出了SVM,既揭示了模型間的聯系,也讓人覺得過渡更自然。

重新審視logistic回歸

Logistic回歸目的是從特征學習出一個0/1分類模型,而這個模型是將特性的線性組合作為自變量,由于自變量的取值范圍是負無窮到正無窮。

因此,使用logistic函數(或稱作sigmoid函數)將自變量映射到(0,1)上,映射后的值被認為是屬于y=1的概率。

形式化表示就是

假設函數

aa5ecf14-f846-11eb-9bcf-12bb97331649.png

其中x是n維特征向量,函數g就是logistic函數。

aa77a2dc-f846-11eb-9bcf-12bb97331649.png的圖像是

aa93046e-f846-11eb-9bcf-12bb97331649.png

可以看到,將無窮映射到了(0,1)。

而假設函數就是特征屬于y=1的概率。

aabd24d8-f846-11eb-9bcf-12bb97331649.png

當我們要判別一個新來的特征屬于哪個類時,只需求aaeb088a-f846-11eb-9bcf-12bb97331649.png,若大于0.5就是y=1的類,反之屬于y=0類。

再審視一下aaeb088a-f846-11eb-9bcf-12bb97331649.png,發現aaeb088a-f846-11eb-9bcf-12bb97331649.png只和ab32d732-f846-11eb-9bcf-12bb97331649.png有關,ab32d732-f846-11eb-9bcf-12bb97331649.png>0,那么ab60cbce-f846-11eb-9bcf-12bb97331649.png,g(z)只不過是用來映射,真實的類別決定權還在ab32d732-f846-11eb-9bcf-12bb97331649.png。還有當ab869638-f846-11eb-9bcf-12bb97331649.png時,aaeb088a-f846-11eb-9bcf-12bb97331649.png=1,反之aaeb088a-f846-11eb-9bcf-12bb97331649.png=0。

如果我們只從ab32d732-f846-11eb-9bcf-12bb97331649.png出發,希望模型達到的目標無非就是讓訓練數據中y=1的特征ab869638-f846-11eb-9bcf-12bb97331649.png,而是y=0的特征abd0d748-f846-11eb-9bcf-12bb97331649.png

Logistic回歸就是要學習得到abef8eea-f846-11eb-9bcf-12bb97331649.png,使得正例的特征遠大于0,負例的特征遠小于0,強調在全部訓練實例上達到這個目標。

圖形化表示如下:

ac0c8c5c-f846-11eb-9bcf-12bb97331649.png

中間那條線是ac2780c0-f846-11eb-9bcf-12bb97331649.png,logistic回顧強調所有點盡可能地遠離中間那條線。學習出的結果也就中間那條線。

考慮上面3個點A、B和C。從圖中我們可以確定A是×類別的,然而C我們是不太確定的,B還算能夠確定。這樣我們可以得出結論,我們更應該關心靠近中間分割線的點,讓他們盡可能地遠離中間線,而不是在所有點上達到最優。

因為那樣的話,要使得一部分點靠近中間線來換取另外一部分點更加遠離中間線。我想這就是支持向量機的思路和logistic回歸的不同點,一個考慮局部(不關心已經確定遠離的點),一個考慮全局(已經遠離的點可能通過調整中間線使其能夠更加遠離)。這是我的個人直觀理解。

形式化表示

我們這次使用的結果標簽是y=-1,y=1,替換在logistic回歸中使用的y=0和y=1。同時將abef8eea-f846-11eb-9bcf-12bb97331649.png替換成w和b。

以前的ac5a1a08-f846-11eb-9bcf-12bb97331649.png,其中認為ac8034f4-f846-11eb-9bcf-12bb97331649.png。現在我們替換aca11cfa-f846-11eb-9bcf-12bb97331649.png為b,后面替換acbfbaf2-f846-11eb-9bcf-12bb97331649.pngacdc3b1e-f846-11eb-9bcf-12bb97331649.png(即ad0adbea-f846-11eb-9bcf-12bb97331649.png)。這樣,我們讓ad2249ce-f846-11eb-9bcf-12bb97331649.png,進一步ad4341e2-f846-11eb-9bcf-12bb97331649.png

也就是說除了y由y=0變為y=-1,只是標記不同外,與logistic回歸的形式化表示沒區別。再明確下假設函數

ad715730-f846-11eb-9bcf-12bb97331649.png

上一節提到過我們只需考慮ab32d732-f846-11eb-9bcf-12bb97331649.png的正負問題,而不用關心g(z),因此我們這里將g(z)做一個簡化,將其簡單映射到y=-1和y=1上。映射關系如下:

ad98c93c-f846-11eb-9bcf-12bb97331649.png

函數間隔(functional margin)和幾何間隔(geometric margin)

給定一個訓練樣本adb55e08-f846-11eb-9bcf-12bb97331649.png,x是特征,y是結果標簽。i表示第i個樣本。我們定義函數間隔如下:

addd8388-f846-11eb-9bcf-12bb97331649.png

可想而知,當ae151190-f846-11eb-9bcf-12bb97331649.png時,在我們的g(z)定義中,ae30ac84-f846-11eb-9bcf-12bb97331649.pngae4fc01a-f846-11eb-9bcf-12bb97331649.png的值實際上就是ae6752b6-f846-11eb-9bcf-12bb97331649.png。反之亦然。

為了使函數間隔最大(更大的信心確定該例是正例還是反例),當ae151190-f846-11eb-9bcf-12bb97331649.png時,ae8e9f6a-f846-11eb-9bcf-12bb97331649.png應該是個大正數,反之是個大負數。因此函數間隔代表了我們認為特征是正例還是反例的確信度。

繼續考慮w和b,如果同時加大w和b,比如在aeac850c-f846-11eb-9bcf-12bb97331649.png前面乘個系數比如2,那么所有點的函數間隔都會增大二倍,這個對求解問題來說不應該有影響,因為我們要求解的是aec9ada8-f846-11eb-9bcf-12bb97331649.png,同時擴大w和b對結果是無影響的。

這樣,我們為了限制w和b,可能需要加入歸一化條件,畢竟求解的目標是確定唯一一個w和b,而不是多組線性相關的向量。這個歸一化一會再考慮。

剛剛我們定義的函數間隔是針對某一個樣本的,現在我們定義全局樣本上的函數間隔

aee7afba-f846-11eb-9bcf-12bb97331649.png

說白了就是在訓練樣本上分類正例和負例確信度最小那個函數間隔。

接下來定義幾何間隔

假設我們有了B點所在的aec9ada8-f846-11eb-9bcf-12bb97331649.png分割面。任何其他一點,比如A到該面的距離以af54e79c-f846-11eb-9bcf-12bb97331649.png表示,假設B就是A在分割面上的投影。

我們知道向量BA的方向是af7d4476-f846-11eb-9bcf-12bb97331649.png(分割面的梯度),單位向量是afb3cdac-f846-11eb-9bcf-12bb97331649.png。A點是adb55e08-f846-11eb-9bcf-12bb97331649.png,所以B點是x=afdf28bc-f846-11eb-9bcf-12bb97331649.png(利用初中的幾何知識),帶入aec9ada8-f846-11eb-9bcf-12bb97331649.png得,

進一步得到

b02d5640-f846-11eb-9bcf-12bb97331649.png

af54e79c-f846-11eb-9bcf-12bb97331649.png實際上就是點到平面距離。

再換種更加優雅的寫法:

b057aa76-f846-11eb-9bcf-12bb97331649.png

b075fd32-f846-11eb-9bcf-12bb97331649.png時,不就是函數間隔嗎?是的,前面提到的函數間隔歸一化結果就是幾何間隔。

他們為什么會一樣呢?因為函數間隔是我們定義的,在定義的時候就有幾何間隔的色彩。同樣,同時擴大w和b,w擴大幾倍,b09437e8-f846-11eb-9bcf-12bb97331649.png就擴大幾倍,結果無影響。同樣定義全局的幾何間隔b0b3917e-f846-11eb-9bcf-12bb97331649.png

最優間隔分類器(optimal margin classifier)

回想前面我們提到我們的目標是尋找一個超平面,使得離超平面比較近的點能有更大的間距。也就是我們不考慮所有的點都必須遠離超平面,我們關心求得的超平面能夠讓所有點中離它最近的點具有最大間距。

形象的說,我們將上面的圖看作是一張紙,我們要找一條折線,按照這條折線折疊后,離折線最近的點的間距比其他折線都要大。形式化表示為:

b0ce205c-f846-11eb-9bcf-12bb97331649.png

這里用b09437e8-f846-11eb-9bcf-12bb97331649.png=1規約w,使得b0f630a6-f846-11eb-9bcf-12bb97331649.png是幾何間隔。

到此,我們已經將模型定義出來了。如果求得了w和b,那么來一個特征x,我們就能夠分類了,稱為最優間隔分類器。接下的問題就是如何求解w和b的問題了。

由于b112b91a-f846-11eb-9bcf-12bb97331649.png不是凸函數,我們想先處理轉化一下,考慮幾何間隔和函數間隔的關系,b12f9620-f846-11eb-9bcf-12bb97331649.png,我們改寫一下上面的式子:

b149fb8c-f846-11eb-9bcf-12bb97331649.png

這時候其實我們求的最大值仍然是幾何間隔,只不過此時的w不受b112b91a-f846-11eb-9bcf-12bb97331649.png的約束了。然而這個時候目標函數仍然不是凸函數,沒法直接代入優化軟件里計算。我們還要改寫。

前面說到同時擴大w和b對結果沒有影響,但我們最后要求的仍然是w和b的確定值,不是他們的一組倍數值,因此,我們需要對b1b4ebd6-f846-11eb-9bcf-12bb97331649.png做一些限制,以保證我們解是唯一的。

這里為了簡便我們取b1d495d0-f846-11eb-9bcf-12bb97331649.png。這樣的意義是將全局的函數間隔定義為1,也即是將離超平面最近的點的距離定義為b1ed6cc2-f846-11eb-9bcf-12bb97331649.png。由于求b1ed6cc2-f846-11eb-9bcf-12bb97331649.png的最大值相當于求b21a0b6a-f846-11eb-9bcf-12bb97331649.png的最小值,因此改寫后結果為:

b23844cc-f846-11eb-9bcf-12bb97331649.png

這下好了,只有線性約束了,而且是個典型的二次規劃問題(目標函數是自變量的二次函數)。代入優化軟件可解。

到這里發現,這個講義雖然沒有像其他講義一樣先畫好圖,畫好分類超平面,在圖上標示出間隔那么直觀,但每一步推導有理有據,依靠思路的流暢性來推導出目標函數和約束。

—版權聲明—

僅用于學術分享,版權屬于原作者。

若有侵權,請聯系 刪除或修改!

轉自:JerryLead

http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982639.html

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98042
  • 向量機
    +關注

    關注

    0

    文章

    166

    瀏覽量

    21655
  • SVM
    SVM
    +關注

    關注

    0

    文章

    154

    瀏覽量

    33694

原文標題:優雅的讀懂支持向量機 SVM 算法

文章出處:【微信號:gh_f39db674fbfd,微信公眾號:尖刀視】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    讀懂VCSEL芯片為何與眾不同

    VCSEL芯片是如何誕生的?是德科技帶你走進慧芯激光產業園探究竟!
    的頭像 發表于 01-09 14:19 ?556次閱讀

    搞清 BLE 藍牙 UUID

    帶你搞清楚藍牙 UUID ...... 矜辰所致
    的頭像 發表于 12-18 11:23 ?4250次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>搞清 BLE 藍牙 UUID

    帶你讀懂“脈沖輸入輸出模塊”

    在自動化生產的世界里,傳感器、執行器、控制器每天都在“對話”。可問題是,它們說的語言千奇百怪——有的輸出電壓信號,有的傳輸電流信號,還有的發出連串高速脈沖。如果沒有“翻譯官”,系統就亂了套。 而
    的頭像 發表于 11-24 17:10 ?911次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>讀懂</b>“脈沖輸入輸出模塊”

    如何快速讀懂三星貼片電容規格書?

    快速讀懂三星貼片電容規格書,可從封裝尺寸、容量、電壓、精度、溫度系數、其他參數及命名規則等方面入手,以下為具體分析: 1、封裝尺寸 :三星貼片電容的封裝尺寸多樣,常見的有0201、0402
    的頭像 發表于 11-11 16:10 ?574次閱讀

    漢威科技推動養老機構智慧消防建設

    養老市場持續增長,而養老機構消防建設水平滯后,矛盾之下如何破局?漢威科技帶你讀懂
    的頭像 發表于 11-10 17:23 ?1246次閱讀

    SM4算法實現分享(算法原理

    對明文進行分組加密變換。SM4加密算法由32次迭代運算和次反序變換R組成。 設輸入明文為(X0,X 1,X 2,X 3),共128位,設密輸出為(Y0,Y 1,Y 2,Y 3),輪密鑰為rki
    發表于 10-30 08:10

    使用MATLAB的支持向量解決方案

    支持向量 (SVM) 是種有監督機器學習算法,它能找到分離兩個類的數據點的最佳超平面。
    的頭像 發表于 10-21 15:00 ?636次閱讀
    使用MATLAB的<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機</b>解決方案

    網絡路由器關鍵知識,讀懂

    在互聯網深度融入日常的今天,網絡路由器作為不可或缺的樞紐設備,承擔著連接世界的關鍵任務。但你真正了解它嗎?本文將帶你系統認識路由器的基礎功能、發展歷程與常見接口,幫助你更好地理解和使用這設備。
    的頭像 發表于 09-19 18:10 ?1423次閱讀

    讀懂:CWDM和DWDM的核心差異

    光纖通信里的“兩兄弟”CWDM和DWDM,名字只差個字母,差別可大了去!今天講透核心差異,小易幫你快速分清~
    的頭像 發表于 09-17 18:19 ?1203次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>:CWDM和DWDM的核心差異

    快速讀懂麥科信MOIP系列光隔離探頭

    ,滿足多樣化測試需求? 探頭支持0dB(1X)與20dB(100mX)檔位快速切換,并可通過搭配不同規格衰減器,實現從±0.01V至±6250V的寬范圍差模信號測量,且在全量程范圍內均可實現滿量程輸出
    發表于 06-27 18:39

    柔性生產新標配:聚徽解碼安卓工控如何支持多用」快速換線

    其獨特的技術優勢,正逐漸成為柔性生產的新標配,為「多用」快速換線提供了有力支持。 協議兼容,打破設備連接壁壘 ()多協議解析能力 工業
    的頭像 發表于 06-10 16:48 ?586次閱讀

    請問ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發表于 04-25 06:41

    請問ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發表于 04-23 06:25

    讀懂,可重構芯片為何是AI的完美搭檔

    在當今數字化時代,人工智能(AI)無疑是最為耀眼的技術領域之。從早期簡單的機器學習算法,到如今復雜的深度學習和Transformer模型,AI算法正以前所未有的速度快速發展。這種
    的頭像 發表于 03-31 12:05 ?1112次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>,可重構芯片為何是AI的完美搭檔

    請問ST25R3916有快速讀取嗎?

    ST25R3916有快速讀取嗎?
    發表于 03-13 06:36