国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

教你如何利用二位交互圖理解機器學習

算法與數據結構 ? 來源:未知 ? 作者:佚名 ? 2017-11-11 08:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自:naughty 的博客

https://my.oschina.net/taogang/blog/1544709

每當提到機器學習,大家總是被其中的各種各樣的算法和方法搞暈,覺得無從下手。確實,機器學習的各種套路確實不少,但是如果掌握了正確的路徑和方法,其實還是有跡可循的,這里我推薦SAS的Li Hui的這篇博客,講述了如何選擇機器學習的各種方法。

另外,Scikit-learn 也提供了一幅清晰的路線圖給大家選擇:

其實機器學習的基本算法都很簡單,下面我們就利用二維數據和交互圖形來看看機器學習中的一些基本算法以及它們的原理。(另外向Bret Victor致敬,他的 Inventing on principle 深深的影響了我)

所有的代碼即演示可以在我的Codepen的這個Collection中找到。

首先,機器學習最大的分支的監督學習和無監督學習,簡單說數據已經打好標簽的是監督學習,而數據沒有標簽的是無監督學習。從大的分類上看,降維和聚類被劃在無監督學習,回歸和分類屬于監督學習。

無監督學習

如果你的數據都沒有標簽,你可以選擇花錢請人來標注你的數據,或者使用無監督學習的方法

首先你可以考慮是否要對數據進行降維。

降維

降維顧名思義就是把高維度的數據變成為低維度。常見的降維方法有PCA, LDA, SVD等。

主成分分析 PCA

降維里最經典的方法是主成分分析PCA,也就是找到數據的主要組成成分,拋棄掉不重要的成分。

這里我們先用鼠標隨機生成8個數據點,然后繪制出表示主成分的白色直線。這根線就是二維數據降維后的主成分,藍色的直線是數據點在新的主成分維度上的投影線,也就是垂線。主成分分析的數學意義可以看成是找到這根白色直線,使得投影的藍色線段的長度的和為最小值。

聚類

因為在非監督學習的環境下,數據沒有標簽,那么能對數據所做的最好的分析除了降維,就是把具有相同特質的數據歸并在一起,也就是聚類。

層級聚類 Hierachical Cluster

該聚類方法用于構建一個擁有層次結構的聚類

如上圖所示,層級聚類的算法非常的簡單:

1、初始時刻,所有點都自己是一個聚類

2、找到距離最近的兩個聚類(剛開始也就是兩個點),形成一個聚類

3、兩個聚類的距離指的是聚類中最近的兩個點之間的距離

4、重復第二步,直到所有的點都被聚集到聚類中。

KMeans

KMeans中文翻譯K均值算法,是最常見的聚類算法。

1、隨機在圖中取K(這里K=3)個中心種子點。

2、然后對圖中的所有點求到這K個中心種子點的距離,假如點P離中心點S最近,那么P屬于S點的聚類。

3、接下來,我們要移動中心點到屬于他的“聚類”的中心。

4、然后重復第2)和第3)步,直到,中心點沒有移動,那么算法收斂,找到所有的聚類。

KMeans算法有幾個問題:

1、如何決定K值,在上圖的例子中,我知道要分三個聚類,所以選擇K等于3,然而在實際的應用中,往往并不知道應該分成幾個類

2、由于中心點的初始位置是隨機的,有可能并不能正確分類,大家可以在我的Codepen中嘗試不同的數據

3、如下圖,如果數據的分布在空間上有特殊性,KMeans算法并不能有效的分類。中間的點被分別歸到了橙色和藍色,其實都應該是藍色。

DBSCAN

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)中文是基于密度的聚類算法。

DBSCAN算法基于一個事實:一個聚類可以由其中的任何核心對象唯一確定。

算法的具體聚類過程如下:

1、掃描整個數據集,找到任意一個核心點,對該核心點進行擴充。擴充的方法是尋找從該核心點出發的所有密度相連的數據點(注意是密度相連)。

2、遍歷該核心點的鄰域內的所有核心點(因為邊界點是無法擴充的),尋找與這些數據點密度相連的點,直到沒有可以擴充的數據點為止。最后聚類成的簇的邊界節點都是非核心數據點。

3、之后就是重新掃描數據集(不包括之前尋找到的簇中的任何數據點),尋找沒有被聚類的核心點,再重復上面的步驟,對該核心點進行擴充直到數據集中沒有新的核心點為止。數據集中沒有包含在任何簇中的數據點就構成異常點。

如上圖所示,DBSCAN可以有效的解決KMeans不能正確分類的數據集。并且不需要知道K值。

當然,DBCSAN還是要決定兩個參數,如何決定這兩個參數是分類效果的關鍵因素:

1、一個參數是半徑(Eps),表示以給定點P為中心的圓形鄰域的范圍;

2、另一個參數是以點P為中心的鄰域內最少點的數量(MinPts)。如果滿足:以點P為中心、半徑為Eps的鄰域內的點的個數不少于MinPts,則稱點P為核心點。

監督學習

監督學習中的數據要求具有標簽。也就是說針對已有的結果去預測新出現的數據。如果要預測的內容是數值類型,我們稱作回歸,如果要預測的內容是類別或者是離散的,我們稱作分類。

其實回歸和分類本質上是類似的,所以很多的算法既可以用作分類,也可以用作回歸。

回歸

線性回歸

線性回歸是最經典的回歸算法。

在統計學中,線性回歸(Linear regression)是利用稱為線性回歸方程的最小二乘函數對一個或多個自變量和因變量之間關系進行建模的一種回歸分析。

這種函數是一個或多個稱為回歸系數的模型參數的線性組合。 只有一個自變量的情況稱為簡單回歸,大于一個自變量情況的叫做多元回歸。

如上圖所示,線性回歸就是要找到一條直線,使得所有的點預測的失誤最小。也就是圖中的藍色直線段的和最小。這個圖很像我們第一個例子中的PCA。仔細觀察,分辨它們的區別。

如果對于算法的的準確性要求比較高,推薦的回歸算法包括:隨機森林,神經網絡或者Gradient Boosting Tree。

如果要求速度優先,建議考慮決策樹和線性回歸。

分類

支持向量機 SVM

如果對于分類的準確性要求比較高,可使用的算法包括Kernel SVM,隨機森林,神經網絡以及Gradient Boosting Tree。

給定一組訓練實例,每個訓練實例被標記為屬于兩個類別中的一個或另一個,SVM訓練算法創建一個將新的實例分配給兩個類別之一的模型,使其成為非概率二元線性分類器。

SVM模型是將實例表示為空間中的點,這樣映射就使得單獨類別的實例被盡可能寬的明顯的間隔分開。然后,將新的實例映射到同一空間,并基于它們落在間隔的哪一側來預測所屬類別。

如上圖所示,SVM算法就是在空間中找到一條直線,能夠最好的分割兩組數據。使得這兩組數據到直線的距離的絕對值的和盡可能的大。

上圖示意了不同的核方法的不同分類效果。

決策樹

如果要求分類結果是可以解釋的,可以考慮決策樹或者邏輯回歸。

決策樹(decision tree)是一個樹結構(可以是二叉樹或非二叉樹)。

其每個非葉節點表示一個特征屬性上的測試,每個分支代表這個特征屬性在某個值域上的輸出,而每個葉節點存放一個類別。

使用決策樹進行決策的過程就是從根節點開始,測試待分類項中相應的特征屬性,并按照其值選擇輸出分支,直到到達葉子節點,將葉子節點存放的類別作為決策結果。

決策樹可以用于回歸或者分類,下圖是一個分類的例子。

如上圖所示,決策樹把空間分割成不同的區域。

邏輯回歸

邏輯回歸雖然名字是回歸,但是卻是個分類算法。因為它和SVM類似是一個二分類,數學模型是預測1或者0的概率。所以我說回歸和分類其實本質上是一致的。

這里要注意邏輯回歸和線性SVM分類的區別

樸素貝葉斯

當數據量相當大的時候,樸素貝葉斯方法是一個很好的選擇。

15年我在公司給小伙伴們分享過bayers方法,可惜speaker deck被墻了,如果有興趣可以自行想辦法。

如上圖所示,大家可以思考一下左下的綠點對整體分類結果的影響。

KNN

KNN分類可能是所有機器學習算法里最簡單的一個了。

如上圖所示,K=3,鼠標移動到任何一個點,就找到距離該點最近的K個點,然后,這K個點投票,多數表決獲勝。就是這么簡單。

總結

本文利用二維交互圖幫助大家理解機器學習的基本算法,希望能增加大家對機器學習的各種方法有所了解。所有的代碼可以在參考中找到。歡迎大家來和我交流。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136931

原文標題:圖解機器學習

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數據結構】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    穿孔機頂頭檢測儀 機器視覺深度學習

    ,能適用惡劣工況,在粉塵、高溫、氧化皮等惡劣環境中均可正常工作。 測量原理 利用頂頭與周圍的物質(水、空氣、導盤等)紅外輻射能量的差異,用熱成像相機拍攝出清晰的圖片,再通過深度學習短時間內深度優化,判斷
    發表于 12-22 14:33

    芯導科技AI智能交互硬件方案介紹

    AI智能交互硬件是通過集成人工智能技術(如大語言模型、多模態交互機器學習等),賦予傳統玩具智能化交互能力的新型產品。其核心特點是?擬人化
    的頭像 發表于 12-03 17:00 ?2468次閱讀
    芯導科技AI智能<b class='flag-5'>交互</b>硬件方案介紹

    從0到1,10+年資深LabVIEW專家,手把手教你攻克機器視覺+深度學習(5000分鐘實戰課)

    “告別檢測系統能力缺陷!10+年LabVIEW視覺資深專家手把手教你:5000+分鐘高清教程(含工具、算法原理、實戰操作、項目優化全流程講解)”——從傳統視覺算法→深度學習建模→工業級部署"
    的頭像 發表于 12-02 08:07 ?520次閱讀
    從0到1,10+年資深LabVIEW專家,手把手<b class='flag-5'>教你</b>攻克<b class='flag-5'>機器</b>視覺+深度<b class='flag-5'>學習</b>(5000分鐘實戰課)

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器交互與感知

    引擎,訪問并顯示米爾官方網頁,承擔人機信息查詢與交互角色。· MINI DP接口(27寸顯示器):實時顯示8路攝像頭捕捉的圖像預覽,充當機器人的"視覺監控中心"
    發表于 10-29 16:41

    自動駕駛中常提的“強化學習”是個啥?

    [首發于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學習(Reinforcement Learning,簡稱RL)”,強化學習是一類讓機器通過試錯來學會做決策的技術。簡單理解
    的頭像 發表于 10-23 09:00 ?662次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是個啥?

    如何在機器視覺中部署深度學習神經網絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術為機器視覺(乃至生產自動化)帶來的潛力,因為深度學習并非只屬于計算機科學家或程序員。 從頭開始:什么
    的頭像 發表于 09-10 17:38 ?900次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b>神經網絡

    語音機器交互系統:核心技術與應用挑戰

    ? ? ? 語音機器交互系統是融合多學科技術的復雜工程,其核心目標是實現人與機器間的自然、流暢語音對話。該系統已廣泛應用于智能客服、智能家居、企業助手等場景,其技術架構主要包含以下幾個關鍵模塊
    的頭像 發表于 09-02 11:08 ?827次閱讀

    再掀語音交互革命,廣和通AI解決方案加速機器人聽覺進化

    機器人世界里,感知是智能化的第一步,是機器人獲取環境信息,學習適應并自主決策的前提。聽覺作為五感之一,深度融合AI,可幫助機器人實現高效感知、數據獲取、語音
    的頭像 發表于 08-26 17:44 ?889次閱讀

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2885次閱讀

    2025科大訊飛智能交互產品升級發布會定檔

    從命令行到圖形界面,從觸屏操作到語音助手,技術浪潮重新定義人機交互的邊界。當大模型的智慧涌現,機器從“能聽會說”真正走向“能理解會思考”,那么未來交互的新范式將是什么?
    的頭像 發表于 06-11 17:12 ?1260次閱讀

    詳細介紹機場智能指路機器人的工作原理

    免與行人發生碰撞,為旅客提供安全、舒適的引導服務。 智能交互系統 語音識別與理解 :智能指路機器利用先進的語音識別技術,將旅客輸入的語音信號轉化為文字信息。然后,通過自然語言處理算
    發表于 05-10 18:26

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    閱讀心得體會:ROS2機器人視覺與地圖構建技術 通過對本書第7章(ROS2視覺應用)和第8章(ROS2地構建)的學習,我對機器人視覺感知和自主導航的核心技術有了更深入的
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】機器人入門的引路書

    的限制和調控) 本書還有很多前沿技術項目的擴展 比如神經網絡識別例程,機器學習圖像識別的原理,yolo圖像追蹤的原理 機器學習訓練三大點: 先準備一個基本的模型結構 和訓練時的反饋函
    發表于 04-30 01:05

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例

    整書的內容非常多有476頁。非常厚,像本厚厚的工具書 拿出文章中的小節加以書寫吧 視覺應用:維碼識別 維碼識別是視覺應用中的一個重要部分,它在機器人導航、物品追蹤和信息交互等方面有
    發表于 04-27 11:42

    蔡司CIMT2025 | 新品天團第二位成員新一代ZEISS SPECTRUM閃耀登場,精度x靈活雙飛躍!

    上 蔡司“新品天團”第二位成員 “人氣擔當” 新一代 ZEISS SPECTRUM 即將閃耀登場! ? 它既有效率,又有精度 既有靈活,又有穩定 這位測量界的全能ACE 將帶來怎樣的驚喜? 我們一起來先睹為快 ? 【插入公眾號視頻:蔡司新品組團出道,快來pick你的本命idol!....】 ?
    發表于 03-28 13:34 ?572次閱讀
    蔡司CIMT2025 | 新品天團第<b class='flag-5'>二位</b>成員新一代ZEISS SPECTRUM閃耀登場,精度x靈活雙飛躍!