国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

半監督學習:比監督學習做的更好

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 23:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

首發:AI公園公眾號
作者:Andre Ye
編譯:ronghuaiyang

導讀

為什么半監督學習是機器學習的未來。


監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精確度和預測能力。
然而,一個重大突破揭示了添加“無監督數據”可以提高模型泛化和性能。事實上,在非常多的場景中,帶有標簽的數據并不容易獲得。半監督學習可以在標準的任務中實現SOTA的效果,只需要一小部分的有標記數據 —— 數百個訓練樣本。
在這個我們對半監督學習的探索中,我們會有:

  1. _半監督學習簡介_。什么是半監督學習,它與其他學習方法相比如何,半監督學習算法的框架/思維過程是什么?
  2. _算法:Semi-Supervised GANs_。與傳統GANs的比較,過程的解釋,半監督GANs的性能。
  3. _用例和機器學習的未來_。為什么半監督學習會有如此大的需求,哪里可以應用。

半監督學習介紹

半監督學習算法代表了監督和非監督算法的中間地帶。雖然沒有正式定義為機器學習的“第四個”元素(監督、無監督、強化),但它將前兩個方面結合成一種自己的方法。
這些算法操作的數據有一些標簽,但大部分是沒有標簽的。傳統上,人們要么選擇有監督學習的方式,只對帶有標簽的數據進行操作,這將極大地減小數據集的規模,要么,就會選擇無監督學習的方式,丟棄標簽保留數據集的其余部分,然后做比如聚類之類的工作。

這在現實世界中是很常見的。由于標注是很昂貴的,特別是大規模數據集,特別是企業用途的,可能只有幾個標簽。例如,考慮確定用戶活動是否具有欺詐性。在100萬用戶中,該公司知道有1萬用戶是這樣的,但其他9萬用戶可能是惡意的,也可能是良性的。半監督學習允許我們操作這些類型的數據集,而不必在選擇監督學習或非監督學習時做出權衡。
一般來說,半監督學習算法在這個框架上運行:

  1. 半監督機器學習算法使用有限的標記樣本數據集來訓練自己,從而形成一個“部分訓練”的模型。
  2. 部分訓練的模型對未標記的數據進行標記。由于樣本標記數據集有許多嚴重的限制(例如,在現實數據中的選擇偏差),標記的結果被認為是“偽標簽”數據。
  3. 結合標記和偽標簽數據集,創建一個獨特的算法,結合描述和預測方面的監督和非監督學習。

半監督學習利用分類過程來識別數據資產,利用聚類過程將其分成不同的部分。

算法:Semi-Supervised GAN

半監督的GAN,簡稱為SGAN,是[生成對抗網絡](https://medium.com/analytics-... -an-直覺解釋-革命概念-2f962c858b95)架構的一個變體,用于解決半監督學習問題。
在傳統的GAN中,判別器被訓練來預測由生成器模型生成的圖像是真實的還是假的,允許它從圖像中學習判別特征,即使沒有標簽。盡管大多數人通常在GANs中使用訓練很好的生成器,可以生成和數據集中相似的圖像,判別器還是可以通過以轉移學習作為起點在相同的數據集上建立分類器,允許監督任務從無監督訓練中受益。由于大部分的圖像特征已經被學習,因此進行分類的訓練時間和準確率會更好。
然而,在SGAN中,判別器同時接受兩種模式的訓練:無監督和監督。

  • 在無監督模式中,需要區分真實圖像和生成的圖像,就像在傳統的GAN中一樣。
  • 在監督模式中,需要將一幅圖像分類為幾個類,就像在標準的神經網絡分類器中一樣。

為了同時訓練這兩種模式,判別器必須輸出1 + _n_個節點的值,其中1表示“真或假”節點,_n_是預測任務中的類數。
在半監督GAN中,對判別器模型進行更新,預測K+1個類,其中K為預測問題中的類數,并為一個新的“_假_”類添加額外的類標簽。它涉及到同時訓練無監督分類任務和有監督分類任務的判別器模型。整個數據集都可以通過SGAN進行傳遞 —— 當一個訓練樣本有標簽時,判別器的權值將被調整,否則,分類任務將被忽略,判別器將調整權值以更好地區分真實的圖像和生成的圖像。

雖然允許SGAN進行無監督訓練,允許模型從一個非常大的未標記數據集中學習非常有用的特征提取,但有監督學習允許模型利用提取的特征并將其用于分類任務。其結果是一個分類器可以在像MNIST這樣的標準問題上取得令人難以置信的結果,即使是在非常非常少的標記樣本(數十到數百個)上進行訓練。
SGAN巧妙地結合了無監督和監督學習的方面,強強聯合,以最小的標簽量,產生難以置信的結果。

用例和機器學習的未來

在一個可用數據量呈指數級增長的時代,無監督數據根本不能停下來等待標注。無數真實世界的數據場景會像這樣出現 —— 例如,YouTube視頻或網站內容。從爬蟲引擎和內容聚合系統到圖像和語音識別,半監督學習被廣泛應用。
半監督學習將監督學習和非監督學習的過擬合和“不擬合”傾向(分別)結合起來的能力,創建了一個模型,在給出最小數量的標記數據和大量的未標記數據的情況下,可以出色地執行分類任務。除了分類任務,半監督算法還有許多其他用途,如增強聚類和異常檢測。盡管這一領域本身相對較新,但由于在當今的數字領域中發現了巨大的需求,算法一直在不斷地被創造和完善。
半監督學習確實是機器學習的未來。

—END—

英文原文:https://towardsdatascience.co...

推薦閱讀

關注圖像處理,自然語言處理,機器學習等人工智能領域,請點擊關注AI公園專欄。
歡迎關注微信公眾號

審核編輯:符乾江
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265282
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136928
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    :自動化任務(如數據預處理、模型訓練調度)。Git版本控制:團隊協作開發(如分支管理、代碼合并)。 機器學習監督學習:線性回歸、邏輯回歸、決策樹、SVM等。無監督學習:聚類(K-Means)、降維
    發表于 02-27 10:53

    強化學習會讓自動駕駛模型學習更快嗎?

    是一種讓機器通過“試錯”學會決策的辦法。與監督學習不同,監督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每一步的“正確答案”都告訴你,而是把環境、動作和結果連起來,讓機器自己探索哪個行為長期看起來更有利
    的頭像 發表于 01-31 09:34 ?641次閱讀
    強化<b class='flag-5'>學習</b>會讓自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    自動駕駛中常提的模仿學習是什么?

    當談及自動駕駛模型學習時,經常會提到模仿學習的概念。所謂模仿學習,就是模型先看別人怎么,然后學著去做。自動駕駛中的模仿學習,就是把人類司機
    的頭像 發表于 01-16 16:41 ?1991次閱讀

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課(11大系列課程,共5000+分鐘)

    趨勢: 無監督學習普及 當前工業場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統監督學習方案難以落地。課程第11系列(無監督缺陷檢測篇)提供無需標注即可
    發表于 12-04 09:28

    自動駕駛數據標注是所有信息都要標注嗎?

    本身只是像素和點云。標注的工作就是人為地給這些信號貼上語義標簽,告訴模型這是一輛車、這是行人、這是車道線、這個區域不能通行之類的明確信息。沒有這些標簽,監督學習、驗證和評估都無法進行,模型不知道哪些輸入與哪些輸出應該
    的頭像 發表于 12-04 09:05 ?863次閱讀
    自動駕駛數據標注是所有信息都要標注嗎?

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課程(11大系列課程,共5000+分鐘)

    趨勢: 無監督學習普及 當前工業場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統監督學習方案難以落地。課程第11系列(無監督缺陷檢測篇)提供無需標注即可
    發表于 12-03 13:50

    自動駕駛中常提的“強化學習”是個啥?

    下,就是一個智能體在環境里行動,它能觀察到環境的一些信息,并做出一個動作,然后環境會給出一個反饋(獎勵或懲罰),智能體的目標是把長期得到的獎勵累積到最大。和監督學習不同,強化學習沒有一一對應的“正確答案”給它看,而是靠與環境交互、自我探索來發現
    的頭像 發表于 10-23 09:00 ?662次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是個啥?

    使用MATLAB的支持向量機解決方案

    支持向量機 (SVM) 是一種有監督機器學習算法,它能找到分離兩個類的數據點的最佳超平面。
    的頭像 發表于 10-21 15:00 ?635次閱讀
    使用MATLAB的支持向量機解決方案

    EL非監督分割白皮書丨5張OK圖、1分鐘建模、半小時落地的異常檢測工具!

    在工業4.0浪潮下,制造業對產品質量的要求愈發嚴苛。傳統人工質檢效率低、成本高,基于規則算法的視覺檢測系統難以應對復雜場景,而依賴缺陷樣本的有監督AI檢測又面臨樣本不足、泛化能力弱的難題。在此背景下
    的頭像 發表于 07-11 15:21 ?646次閱讀
    EL非<b class='flag-5'>監督</b>分割白皮書丨5張OK圖、1分鐘建模、半小時落地的異常檢測工具!

    任正非說 AI已經確定是第四次工業革命 那么如何從容地加入進來呢?

    的基本理論。了解監督學習、無監督學習和強化學習的基本原理。例如,在監督學習中,理解如何通過標注數據來訓練模型進行分類或回歸任務,像通過大量的貓和狗的圖片標注數據來訓練一個圖像分類模型,
    發表于 07-08 17:44

    機器學習異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測系統

    本文轉自:DeepHubIMBA無監督異常檢測作為機器學習領域的重要分支,專門用于在缺乏標記數據的環境中識別異常事件。本文深入探討異常檢測技術的理論基礎與實踐應用,通過IsolationForest
    的頭像 發表于 06-24 11:40 ?1409次閱讀
    機器<b class='flag-5'>學習</b>異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測系統

    DeepSeeK學習資料

    104頁DeepSeeK學習資料(清華)
    發表于 06-08 09:57 ?2次下載

    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    了一種無閾值方法:基于 LSTM 網絡的基線(一個 LSTM 框架輔助幾個優化步驟)和無監督檢測(神經網絡和多種機器學習算法的組合)協同綜合分析時間序列。當時間序列顯示出清晰的周期性形態的情況下基線表現良好,而無監督檢測在效率
    的頭像 發表于 05-22 16:38 ?1021次閱讀
    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    使用MATLAB進行無監督學習

    監督學習是一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?1435次閱讀
    使用MATLAB進行無<b class='flag-5'>監督學習</b>

    掌握這六點,原來學習數電和模電這么簡單!

    的認知理解,而先學習模電能夠更好的對數電的內部結構原理得到了解,這樣學習起數電來就更容易上手了,下面我們來開始今天的學習吧,如何學習模電,重
    的頭像 發表于 03-19 19:33 ?4792次閱讀
    掌握這六點,原來<b class='flag-5'>學習</b>數電和模電這么簡單!