国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

最基礎的半監督學習

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:Neeraj varshney ? 2020-11-02 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

最基礎的半監督學習的概念,給大家一個感性的認識。

半監督學習(SSL)是一種機器學習技術,其中任務是從一個小的帶標簽的數據集和相對較大的未帶標簽的數據中學習得到的。SSL的目標是要比單獨使用有標記數據訓練的監督學習技術得到更好的結果。這是半監督學習系列文章的第1部分,對這個機器學習的重要子領域進行了簡要的介紹。

區分半監督學習,監督學習和無監督學習

整個數據集中可用于訓練的有標記數據的范圍區分了機器學習的這三個相關領域。

監督學習是機器學習中最流行的模式,在這種模式中,可以通過標簽的形式獲得完整的監督。整個數據集都有標記,即一個標簽與訓練數據集中的每個樣本相關聯。機器學習模型使用這個標簽數據集訓練,并期望對新的樣本預測一個標簽。監督學習主要包括兩類任務:分類和回歸。分類問題要求算法預測一個離散值,而回歸任務是需要從輸入變量(X)逼近一個映射函數(f)到連續輸出變量(y)。

手寫數字識別使用(MNIST)數據集。每個樣本都有一個圖像和對應的數字作為標簽。任務是學習從圖像中預測標簽(即數字)。

另一個例子是情感分類,使用IMDB數據集。每條記錄都包含一個評論和一個相應的標簽(正面的或負面的)。這里的任務是預測給定評論的情緒。

房價預測是一個回歸任務,其中標簽(房價)是一個連續變量。

在無監督學習中,沒有標記數據可用。訓練數據集包含樣本,但沒有特定的期望結果或標簽。機器學習模型試圖通過提取有用的特征并對其進行分析來自動地在數據中找到結構。像聚類、異常檢測、關聯等任務屬于無監督學習。

聚類是將數據集劃分為多個簇,使同一簇中的數據點與同一簇中的其他數據點更相似,與其他簇中的數據點不相似。例如,下圖(左)中的數據點可以分成3個簇,如圖(右)所示。注意,簇可以是任何形狀。

半監督式學習(SSL),正如其名稱所示,介于兩個極端之間(監督式是指整個數據集被標記,而非監督式是指沒有標記)。半監督學習任務具有一個標記和一個未標記的數據集。它使用未標記的數據來獲得對數據結構的更多理解。通常,SSL使用小的帶標簽數據集和較大的未帶標簽數據集來進行學習。

我們的目標是學習一個預測器來預測未來的測試數據,這個預測器比單獨從有標記的訓練數據中學習的預測器更好。

監督學習,半監督學習,無監督學習在標記數據上的差別可視化

為什么要關注半監督學習

在許多實際應用中,收集大的有標簽數據集太昂貴或者不可行,但是有大量的無標簽數據可用。對于這種情況,半監督學習是一個完美的方案。SSL技術可以利用帶標簽的數據,也可以從未帶標簽的數據派生結構,從而更好地解決總體任務。

典型的監督學習算法在標記數據集較小的情況下,容易出現過擬合問題。SSL通過在訓練過程中理解未標記數據的結構來緩解這個問題。

此外,這種學習技術減輕了構建大量標記數據集來學習任務的負擔。SSL方法更接近我們人類的學習方式。

讓我們舉個例子來直觀地看看半監督學習的效果。在下面的圖中,當只對標記數據(大的黑點和白點)進行訓練(即對標記數據進行監督學習)時,決策邊界(虛線)并不遵循數據“流形”的輪廓,這可以由額外的未標記數據(小灰點)來表示。

因此,SSL的目標是利用未標記數據來生成決策邊界,從而更好地反映數據的底層結構。

由不同的半監督學習方法生成的決策邊界

半監督學習的任務舉例

CIFAR-10— 它是由10個類的32×32像素的RGB圖像組成的數據集,任務是圖像分類。通常使用Tiny Images數據集中的隨機圖像來形成未標記數據集。

SVHN— 街景門牌號數據集由真實門牌號的32×32像素的RGB圖像組成,任務是分類最中間的數字。它附帶一個“SVHN-extra”數據集,該數據集由531,131個額外的數字圖像組成,可以用作未標記數據。

Text-Classification Tasks— 亞馬遜評論數據庫,Yelp評論數據集。

總結

半監督學習是一種有趣的方法,用于解決機器學習中缺乏標記數據的問題。SSL算法還利用未標記數據來提高監督學習算法的性能。SSL算法通常提供了一種從無標簽示例中了解數據結構的方法,減輕了對標簽的需求。

本系列的第2部分會介紹了一些具體的SSL技術,未完待續。

責任編輯:xj

原文標題:半監督學習入門基礎(一)

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • SSL
    SSL
    +關注

    關注

    0

    文章

    132

    瀏覽量

    26747
  • 半監督
    +關注

    關注

    0

    文章

    5

    瀏覽量

    6458
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136931
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396

原文標題:半監督學習入門基礎(一)

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    :自動化任務(如數據預處理、模型訓練調度)。Git版本控制:團隊協作開發(如分支管理、代碼合并)。 機器學習監督學習:線性回歸、邏輯回歸、決策樹、SVM等。無監督學習:聚類(K-Means)、降維
    發表于 02-27 10:53

    強化學習會讓自動駕駛模型學習更快嗎?

    是一種讓機器通過“試錯”學會決策的辦法。與監督學習不同,監督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每一步的“正確答案”都告訴你,而是把環境、動作和結果連起來,讓機器自己探索哪個行為長期看起來更有利
    的頭像 發表于 01-31 09:34 ?641次閱讀
    強化<b class='flag-5'>學習</b>會讓自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    UCC27212 橋驅動器技術詳解

    UCC27212 橋驅動器技術詳解 在電子工程領域,功率轉換和控制電路對于各種應用至關重要。而驅動器作為其中的關鍵組件,其性能直接影響著整個系統的效率和穩定性。今天,我們就來深入了解一款高性能的
    的頭像 發表于 01-08 17:30 ?699次閱讀

    FRDMGD3160DSBHB橋評估板:設計與應用指南

    FRDMGD3160DSBHB橋評估板:設計與應用指南 在電子工程領域,一款性能優良的評估板對于產品的開發和測試至關重要。今天,我們就來深入了解一下NXP的FRDMGD3160DSBHB橋評估板
    的頭像 發表于 12-25 10:55 ?575次閱讀

    SRN8040HA系列屏蔽功率電感器:特性、參數與應用考量

    SRN8040HA系列屏蔽功率電感器:特性、參數與應用考量 在電子工程師的日常工作中,功率電感器是電路設計里的常用元件。今天,我們來深入探討一下Bourns的SRN8040HA系列屏蔽功率電感器
    的頭像 發表于 12-23 15:10 ?391次閱讀

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課(11大系列課程,共5000+分鐘)

    趨勢: 無監督學習普及 當前工業場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統監督學習方案難以落地。課程第11系列(無監督缺陷檢測篇)提供無需標注即可
    發表于 12-04 09:28

    自動駕駛數據標注是所有信息都要標注嗎?

    本身只是像素和點云。標注的工作就是人為地給這些信號貼上語義標簽,告訴模型這是一輛車、這是行人、這是車道線、這個區域不能通行之類的明確信息。沒有這些標簽,監督學習、驗證和評估都無法進行,模型不知道哪些輸入與哪些輸出應該
    的頭像 發表于 12-04 09:05 ?865次閱讀
    自動駕駛數據標注是所有信息都要標注嗎?

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課程(11大系列課程,共5000+分鐘)

    趨勢: 無監督學習普及 當前工業場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統監督學習方案難以落地。課程第11系列(無監督缺陷檢測篇)提供無需標注即可
    發表于 12-03 13:50

    自動駕駛中常提的“強化學習”是個啥?

    下,就是一個智能體在環境里行動,它能觀察到環境的一些信息,并做出一個動作,然后環境會給出一個反饋(獎勵或懲罰),智能體的目標是把長期得到的獎勵累積到最大。和監督學習不同,強化學習沒有一一對應的“正確答案”給它看,而是靠與環境交互、自我探索來發現
    的頭像 發表于 10-23 09:00 ?662次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是個啥?

    LLC 橋諧振電路的設計與應用

    電子發燒友網站提供《LLC 橋諧振電路的設計與應用.pdf》資料免費下載
    發表于 10-22 17:11 ?8次下載

    XM3橋電源模塊系列CREE

    XM3橋電源模塊系列是 Wolfspeed(原CREE)推出的高功率碳化硅(SiC)電源模塊平臺,專為電動汽車、工業電源和牽引驅動等高要求應用設計。XM3橋電源模塊系列采用第三代 SiC
    發表于 09-11 09:48

    任正非說 AI已經確定是第四次工業革命 那么如何從容地加入進來呢?

    的基本理論。了解監督學習、無監督學習和強化學習的基本原理。例如,在監督學習中,理解如何通過標注數據來訓練模型進行分類或回歸任務,像通過大量的貓和狗的圖片標注數據來訓練一個圖像分類模型,
    發表于 07-08 17:44

    HT8 橋電磁爐MCU應用須知

    本文介紹了基于HT8的橋電磁爐設計方案
    發表于 07-07 10:26 ?7次下載

    機器學習異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測系統

    本文轉自:DeepHubIMBA無監督異常檢測作為機器學習領域的重要分支,專門用于在缺乏標記數據的環境中識別異常事件。本文深入探討異常檢測技術的理論基礎與實踐應用,通過IsolationForest
    的頭像 發表于 06-24 11:40 ?1410次閱讀
    機器<b class='flag-5'>學習</b>異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測系統

    使用MATLAB進行無監督學習

    監督學習是一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?1436次閱讀
    使用MATLAB進行無<b class='flag-5'>監督學習</b>