国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

面對未知分類的圖像,如何改進分類器、如何克服這個問題呢?

MqC7_CAAI_1981 ? 來源:未知 ? 作者:李倩 ? 2018-10-19 16:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當訓練好的圖像分類器遇到了訓練數據里不存在的類別的圖像時,顯然它會給出離譜的預測。那么我們應該如何改進分類器、如何克服這個問題呢?

老實說,這真的是領域內的一個老大難問題,沒人能給出完美的答案。Jetpac(現被谷歌收購) CTO、蘋果畢業生、TensorFlow團隊成員Pete Warden 在個人博客中寫下了他的一些個人思考。

幾天前,正與我合作的 Plant Village團隊向我提出了一個他們正在開發的應用程序(app)中遇到的問題。他們用 app 檢測植物所患的疾病。當它面對植物的葉子時,app能夠給出很好的分類結果,然而如果你讓 app處理電腦鍵盤的圖片,它會認為這是一種受損了的植物。如下圖。

左圖:AWDamage: 100%;右圖:AWDamage: 98%

既滑稽又合理

對于計算機視覺研究者們來說,這樣的結果并不令人意外。但對于大多數其他人來說,這還是令人十分震驚的。所以我想解釋為什么會發生這種情況,以及我們可以對此做些什么。

作為人類,我們習慣于對我們看到的周圍世界中的任何事物進行分類。自然而然地,我們也希望機器具有相同的能力。然而,大多數模型僅僅被訓練用來識別非常有限的物體集合,例如 ImageNet競賽中的 1,000種物體。至關重要的是,訓練過程假設模型面對的每個樣本一定都是屬于這些類別的其中一種物體,而且預測結果也在這個集合的范圍內。模型不能選擇給出「我不知道!」這樣的預測結果,也沒有訓練數據會幫助分類器學到這樣的預測結果。對于科學研究來說,這樣的簡化處理是很有意義的,但是當我們在現實世界中使用這些最終得到的模型時還是會引起一些問題。

回想起我在 Jetpac工作的日子,我們很難說服人們相信這個具有開創性的 AlexNet模型是一個巨大的突破。因為每當我們把運行著 AlexNet的用于演示的手機給測試者使用時,他們總會將自己的臉讓手機識別,而手機的預測結果往往是「氧氣面罩」或「安全帶」之類的東西。這是因為 ImageNet競賽數據集中的物體不包括任何人的標簽,但是大多數帶有面具或安全帶標簽的圖片都同時包含了人的面孔和標簽對應的物體。另一個令人尷尬的錯誤是,當人們把手機對準一個盤子時,它給出的預測結果竟然是「馬桶座」!這是因為在初始的類別中沒有盤子,而外形特征最接近的白色圓形物體是一個馬桶。

漸漸地,我認為這是一個「開放世界」與「封閉世界」的問題。我們假設模型所要面對的物體在有限的范圍內,從而訓練和評估模型。然而,一旦模型走出實驗室,被用于現實世界的種種應用,這樣的假設就不成立了。用戶會根據這些模型面對任意放在它們面前的物體的預測結果來評判它們的性能,無論這些物體是否在訓練集中。

那么,解決方案是什么呢?

不幸的是,我不知道有什么簡單的方法可以解決這個問題,但是我已經看到了目前有一些策略是對此有所幫助的。顯然,我們可以從向訓練數據添加一個「未知」類開始處理該問題。而壞消息是,這樣做會引發一連串其它的問題:

「未知」類應該包含怎樣的樣本?可能屬于該類的自然圖像無窮無盡,所以你應該如何選擇哪些圖片應該被納入該類?

在「未知」類中,每種不同類別的物體需要包含多少?

對于那些看起來和你重點關注的類非常相似的未知對象,你應該做些什么?例如,添加一個不在 ImageNet的 1,000類物體中,而看起來幾乎完全相同的品種的狗,可能會使許多本應該正確匹配的物體被迫分類到未知類中。

在訓練數據中需要讓未知類的樣本占多大的比重?

最后一點實際上涉及到了一個更廣闊的問題。你從圖像分類網絡中的到的預測值并不是概率。它們假設你看到任何特定類的概率等于該類在訓練數據中出現的頻率。如果你用一個分類里包含企鵝的動物分類器檢測亞馬遜叢林中的動物,你就會遇到這個問題,因為(幾乎)所有看到企鵝的事件都會是假正例誤報(false positive,顯然這里是不會出現企鵝的,所以當模型認為自己看到了企鵝的時候一定是錯誤的)。即使是對于美國城市中的狗的種類,罕見的品種在 ImageNet訓練數據中出現的次數也要比在一個寵物狗公園中多,所以他們會被過度描述為假正類。通常的解決方案是弄清在計算過程中你將面臨的先驗概率,然后利用它們將校準值應用到網絡的輸出中,從而獲得更接近真實概率的結果。

在實際的應用程序中,從整體上幫助解決該問題的主要策略是:將模型的適用范圍限制在「應用程序將面對的物體與模型的訓練數據匹配」的情況。要做到這一點,一個簡單的方法就是對產品進行設計。你可以創建一個用戶界面,指引人們在運行分類器之前確保攝像頭畫面中已經出現了要分類的目標,這和那些要求你對支票或其他文檔進行拍照的應用程序經常做的是一樣的。

稍微復雜一點的方案是,你可以編寫一個獨立的圖像分類器,它試圖去識別那些那些主圖像分類器不能識別的情況。這和添加一個單一的「未知」類是不同的,因為它的作用更像一種級聯操作,或者用做一個詳細的模型前的過濾器。在識別農作物患病情況的例子中,視覺上的操作環境足夠獨特,所以只需要訓練一個訓練一個模型來區分葉子和隨機選擇的其他圖片。這些照片之間有足夠的相似性,而門模型至少應該能夠識別出圖片是否是在不支持的場景中拍攝的。該門模型將在運行完整的圖像分類器之前運行,如果它沒有檢測到一些看起來像是植物的東西,它就會提前跳出程序并且返回表明沒有發現任何植物的錯誤信息。

要求你對信用卡拍照或執行其它光學字符識別(OCR)過程的應用程序通常會混合使用屏幕上的方向和檢測模糊性或不協調性,從而指導用戶拍攝可以成功處理的照片。而一個用于回答「那是樹葉嗎?」這樣的問題的獨立圖像分類模型則是這種接口模式的簡單版本。

本文給出的可能并不是一個令人滿意的答案,但是一旦你把機器學習技術引入到帶有限制的研究問題之后,它們就會反應出用戶期望目標的混亂。在一個人對一個物體的認知過程中,存在很多常識和外部知識,而我們在經典的圖像分類任務中并沒有獲取這些知識。為了獲得滿足用戶期望的結果,我們必須圍繞我們的模型設計一個完整的系統,這個系統能夠理解它們將被部署到的環境,并切不僅僅基于模型的輸出作出明智的決策。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 分類器
    +關注

    關注

    0

    文章

    153

    瀏覽量

    13790
  • 圖像分類
    +關注

    關注

    0

    文章

    96

    瀏覽量

    12496
  • 計算機視覺
    +關注

    關注

    9

    文章

    1715

    瀏覽量

    47638

原文標題:面對未知分類的圖像,我要如何拯救我的分類器

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    變頻通訊控制的分類

    ?變頻通訊控制作為工業自動化領域的關鍵技術,其分類方式多樣,主要可從通訊協議、傳輸介質、拓撲結構以及應用場景等維度進行系統劃分。以下結合技術原理與行業實踐,詳細闡述變頻通訊控制的分類
    的頭像 發表于 03-06 07:39 ?50次閱讀
    變頻<b class='flag-5'>器</b>通訊控制的<b class='flag-5'>分類</b>

    圖像采集卡分類、接口與性能指標詳解

    圖像采集卡是機器視覺、工業檢測、安防監控、醫療影像等領域的核心硬件,核心作用是將相機等圖像源輸出的模擬/數字信號轉化為計算機可識別、處理的數字圖像數據,同時完成信號同步、緩存、傳輸等關鍵操作,其
    的頭像 發表于 01-29 16:55 ?480次閱讀
    <b class='flag-5'>圖像</b>采集卡<b class='flag-5'>分類</b>、接口與性能指標詳解

    比較的簡介分類

    個。以至于無法穩定在中間放大區,再不跳到低電平,再不跳到高電平。比較分類比較分類有:電壓比較、單線比較
    的頭像 發表于 11-21 20:13 ?480次閱讀
    比較<b class='flag-5'>器</b>的簡介<b class='flag-5'>分類</b>

    基于級聯分類的人臉檢測基本原理

    本次分享的內容是基于級聯分類的人臉檢測基本原理 1) 人臉檢測概述 關于人臉檢測算法,目前主流方法分為兩類,一類是基于知識,主要方法包括模板匹配,人臉特征,形狀和邊緣,紋理特征,顏色特征
    發表于 10-30 06:14

    發布元服務配置應用分類、標簽和資質信息

    分類標簽和資質管理”菜單選擇元服務歸屬的類別和標簽,同時將所需的資質文件提交給華為運營人員審核。資質文件審核通過后,您選擇的標簽才能生效,之后才可選擇生效標簽進行配置。關于資質文件的具體要求,請
    發表于 10-29 16:47

    RFID在垃圾分類中的核心優勢

    RFID在垃圾分類中的核心優勢精準溯源每個居民或單位的垃圾桶配備唯一編碼的RFID標簽,系統可記錄每次投放的時間、地點和責任人,實現垃圾來源可追溯。自動識別分類在智能垃圾箱上安裝RFID讀寫,當
    的頭像 發表于 09-23 11:08 ?557次閱讀
    RFID在垃圾<b class='flag-5'>分類</b>中的核心優勢

    傳感大全分類

    傳感大全分類
    發表于 09-04 16:56 ?8次下載

    RFID標簽在垃圾分類的應用

    二、RFID標簽在垃圾分類中的優勢高效率:RFID可以快速批量讀取垃圾信息,大幅縮短操作時間,提高垃圾分類效率。準確性:RFID減少了人工操作的錯誤率,提高了垃圾分類的準確性和可靠性。實時性:通過
    的頭像 發表于 07-31 16:48 ?791次閱讀
    RFID標簽在垃圾<b class='flag-5'>分類</b>的應用

    產品分類管理API接口

    ? 產品分類管理是現代電商、庫存系統和內容管理平臺的核心功能,它通過API接口實現高效的分類創建、查詢、更新和刪除操作。本文將逐步介紹產品分類管理API的設計原理、關鍵功能和實現方法,幫助您構建可靠
    的頭像 發表于 07-25 14:20 ?475次閱讀
    產品<b class='flag-5'>分類</b>管理API接口

    風華貼片電感的標準分類體系

    作為國內電子元器件領域的領軍企業,風華高科通過構建多維度分類體系,實現了貼片電感產品的精準定位與高效應用。其分類邏輯融合了結構特征、功能特性及場景適配性,形成了涵蓋產品形態、技術參數、應用領域
    的頭像 發表于 05-19 14:04 ?667次閱讀
    風華貼片電感的標準<b class='flag-5'>分類</b>體系

    在友晶LabCloud平臺上使用PipeCNN實現ImageNet圖像分類

    利用深度卷積神經網絡(CNN)進行圖像分類是通過使用多個卷積層來從輸入數據中提取特征,最后通過分類層做決策來識別出目標物體。
    的頭像 發表于 04-23 09:42 ?1094次閱讀
    在友晶LabCloud平臺上使用PipeCNN實現ImageNet<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>

    基于RV1126開發板實現自學習圖像分類方案

    在RV1126開發板上實現自學習:在識別前對物體圖片進行模型學習,訓練完成后通過算法分類得出圖像的模型ID。 方案設計邏輯流程圖,方案代碼分為分為兩個業務流程,主體代碼負責抓取、合成圖像,算法代碼負責訓練和檢測功能
    的頭像 發表于 04-21 13:37 ?11次閱讀
    基于RV1126開發板實現自學習<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>方案

    MEMS聲敏傳感分類與應用

    等多個領域展現出了廣闊的應用前景。本文將帶您深入了解MEMS聲敏傳感分類與應用,探索這個微型化聲音世界的奧秘。 ? 一、MEMS聲敏傳感分類
    的頭像 發表于 04-17 16:50 ?1578次閱讀

    電子元器件的分類方式

    電子元器件可以按照不同的分類標準進行分類,以下是一些常見的分類方式。
    的頭像 發表于 04-16 14:52 ?3019次閱讀

    各類電機有沒有編碼?如何分類

    工業電機中,有些電機自帶編碼,而有些則不帶。編碼通常用于提供電機的位置、速度或方向等反饋信息,以實現更精確的控制。以下是對電機及其編碼分類和特點的詳細分析: ? 一、電機
    的頭像 發表于 03-16 11:09 ?1833次閱讀