国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

到底是什么讓機器學習達不到我們的期待呢?

nlfO_thejiangme ? 2018-03-27 13:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習雖然能夠在很多地方顯示出強大的力量,同時也被集成到了很多的商業流程中去,但它依舊有一些不完美的地方,今天我們就通過一些典型的例子來深刻感受一下機器學習的局限性。

人臉識別

目前最先進的人臉識別系統可以達到99%的準確率。作為使用最為廣泛的機器學習算法,人臉識別得到了飛速的發展,但在這背后需要我們對幾件事情保持清醒。首先,99%的正確率是來自與驗證數據集的測試結果,而驗證數據集則來自于與訓練數據集相同的數據集,并從中隨機抽取。這就意味著數據的均值和方差與訓練數據十分相似。但當我們將系統置于真實情況下時,實際照片的特性與訓練數據不可能相同,那么實際的精度很有可能低于99%。

模型有時候會將其他的東西識別成人臉(假陽性)或者忘卻漏掉了人臉(假陰性)。不同的模型在不同的階段有著不同的表現,在使用時你需要確定你需要什么樣層次的模型,給出多高的精度是可以接受的。在選擇權衡算法時,一個模型在檢測幾千張臉時錯檢幾十張,而另一個模型可以將準確率提高一半但需要10x的處理時間和運算,那么前者將會是不錯的選擇。剩下的可以交給人類來做,我們對于少量假陽性和假陰性的樣本有著非常快的準確識別能力。

下面是幾個關于模型訓練的數據清理經驗。最好的當然是保證每一張臉都可以很容易地看到,沒有模糊遮擋,也沒有很奇怪的角度。同時圖像要保持適度的分辨率,分辨率太高的圖像容易引入造成算法失效的噪音。

光學字符識別(OCR)

目前最先進的光學字符識別系統對于文件的識別與排版已經有十分優異。基于邊緣檢測、計算機視覺與字符識別的技術使得OCR不斷改進,對于掃描文檔幾乎沒有障礙了。

但目前OCR還不能夠勝任的是非掃描文件的識別,這也是驗證碼還能作為網站人類識別的功能存在。人類對于字母識別有著無與倫比的能力,無論是模糊、扭曲、顏色不同都不在話下,而計算機望塵莫及。

OCR很有用但對于一些場景下使用不當就會文不對題,下面這張球賽的截頻就是一個典型的例子。

上圖如果用OCR識別很有可能生成這樣的一大串:

[0] PREMIER LEAGUE [1] TOT 2 [2] M [3] U [4] 0 [5] 36:2 [6] 4 [7] SPORTS [8] NEW 0 BUR 0 [9] HALFTIME [10] LIVE [11] NBCSN

如果沒有上下文語境我們很難明白識別出的意思,哪里是隊名哪里是logo?這會造成很大的混亂。

我們不應該像使用通用OCR一樣來直接簡單粗暴的套用,而是需要針對情況進行分析。對于上面的例子如果我們想要追蹤球員,那么目標追蹤的方法會很好,但如果想要追蹤比賽分數和時間,那么將OCR限定在固定區域中會是不錯的選擇。

視 頻

視頻是一種很神奇的存在,雖然很多機器學習模型能在視頻上實現和照片一樣的效果,但總會有意想不到的情況。數字世界的解碼和封裝總是與視頻的壓縮率和長寬比耦合在一起。

同時考慮到處理時間和算力的限制,對視頻進行處理時我們往往選擇低分辨的格式。當你選擇低分辨率或者較高的壓縮時,視頻并不會是一組連續的靜態圖片,所以計算機視覺的識別方法將會與靜態圖片中的識別方法有很大的差別。

為了說明這一情況我們可以隨便點開一個視頻并暫停,如下圖所示。人們的臉變得模糊、角度和整體形象都顯得和靜態下十分不同。

下面應該是計算機看到的人臉區域:

你能從中認出圖中的主角是誰嗎?如果對你來說很困難那么對于計算機來說也不容易!

對于人類來說,在視頻中識別人臉很容易,但要把獨立的幀抽取出來你會發現圖像質量出乎意料的差。

但我們也不能否定機器學習,因為機器學習在大多數情況下對于視頻的自動化分類和標注時十分重要的手段。我們需要明白的是我們期望得到的結果以及如何去修正模型實際的表現。如果一個龐大的全球名人識別模型對一段視屏進行檢測可能會出現很多假陽性的結果,但是如果使用一個僅僅包含幾個著名人士的模型來檢測則會得到好得多的結果。如果你的模型表現不好,你還可以從數據的角度來改進,譬如說某個節目中人臉出現的位置就可以作為先驗知識來幫助機器提高正確率。我們需要嘗試不同的模型和工作流總能取得成功。

如何成功的應用機器學習?

機器學習十分強大,有人將它應用于檢測學術造假的論文,也有人將它應用于人臉身份認證、不良內容的裸露檢測等。同樣也用于為用戶推薦商品和服務的推薦引擎上,在這樣的場景下假陽性和假陰性的推薦結果不會造成太大影響,事實上一些異常推薦還為用戶探索新事物提供了條件。

還有改善搜索引擎的個性化能力,檢測農作物動物的疾病以及預測產量等等方面。機器學習將會有無數的應用,我們對它充滿期待,但同時也會把握住期待的方向讓機器學習正常運轉。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人臉識別
    +關注

    關注

    77

    文章

    4127

    瀏覽量

    88506
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136983

原文標題:靈魂拷問:是什么讓機器學習達不到我們的期待呢?(開頭有個大事兒)

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    強化學習自動駕駛模型學習更快嗎?

    是一種機器通過“試錯”學會決策的辦法。與監督學習不同,監督學習是有人提供示范答案,模型去模仿;而強化
    的頭像 發表于 01-31 09:34 ?655次閱讀
    強化<b class='flag-5'>學習</b>會<b class='flag-5'>讓</b>自動駕駛模型<b class='flag-5'>學習</b>更快嗎?

    MOS管到底是什么?和三極管、繼電器有什么本質區別?

    出現的“實力派選手”,常常被與三極管、繼電器放在一起比較。不少人在選型時會困惑:MOS管到底是什么?它和我們熟悉的三極管、繼電器,核心差異又在哪里?今天就用通俗的語言拆解清楚
    的頭像 發表于 01-07 13:46 ?557次閱讀
    MOS管<b class='flag-5'>到底是</b>什么?和三極管、繼電器有什么本質區別?

    PCB加工中的“流膠”到底是怎么影響阻抗的?

    是好事,高速先生支持每一個有夢想的人。但是光有夢想肯定控不好阻抗,高速先生一定會把你們搖醒,你們好好思考下到底有什么因素會影響加工的阻抗誤差哈! 影響阻抗的因素有很多,高速先生之前文章也寫過不少
    發表于 12-23 10:14

    IGBT到底是什么?-從名稱入手來帶您了解

    對于工作需要用到IGBT、但從未專業學習過IGBT的人來說, IGBT到底是什么、它為什么叫IGBT、它的核心關鍵詞是什么、要怎么理解它 等一系列問題并無法一次性在某個地方獲取到,都需要查閱大量的資料,學習大量的基礎才能有個初步
    的頭像 發表于 11-25 17:38 ?1571次閱讀
    IGBT<b class='flag-5'>到底是</b>什么?-從名稱入手來帶您了解

    驅動芯片到底有多重要?這些黑科技電子設備飛起來!

    你知道嗎? 驅動芯片 就像電子設備的心臟,沒有它,你的手機、電腦、智能家電統統都會變成廢鐵!但這么重要的東西,99%的人卻對它一無所知。 驅動芯片到底是什么鬼? 簡單來說,驅動芯片就是控制其他
    的頭像 發表于 11-25 08:37 ?429次閱讀
    驅動芯片<b class='flag-5'>到底</b>有多重要?這些黑科技<b class='flag-5'>讓</b>電子設備飛起來!

    請問Keil中的map文件到底是什么意思?

    Keil中的map文件到底是什么意思?里面是如何進行相關執行操作的
    發表于 11-25 06:59

    單片機和嵌入式,到底是什么關系?

    很多人初次接觸嵌入式開發時,都會聽到一句話:“嵌入式其實就是單片機。”可當你真正開始學習時,會發現嵌入式和單片機雖然經常“捆綁”在一起提,但它們好像又不是一回事。這篇文章,我們就來厘清這兩個概念
    的頭像 發表于 11-14 10:28 ?1555次閱讀
    單片機和嵌入式,<b class='flag-5'>到底是</b>什么關系?

    RFID電子標簽:生活和工作開掛的神奇科技

    出門過ETC不用停車、超市結賬不用挨個掃碼、酒店開門不用插鑰匙 —— 你有沒有發現,這些生活變便捷的場景里,都藏著同一個 “幕后功臣”:RFID電子標簽。這個看似不起眼的小技術,早已悄悄滲透到我們
    的頭像 發表于 11-13 10:06 ?566次閱讀

    單片機的差分信號到底是什么?

    差分信號到底是什么?通俗來講,就是驅動端發送兩個等值、反相的信號,接收端通過比較這兩個電壓的差值來判斷邏輯狀態“0”還是“1”。 差分信號的產生是由輸入源發出信號后經過緩沖器和倒相器后,所產生
    發表于 11-12 06:44

    IEC 到底是什么?為什么它能影響全球?

    IEC 到底是什么?為什么它能影響全球?
    的頭像 發表于 09-04 17:07 ?3599次閱讀

    晶振的 “負載電容” 到底是什么

    負載電容,到底是什么? 負載電容,簡單來說,是指晶振的兩條引線連接IC塊內部及外部所有有效電容之和,我們可以將其看作晶振片在電路中串接的電容。從更專業的角度講,它是為了使晶振能夠在其標稱頻率下穩定
    的頭像 發表于 07-25 16:26 ?1086次閱讀

    請問編譯純rtos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?

    編譯純rtos到底是選擇Linux+rtos的sdk編譯only rtos還是直接使用rtos sdk?
    發表于 07-11 07:22

    智能盒子到底是什么東西?昇騰310深度測評:為何能成為行業新寵?

    人摸不著頭腦的“智能盒子”。各位搞技術、搞工程的朋友,咱們在工作中是不是經常聽到“智能盒子”這個說法?每次聽到這個詞,我猜很多人心里都在犯嘀咕:這東西到底是個啥玩意兒?難道就是個裝了點智能軟件的普通盒子?它到底有啥用?能給咱們
    的頭像 發表于 04-27 10:46 ?1898次閱讀
    智能盒子<b class='flag-5'>到底是</b>什么東西?昇騰310深度測評:為何能成為行業新寵?

    一文給你講透!DA板卡到底是什么?它和主板又有哪些不同?

    大家好,我是老王,在電子行業干了十幾年,今天我就用“大白話”給大家講講DA板卡到底是啥,它和咱們常說的“主板”有啥區別。文章里會穿插一些表格和實際案例,保證你讀完不僅能懂,還能跟朋友吹牛!
    的頭像 發表于 04-24 16:48 ?2435次閱讀
    一文給你講透!DA板卡<b class='flag-5'>到底是</b>什么?它和主板又有哪些不同?

    ST25R3916B輸出功率達不到1.6W,與手冊不符是怎么回事?

    ST25R3916B輸出功率達不到1.6W
    發表于 03-13 06:02