国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習在計算機視覺上的四大應用

如意 ? 來源:CSDN ? 作者:呆呆的貓 ? 2020-08-24 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

深度學習計算機視覺上的應用

計算機視覺中比較成功的深度學習的應用,包括人臉識別,圖像問答,物體檢測,物體跟蹤。

人臉識別:

這里說人臉識別中的人臉比對,即得到一張人臉,與數據庫里的人臉進行比對;或同時給兩張人臉,判斷是不是同一個人。

這方面比較超前的是湯曉鷗教授,他們提出的DeepID算法在LWF上做得比較好。他們也是用卷積神經網絡,但在做比對時,兩張人臉分別提取了不同位置特征,然后再進行互相比對,得到最后的比對結果。最新的DeepID-3算法,在LWF達到了99.53%準確度,與肉眼識別結果相差無幾。

圖片問答問題:

這是2014年左右興起的課題,即給張圖片同時問個問題,然后讓計算機回答。比如有一個辦公室靠海的圖片,然后問“桌子后面有什么”,神經網絡輸出應該是“椅子和窗戶”。

深度學習在計算機視覺上的四大應用

這一應用引入了LSTM網絡,這是一個專門設計出來具有一定記憶能力的神經單元。特點是,會把某一個時刻的輸出當作下一個時刻的輸入。可以認為它比較適合語言等,有時間序列關系的場景。因為我們在讀一篇文章和句子的時候,對句子后面的理解是基于前面對詞語的記憶。

圖像問答問題是基于卷積神經網絡和LSTM單元的結合,來實現圖像問答。LSTM輸出就應該是想要的答案,而輸入的就是上一個時刻的輸入,以及圖像的特征,及問句的每個詞語。

物體檢測問題:

① Region CNN

深度學習在物體檢測方面也取得了非常好的成果。2014年的Region CNN算法,基本思想是首先用一個非深度的方法,在圖像中提取可能是物體的圖形塊,然后深度學習算法根據這些圖像塊,判斷屬性和一個具體物體的位置。

深度學習在計算機視覺上的四大應用

為什么要用非深度的方法先提取可能的圖像塊?因為在做物體檢測的時候,如果你用掃描窗的方法進行物體監測,要考慮到掃描窗大小的不一樣,長寬比和位置不一樣,如果每一個圖像塊都要過一遍深度網絡的話,這種時間是你無法接受的。

所以用了一個折中的方法,叫Selective Search。先把完全不可能是物體的圖像塊去除,只剩2000左右的圖像塊放到深度網絡里面判斷。那么取得的成績是AP是58.5,比以往幾乎翻了一倍。有一點不盡如人意的是,region CNN的速度非常慢,需要10到45秒處理一張圖片。

② Faster R-CNN方法

而且我在去年NIPS上,我們看到的有Faster R-CNN方法,一個超級加速版R-CNN方法。它的速度達到了每秒七幀,即一秒鐘可以處理七張圖片。技巧在于,不是用圖像塊來判斷是物體還是背景,而把整張圖像一起扔進深度網絡里,讓深度網絡自行判斷哪里有物體,物體的方塊在哪里,種類是什么?

經過深度網絡運算的次數從原來的2000次降到一次,速度大大提高了。

Faster R-CNN提出了讓深度學習自己生成可能的物體塊,再用同樣深度網絡來判斷物體塊是否是背景?同時進行分類,還要把邊界和給估計出來。

Faster R-CNN可以做到又快又好,在VOC2007上檢測AP達到73.2,速度也提高了兩三百倍。

③ YOLO

去年FACEBOOK提出來的YOLO網絡,也是進行物體檢測,最快達到每秒鐘155幀,達到了完全實時。它讓一整張圖像進入到神經網絡,讓神經網絡自己判斷這物體可能在哪里,可能是什么。但它縮減了可能圖像塊的個數,從原來Faster R-CNN的2000多個縮減縮減到了98個。

同時取消了Faster R-CNN里面的RPN結構,代替Selective Search結構。YOLO里面沒有RPN這一步,而是直接預測物體的種類和位置。

YOLO的代價就是精度下降,在155幀的速度下精度只有52.7,45幀每秒時的精度是63.4。

④ SSD

在arXiv上出現的最新算法叫Single Shot MultiBox Detector,即SSD。

它是YOLO的超級改進版,吸取了YOLO的精度下降的教訓,同時保留速度快的特點。它能達到58幀每秒,精度有72.1。速度超過Faster R-CNN 有8倍,但達到類似的精度。

物體跟蹤

所謂跟蹤,就是在視頻里面第一幀時鎖定感興趣的物體,讓計算機跟著走,不管怎么旋轉晃動,甚至躲在樹叢后面也要跟蹤。

深度學習在計算機視覺上的四大應用

深度學習對跟蹤問題有很顯著的效果。是第一在線用深度學習進行跟蹤的文章,當時超過了其它所有的淺層算法。

今年有越來越多深度學習跟蹤算法提出。去年十二月ICCV 2015上面,馬超提出的Hierarchical Convolutional Feature算法,在數據上達到最新的記錄。它不是在線更新一個深度學習網絡,而是用一個大網絡進行預訓練,然后讓大網絡知道什么是物體什么不是物體。

將大網絡放在跟蹤視頻上面,然后再分析網絡在視頻上產生的不同特征,用比較成熟的淺層跟蹤算法來進行跟蹤,這樣利用了深度學習特征學習比較好的好處,同時又利用了淺層方法速度較快的優點。效果是每秒鐘10幀,同時精度破了記錄。

最新的跟蹤成果是基于Hierarchical Convolutional Feature,由一個韓國的科研組提出的MDnet。它集合了前面兩種深度算法的集大成,首先離線的時候有學習,學習的不是一般的物體檢測,也不是ImageNet,學習的是跟蹤視頻,然后在學習視頻結束后,在真正在使用網絡的時候更新網絡的一部分。這樣既在離線的時候得到了大量的訓練,在線的時候又能夠很靈活改變自己的網絡。

基于嵌入式系統的深度學習

回到ADAS問題(慧眼科技的主業),它完全可以用深度學習算法,但對硬件平臺有比較高的要求。在汽車上不太可能把一臺電腦放上去,因為功率是個問題,很難被市場所接受。

現在的深度學習計算主要是在云端進行,前端拍攝照片,傳給后端的云平臺處理。但對于ADAS而言,無法接受長時間的數據傳輸的,或許發生事故后,云端的數據還沒傳回來。

那是否可以考慮NVIDIA推出的嵌入式平臺?NVIDIA推出的嵌入式平臺,其運算能力遠遠強過了所有主流的嵌入式平臺,運算能力接近主流的頂級CPU,如臺式機的i7。那么慧眼科技在做工作就是要使得深度學習算法,在嵌入式平臺有限的資源情況下能夠達到實時效果,而且精度幾乎沒有減少。

具體做法是,首先對網絡進行縮減,可能是對網絡的結構縮減,由于識別場景不同,也要進行相應的功能性縮減;另外要用最快的深度檢測算法,結合最快的深度跟蹤算法,同時自己研發出一些場景分析算法。三者結合在一起,目的是減少運算量,減少檢測空間的大小。在這種情況下,在有限資源上實現了使用深度學習算法,但精度減少的非常少。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7806

    瀏覽量

    93188
  • 人臉識別
    +關注

    關注

    77

    文章

    4127

    瀏覽量

    88455
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124393
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    上海計算機視覺企業行學術沙龍走進西井科技

    12月5日,由中國圖象圖形學學會青年工作委員會(下簡稱“青工委”)、上海市計算機學會計算機視覺專委會(下簡稱“專委會”)聯合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發表于 12-16 15:39 ?578次閱讀

    使用代理式AI激活傳統計算機視覺系統的三種方法

    當前的計算機視覺系統擅長于識別物理空間與流程中的事件,卻難以詮釋場景細節及其意義,也無法推理后續可能發生的情況。
    的頭像 發表于 12-01 09:44 ?635次閱讀

    2025中國計算機大會DPU技術論壇成功舉辦

    近日,備受矚目的第22屆中國計算機大會(CNCC2025)哈爾濱開幕。本屆大會注冊人數突破1.2萬人,匯聚了來自全球計算機領域的頂尖學者、產業領袖、青年學子及國際組織代表。大會以“數智賦能、無限可能”為主題,旨在
    的頭像 發表于 11-02 09:29 ?707次閱讀

    STM32計算機視覺開發套件:B-CAMS-IMX攝像頭模塊技術解析

    CMOS RGB圖像傳感器、ISM330DLC慣性運動單元和VL53L5CX ToF傳感器。B-CAMS-IMX可用于任何具有MIPI CSI-2? 接口(帶22引腳FFC連接器)的STM32開發板,輕松STM32微控制器和微處理器實現全功能
    的頭像 發表于 10-20 09:46 ?1261次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發套件:B-CAMS-IMX攝像頭模塊技術解析

    如何在機器視覺中部署深度學習神經網絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實,這種印象忽視了該技術為機器視覺(乃至生產自動化)帶來的潛力,因為深度學習并非只屬于
    的頭像 發表于 09-10 17:38 ?900次閱讀
    如何在機器<b class='flag-5'>視覺</b>中部署<b class='flag-5'>深度</b><b class='flag-5'>學習</b>神經網絡

    【作品合集】賽昉科技VisionFive 2單板計算機開發板測評

    、OpenSUSE、OpenKylin、OpenEuler、Deepin等,及在這些操作系統運行的各類軟件。 活動詳情地址: 【RISC-V專題】VisionFive 2單板計算機免費試用 作品合集: 作者
    發表于 09-04 09:08

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)美國田納西州納什維爾召開。
    的頭像 發表于 07-29 16:54 ?1208次閱讀

    自動化計算機經過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經過工程設計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠各種不同的極端環境中運行。自動化
    的頭像 發表于 07-21 16:44 ?615次閱讀
    自動化<b class='flag-5'>計算機</b>經過加固后有什么好處?

    自動化計算機的功能與用途

    工業自動化是指利用自動化計算機來控制工業環境中的流程、機器人和機械,以制造產品或其部件。工業自動化的目的是提高生產率、增加靈活性,并提升制造過程的質量。工業自動化汽車制造中體現得最為明顯,其中許多
    的頭像 發表于 07-15 16:32 ?738次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    工業計算機與商用計算機的區別有哪些

    工業計算機是一種專為工廠和工業環境設計的計算系統,具有高可靠性和穩定性,能夠應對惡劣環境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其各種工業自動化場景中
    的頭像 發表于 07-10 16:36 ?740次閱讀
    工業<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區別有哪些

    Blue Lion超級計算機將在NVIDIA Vera Rubin運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機 Blue Lion,其算力比該中心現有的 SuperMUC-NG 高性能計算機提升了約 30 倍。這臺新的超級計算機將在 NVIDIA Vera Rubin 架構
    的頭像 發表于 06-12 15:39 ?1143次閱讀

    利用邊緣計算和工業計算機實現智能視頻分析

    IVA的好處、實際部署應用程序以及工業計算機如何實現這些解決方案。一、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復雜的計算機視覺,通常與卷積神經網
    的頭像 發表于 05-16 14:37 ?830次閱讀
    利用邊緣<b class='flag-5'>計算</b>和工業<b class='flag-5'>計算機</b>實現智能視頻分析

    一文帶你了解工業計算機尺寸

    一項艱巨的任務。本博客將指導您了解關鍵的工業計算機尺寸、使用案例。關鍵工業計算機外形要素及其使用案例一、工業微型PC尺寸范圍:寬度:100毫米-180毫米深度:10
    的頭像 發表于 04-24 13:35 ?1031次閱讀
    一文帶你了解工業<b class='flag-5'>計算機</b>尺寸

    計算機網絡入門指南

    計算機網絡是指將地理位置不同且具有獨立功能的多臺計算機及其外部設備,通過通信線路連接起來,在網絡操作系統、網絡管理軟件及網絡通信協議的管理和協調下,實現資源共享和信息傳遞的計算機系統。
    的頭像 發表于 04-22 14:29 ?2241次閱讀
    <b class='flag-5'>計算機</b>網絡入門指南

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數據的支持范圍。增加這項支持后,該平臺將能夠用于開發低功耗、低內存的邊緣AI視覺模型。這將給諸多應用領域的機器
    的頭像 發表于 03-11 15:11 ?813次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的支持