国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習中圖像分割的方法和應用

新機器視覺 ? 來源:新機器視覺 ? 作者:missinglink.ai ? 2020-11-27 10:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹使圖像分割的方法,包括傳統方法和深度學習方法,以及應用場景。

基于人工智能和深度學習方法的現代計算機視覺技術在過去10年里取得了顯著進展。如今,它被用于圖像分類、人臉識別、圖像中物體的識別、視頻分析和分類以及機器人自動駕駛車輛的圖像處理等應用上。

許多計算機視覺任務需要對圖像進行智能分割,以理解圖像中的內容,并使每個部分的分析更加容易。今天的圖像分割技術使用計算機視覺深度學習模型來理解圖像的每個像素所代表的真實物體,這在十年前是無法想象的。

深度學習可以學習視覺輸入的模式,以預測組成圖像的對象類。用于圖像處理的主要深度學習架構是卷積神經網絡(CNN),或者是特定的CNN框架,如AlexNet、VGG、Inception和ResNet。計算機視覺的深度學習模型通常在專門的圖形處理單元(GPU)上訓練和執行,以減少計算時間。

什么是圖像分割?

圖像分割是計算機視覺中的一個關鍵過程。它包括將視覺輸入分割成片段以簡化圖像分析。片段表示目標或目標的一部分,并由像素集或“超像素”組成。圖像分割將像素組織成更大的部分,消除了將單個像素作為觀察單位的需要。圖像分析有三個層次:

分類- 將整幅圖片分成“人”、“動物”、“戶外”等類別

目標檢測- 檢測圖像中的目標并在其周圍畫一個矩形,例如一個人或一只羊。

分割- 識別圖像的部分,并理解它們屬于什么對象。分割是進行目標檢測和分類的基礎。

語義分割 vs. 實例分割

在分割過程本身,有兩個粒度級別:

語義分割- 將圖像中的所有像素劃分為有意義的對象類。這些類是“語義上可解釋的”,并對應于現實世界的類別。例如,你可以將與貓相關的所有像素分離出來,并將它們涂成綠色。這也被稱為dense預測,因為它預測了每個像素的含義。

實例分割- 標識圖像中每個對象的每個實例。它與語義分割的不同之處在于它不是對每個像素進行分類。如果一幅圖像中有三輛車,語義分割將所有的車分類為一個實例,而實例分割則識別每一輛車。

傳統的圖像分割方法

還有一些過去常用的圖像分割技術,但效率不如深度學習技術,因為它們使用嚴格的算法,需要人工干預和專業知識。這些包括:

閾值- 將圖像分割為前景和背景。指定的閾值將像素分為兩個級別之一,以隔離對象。閾值化將灰度圖像轉換為二值圖像或將彩色圖像的較亮和較暗像素進行區分。

K-means聚類- 算法識別數據中的組,變量K表示組的數量。該算法根據特征相似性將每個數據點(或像素)分配到其中一組。聚類不是分析預定義的組,而是迭代地工作,從而有機地形成組。

基于直方圖的圖像分割- 使用直方圖根據“灰度”對像素進行分組。簡單的圖像由一個對象和一個背景組成。背景通常是一個灰度級,是較大的實體。因此,一個較大的峰值代表了直方圖中的背景灰度。一個較小的峰值代表這個物體,這是另一個灰色級別。

邊緣檢測- 識別亮度的急劇變化或不連續的地方。邊緣檢測通常包括將不連續點排列成曲線線段或邊緣。例如,一塊紅色和一塊藍色之間的邊界。

深度學習如何助力圖像分割方法

現代圖像分割技術以深度學習技術為動力。下面是幾種用于分割的深度學習架構:

使用CNN進行圖像分割,是將圖像的patch作為輸入輸入給卷積神經網絡,卷積神經網絡對像素進行標記。CNN不能一次處理整個圖像。它掃描圖像,每次看一個由幾個像素組成的小“濾鏡”,直到它映射出整個圖像。

傳統的cnn網絡具有全連接的層,不能處理不同的輸入大小。FCNs使用卷積層來處理不同大小的輸入,可以工作得更快。最終的輸出層具有較大的感受野,對應于圖像的高度和寬度,而通道的數量對應于類的數量。卷積層對每個像素進行分類,以確定圖像的上下文,包括目標的位置。

集成學習將兩個或兩個以上相關分析模型的結果合成為單個。集成學習可以提高預測精度,減少泛化誤差。這樣就可以對圖像進行精確的分類和分割。通過集成學習嘗試生成一組弱的基礎學習器,對圖像的部分進行分類,并組合它們的輸出,而不是試圖創建一個單一的最優學習者。

DeepLab使用DeepLab的一個主要動機是在幫助控制信號抽取的同時執行圖像分割 —— 減少樣本的數量和網絡必須處理的數據量。另一個動機是啟用多尺度上下文特征學習 —— 從不同尺度的圖像中聚合特征。DeepLab使用ImageNet預訓練的ResNet進行特征提取。DeepLab使用空洞卷積而不是規則的卷積。每個卷積的不同擴張率使ResNet塊能夠捕獲多尺度的上下文信息。DeepLab由三個部分組成:

Atrous convolutions— 使用一個因子,可以擴展或收縮卷積濾波器的視場。

ResNet— 微軟的深度卷積網絡(DCNN)。它提供了一個框架,可以在保持性能的同時訓練數千個層。ResNet強大的表征能力促進了計算機視覺應用的發展,如物體檢測和人臉識別。

Atrous spatial pyramid pooling (ASPP)— 提供多尺度信息。它使用一組具有不同擴展率的復雜函數來捕獲大范圍的上下文。ASPP還使用全局平均池(GAP)來合并圖像級特征并添加全局上下文信息。

SegNet neural network一種基于深度編碼器和解碼器的架構,也稱為語義像素分割。它包括對輸入圖像進行低維編碼,然后在解碼器中利用方向不變性能力恢復圖像。然后在解碼器端生成一個分割圖像。

圖像分割的應用

圖像分割有助于確定目標之間的關系,以及目標在圖像中的上下文。應用包括人臉識別、車牌識別和衛星圖像分析。例如,零售和時尚等行業在基于圖像的搜索中使用了圖像分割。自動駕駛汽車用它來了解周圍的環境。

目標檢測和人臉檢測

這些應用包括識別數字圖像中特定類的目標實例。語義對象可以分類成類,如人臉、汽車、建筑物或貓。

人臉檢測- 一種用于許多應用的目標檢測,包括數字相機的生物識別和自動對焦功能。算法檢測和驗證面部特征的存在。例如,眼睛在灰度圖像中顯示為谷地。

醫學影像- 從醫學影像中提取臨床相關信息。例如,放射學家可以使用機器學習來增強分析,通過將圖像分割成不同的器官、組織類型或疾病癥狀。這可以減少運行診斷測試所需的時間。

機器視覺- 捕捉和處理圖像,為設備提供操作指導的應用。這包括工業和非工業的應用。機器視覺系統使用專用攝像機中的數字傳感器,使計算機硬件和軟件能夠測量、處理和分析圖像。例如,檢測系統為汽水瓶拍照,然后根據合格 - 不合格標準分析圖像,以確定瓶子是否被正確地填充。

視頻監控 — 視頻跟蹤和運動目標跟蹤

這涉及到在視頻中定位移動物體。其用途包括安全和監視、交通控制、人機交互和視頻編輯。

自動駕駛自動駕駛汽車必須能夠感知和理解他們的環境,以便安全駕駛。相關類別的對象包括其他車輛、建筑物和行人。語義分割使自動駕駛汽車能夠識別圖像中的哪些區域可以安全駕駛。

虹膜識別一種能識別復雜虹膜圖案的生物特征識別技術。它使用自動模式識別來分析人眼的視頻圖像。

人臉識別從視頻中識別個體。這項技術將從輸入圖像中選擇的面部特征與數據庫中的人臉進行比較。

零售圖像識別

這個應用讓零售商了解貨架上商品的布局。算法實時處理產品數據,檢測貨架上是否有商品。如果有產品缺貨,他們可以找出原因,通知跟單員,并為供應鏈的相應部分推薦解決方案。

原文標題:深度學習中的圖像分割:方法和應用

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器視覺
    +關注

    關注

    165

    文章

    4797

    瀏覽量

    126040
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265267
  • 人臉識別
    +關注

    關注

    77

    文章

    4127

    瀏覽量

    88455

原文標題:深度學習中的圖像分割:方法和應用

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SAM(通用圖像分割基礎模型)丨基于BM1684X模型部署指南

    前言SAM是Meta提出的一個分割一切的提示型模型,其在1100萬張圖像上訓練了超過10億個掩碼,實現了強大的零樣本泛化,突破了分割界限。本例程對SAM官方開源倉庫的模型和算法進行移植,使之能
    的頭像 發表于 01-12 16:17 ?302次閱讀
    SAM(通用<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>基礎模型)丨基于BM1684X模型部署指南

    機器學習深度學習需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?184次閱讀
    機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>中</b>需避免的 7 個常見錯誤與局限性

    穿孔機頂頭檢測儀 機器視覺深度學習

    ,能適用惡劣工況,在粉塵、高溫、氧化皮等惡劣環境均可正常工作。 測量原理 利用頂頭與周圍的物質(水、空氣、導盤等)紅外輻射能量的差異,用熱成像相機拍攝出清晰的圖片,再通過深度學習短時間內深度
    發表于 12-22 14:33

    手機板 layout 走線跨分割問題

    學習layout時,都在說信號線不可跨分割,但是在工作為了成本不能跨分割似乎也非絕對。 在后續工作,跨
    發表于 09-16 14:56

    深度學習對工業物聯網有哪些幫助

    、實施路徑三個維度展開分析: 一、深度學習如何突破工業物聯網的技術瓶頸? 1. 非結構化數據處理:解鎖“沉睡數據”價值 傳統困境 :工業物聯網70%以上的數據為非結構化數據(如設備振動波形、紅外
    的頭像 發表于 08-20 14:56 ?1022次閱讀

    自動駕駛Transformer大模型會取代深度學習嗎?

    [首發于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領域的驚艷表現,“Transformer架構是否正在取代傳統深度學習”這一話題一直被
    的頭像 發表于 08-13 09:15 ?4181次閱讀
    自動駕駛<b class='flag-5'>中</b>Transformer大模型會取代<b class='flag-5'>深度</b><b class='flag-5'>學習</b>嗎?

    深度學習遇上嵌入式資源困境,特征空間如何破局?

    近年來,隨著人工智能(AI)技術的迅猛發展,深度學習(Deep Learning)成為最熱門的研究領域之一。在語音識別、圖像識別、自然語言處理等領域,深度
    發表于 07-14 14:50 ?1241次閱讀
    當<b class='flag-5'>深度</b><b class='flag-5'>學習</b>遇上嵌入式資源困境,特征空間如何破局?

    迅為RK3576開發板攝像頭實時推理測試-ppseg?圖像分割

    迅為RK3576開發板攝像頭實時推理測試-ppseg 圖像分割
    的頭像 發表于 07-11 14:31 ?866次閱讀
    迅為RK3576開發板攝像頭實時推理測試-ppseg?<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>

    大模型推理顯存和計算量估計方法研究

    方法。 一、引言 大模型推理是指在已知輸入數據的情況下,通過深度學習模型進行預測或分類的過程。然而,大模型的推理過程對顯存和計算資源的需求較高,這給實際應用帶來了以下挑戰: 顯存不足:大模型在推理過程
    發表于 07-03 19:43

    【正點原子STM32MP257開發板試用】基于 DeepLab 模型的圖像分割

    是谷歌團隊提出的一種用于語義分割深度學習模型,屬于 DeepLab 系列模型的第三代版本。它在圖像語義分割任務中表現優異,能夠高效地捕獲
    發表于 06-21 21:11

    嵌入式AI技術之深度學習:數據樣本預處理過程中使用合適的特征變換對深度學習的意義

    ? 作者:蘇勇Andrew 使用神經網絡實現機器學習,網絡的每個層都將對輸入的數據做一次抽象,多層神經網絡構成深度學習的框架,可以深度理解數據中所要表示的規律。從原理上看,使用
    的頭像 發表于 04-02 18:21 ?1516次閱讀

    labview調用yolo目標檢測、分割、分類、obb

    labview調用yolo目標檢測、分割、分類、obb、pose深度學習,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發表于 03-31 16:28

    【AIBOX 應用案例】單目深度估計

    ?Firefly所推出的NVIDIA系列的AIBOX可實現深度估計,該技術是一種從單張或者多張圖像預測場景深度信息的技術,廣泛應用于計算機視覺領域,尤其是在三維重建、場景理解和環境感知等任務
    的頭像 發表于 03-19 16:33 ?1104次閱讀
    【AIBOX 應用案例】單目<b class='flag-5'>深度</b>估計

    如何排除深度學習工作臺上量化OpenVINO?的特定層?

    無法確定如何排除要在深度學習工作臺上量化OpenVINO?特定層
    發表于 03-06 07:31