国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種自監督同變注意力機制,利用自監督方法來彌補監督信號差異

5b9O_deeplearni ? 來源:深度學習大講堂 ? 2020-05-12 10:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:近日,計算機視覺頂會 CVPR 2020 接收論文結果揭曉,從 6656 篇有效投稿中錄取了 1470 篇論文,錄取率約為 22%。中科院VIPL實驗室共七篇論文錄取,內容涉及弱監督語義分割、活體檢測、手勢識別、視覺問答、行人搜索、無監督領域自適應方法等方面,本文將予以詳細介紹。

01

1. Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation (Yude Wang, Jie Zhang, Meina Kan, Shiguang Shan, Xilin Chen)

基于類別標簽的弱監督語義分割作為一個具有挑戰性的問題在近年來得到了深入的研究,而類別響應圖(class activation map,簡稱CAM)始終是這一領域的基礎方法。但是由于強監督與弱監督信號之間存在差異,由類別標簽生成的CAM無法很好地貼合物體邊界。

本文提出了一種自監督同變注意力機制(self-supervised equivariant attention mechanism,簡稱SEAM),利用自監督方法來彌補監督信號差異。在強監督語義分割的數據增廣階段,像素層級標注和輸入圖像需經過相同的仿射變換,自此這種同變性約束被隱式地包含,而這種約束在只有類別標簽的CAM的訓練過程中是缺失的。因此,我們利用經過不同仿射變換的圖片得到的類別響應圖本應滿足的同變性來為網絡訓練提供自監督信號。除此之外,我們提出像素相關模塊(pixel correlation module,簡稱PCM),通過發掘圖像表觀信息,利用相似像素的特征來修正當前像素的預測結果,從而增強CAM預測結果的一致性。我們的方法在PASCAL VOC 2012數據集上進行了充分的實驗,驗證了算法的有效性,并取得當前最好性能。

02

2. Single-Side Domain Generalization for Face Anti-Spoofing (Yunpei Jia, Jie Zhang, Shiguang Shan, Xilin Chen)

由于不同數據集之間存在差異,很多活體檢測方法進行跨數據集測試時性能下降明顯。現有的一些方法借用領域泛化的思想,利用多個已有的源域數據去訓練模型,以得到一個領域不變的特征空間,從而在未知的目標域中進行測試時能利用學習到的通用判別特征,去提升模型的泛化性能。但是,由于不同數據集之間,攻擊樣本相對于正常樣本存在更大的差異(比如說攻擊方式的不同,攻擊樣本之間采集的環境差異),努力讓這些攻擊樣本去學習一個領域不變的特征空間是比較困難的,通常會得到一個次優解,如下圖左邊所示。因此,針對這一個問題,我們提出來一個端到端的單邊領域泛化框架,以進一步提升模型的性能。

其中主要思想在于,對于不同數據集中的正常樣本,我們去學習一個領域不變的特征空間;但是對于不同數據集中的攻擊樣本,我們去學習一個具有分辨性的特征空間,使相同數據集中的攻擊樣本盡可能接近,而不同數據集中的攻擊樣本盡可能遠離。最終效果會使攻擊樣本在特征空間中張成更大的區域,而正常樣本僅僅處在一個緊湊的區域中,從而能夠學習到一個對于正常樣本包圍更緊致的分類器,以達到在未知的目標域上更好的性能,如下圖右邊所示。

具體來說,我們引用一個域判別器,利用一種單邊的對抗學習,讓特征提取器僅僅對于正常樣本提取更具有泛化性能的特征。并且,我們提出一個不均衡的三元組損失函數,讓不同數據集之間的正常樣本盡可能接近而攻擊樣本盡可能遠離,以使得攻擊樣本在特征空間中張成一個更大的范圍。同時,我們還引入了特征和參數歸一化的思想,進一步地提升模型的性能。大量實驗表明,我們提出的方法是有效的,并且在四個公開數據庫上均達到了最優的性能。

03

3. Cross-domain Face Presentation Attack Detection via Multi-domain Disentangled Representation Learning (Guoqing Wang, Hu Han, Shiguang Shan, Xilin Chen)

目前,人臉呈現攻擊檢測(Presentation Attack Detection, 簡稱PAD)成為人臉識別系統中一個亟待解決的問題。傳統的方法通常認為測試集和訓練集來自于同一個域,結果表明這些方法并不能很好的推廣到未知場景中,因為學到的特征表示可能會對訓練集中的身份、光照等信息產生過擬合。

為此,本文針對跨域人臉呈現攻擊檢測提出一種高效的特征解耦方法。我們的方法包含特征解耦模塊(DR-Net)和多域學習模塊(MD-Net)。DR-Net通過生成模型學習了一對特征編碼器,可以解耦得到PAD相關的特征和身份信息相關的特征。MD-Net利用來自于不同域中解耦得到的特征進一步學習和解耦,得到與域無關的解耦特征。在當前公開的幾個數據集上的實驗驗證了所提方法的有效性。

04

4. An Efficient PointLSTM Network for Point Clouds based Gesture Recognition (Yuecong Min, Yanxiao Zhang, Xiujuan Chai, Xilin Chen)

現有的手勢識別方法往往采用視頻或骨架點序列作為輸入,但手部在整張圖片中所占比例較小,基于視頻的方法往往受限于計算量并且更容易過擬合,而基于骨架點的方法依賴于獲取的手部骨架點的精度。

本文提出了一個基于點云序列的長短期記憶模塊 (PointLSTM),可以直接從手部點云序列中捕獲手型特征和手部運動軌跡。該模塊為點云序列中的每一個點保留了獨立的狀態,在更新當前點的狀態時,通過一個權值共享的LSTM融合時空相鄰點的狀態和當前點的特征,可以在保留點云空間結構的同時提取長時序的空間和時序信息。此外,本文還提出了一個幀內狀態共享的模塊(PointLSTM-PSS)用于簡化計算量和分析性能提升來源。我們在兩個手勢識別數據集 (NVGesture和SHREC’17) 和一個動作識別數據集 (MSR Action3D) 上驗證了方法的有效性和泛化能力,提出的模型在4096個點(32幀,每幀采樣128點)的規模下,優于目前最好的基于手部骨架點序列的手勢識別方法和基于點云序列的動作識別方法。

05

5. Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene Text (Difei Gao, Ke li, Ruiping Wang, Shiguang Shan, Xilin Chen)

場景圖像中的文字通常會包含豐富的信息,比如,飯店的名字,產品的信息,等等。能夠理解這些場景文字,并回答與此相關的自然語言問題(即,場景文字問答任務,Text VQA)的智能體也將會有非常廣泛的應用前景。然而,對于當前的模型,場景文字問答任務仍十分具有挑戰。其關鍵的難點之一就是真實場景當中會出現大量的不常見的,多義的或有歧義的單詞,比如,產品的標簽,球隊的名稱等等。要想讓模型理解這些單詞的含義,僅僅訴諸于詞表有限的預訓練單詞嵌入表示(word embedding)是遠遠不夠的。一個理想的模型應該能夠根據場景中周圍豐富的多模態的信息推測出這些單詞的信息,比如,瓶子上顯著的單詞很有可能就是它的牌子。

根據這樣的思路,我們提出了一種新的視覺問答模型,多模態圖神經網絡(Multi-Modal Graph Neural Network,MM-GNN),它可以捕獲圖片當中各種模態的信息來推理出未知單詞的含義。具體來說,如下圖所示,我們的模型首先用三個不同模態的子圖來分別表示圖像中物體的視覺信息,文本的語言信息,以及數字型文本的數值信息。然后,我們引入三種圖網絡聚合器(aggregator),它們引導不同模態的消息從一個圖傳遞到另一個圖中,從而利用各個模態的上下文信息完善多模態圖中各個節點的特征表示。這些更新后的節點特征進而幫助后續的問答模塊。我們在近期提出的Text VQA和Scene Text VQA問答數據庫上進行了實驗,取得了state-of-the-art的性能,并驗證了方法的有效性。

06

6. TCTS: A Task-Consistent Two-stage Framework for Person Search (Cheng Wang,Bingpeng Ma,Hong Chang, Shiguang Shan, Xilin Chen)

當前最先進的行人搜索方法將行人搜索分為檢測和再識別兩個階段,但他們大多忽略了這兩個階段之間的一致性問題。一般的行人檢測器對 query 目標沒有特別的關注;再識別模型是在手工標注的裁剪框上訓練的,在實際情況中是沒有這樣完美的檢測結果的。

為了解決一致性問題,我們引入了一個目標一致的兩階段的行人搜索框架 TCTS,包括一個 identity-guided query(IDGQ)檢測器和一個檢測結果自適應(Detection Results Adapted ,DRA)的再識別模型。在檢測階段,IDGQ 檢測器學習一個輔助的身份分支來計算建議框和查詢圖片的相似度得分。同時考慮查詢相似度得分和前景得分,IDGQ為行人再識別階段生成 query-like 的邊界框。在再識別階段,我們預測檢測輸出的 bounding boxes 對應的身份標簽,并用使用這些樣本為 DRA 模型構造一個更實用的混合訓練集。混合訓練提高了 DRA 模型對檢測不精確的魯棒性。我們在CUHK-SYSU和PRW這兩個基準數據集上評估了我們的方法。我們的框架在CUHK-SYSU上達到了93.9%的mAP和95.1%的rank1精度,超越以往最先進的方法。

07

7. Unsupervised Domain Adaptation with Hierarchical Gradient Synchronization (Lanqing Hu,Meina Kan, Shiguang Shan, Xilin Chen)

無監督領域自適應方法的任務是,將已標注的源域數據集上的知識遷移到無標注的目標域,從而減小對新目標域的標注代價。而源域和目標域之間的差異是這個問題的難點,大多方法通過對齊兩個域的特征的分布來減小域之間的差異,但是仍然很難做到兩個不同分布的每一個局部塊都完美對齊,從而保證判別信息的很好保留。

本文提出一種層級梯度同步的方法,首先在域、類別、類組三個級別通過對抗學習進行條件分布的對齊,然后通過約束不同級別的域判別器的梯度保證相同的方向和幅度,由此提高分布對齊的內在一致性,加強類別結構的保留,從而得到更準確的分類結果。該方法在當前主流測試集Office-31,Office-Home,VisDA-2017上的結果都驗證了其有效性。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98042
  • 計算機視覺
    +關注

    關注

    9

    文章

    1715

    瀏覽量

    47625
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26190

原文標題:CVPR2020 | 中科院VIPL實驗室錄取論文詳解

文章出處:【微信號:deeplearningclass,微信公眾號:深度學習大講堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    ResNet、VGG)。RNN/LSTM:序列建模(如時間序列預測、NLP中的文本生成)。Transformer:注意力機制(如BERT、GPT)。 模型調優正則化:L1/L2正則化防止過擬合。超參數
    發表于 02-27 10:53

    豐臺區市場監督管理局赴昱櫟技術公司調研知識產權工作

    1月7日下午,北京市豐臺區市場監督管理局黨組副書記張鐵軍帶隊赴北京昱櫟技術有限公司走訪調研,重點圍繞知識產權創造、運用、保護與服務企業創新發展進行座談交流,旨在精準對接企業需求,優化區域創新
    的頭像 發表于 01-12 10:13 ?255次閱讀
    豐臺區市場<b class='flag-5'>監督</b>管理局赴昱櫟技術公司調研知識產權工作

    自然場景下注意力如何耳周腦電可靠監測

    試間相關性和頻譜熵三種方法來評估聽覺注意力。例如,語音包絡跟蹤通過分析腦電信號與語音慢波包絡的相關性,判斷聽者正在注意的說話者;被試間相關性則通過比較不同聽者之間
    的頭像 發表于 12-05 18:03 ?3931次閱讀
    自然場景下<b class='flag-5'>注意力</b>如何耳周腦電可靠監測

    電能質量在線監測裝置模塊故障會診斷嗎?

    是核心分析: 、模塊故障診斷的技術實現 1. 硬件級診斷機制 傳感器模塊:可檢測 CT/VT 開路、短路、比異常等顯性故障。例如,當
    的頭像 發表于 11-05 17:39 ?1296次閱讀

    使用MATLAB的支持向量機解決方案

    支持向量機 (SVM) 是一種監督機器學習算法,它能找到分離兩個類的數據點的最佳超平面。
    的頭像 發表于 10-21 15:00 ?636次閱讀
    使用MATLAB的支持向量機解決方案

    一種新的無刷直流電機反電動勢檢測方法

    無位置傳感器無刷直流電機的控制算法是近年來研究的熱點之,有霍爾位置信號直流電機根據霍爾狀態確定通斷功率器件。利用無刷直流電機的數學模型,根據反電動勢檢測原理,提出了
    發表于 08-07 14:29

    一種新的無刷直流電機反電動勢檢測方法

    無位置傳感器無刷直流電機的控制算法是近年來研究的熱點之,有霍爾位置信號直流電機根據霍爾狀態確定通斷功率器件。利用無刷直流電機的數學模型,根據反電動勢檢測原理,提出了
    發表于 08-04 14:59

    EL非監督分割白皮書丨5張OK圖、1分鐘建模、半小時落地的異常檢測工具!

    ,阿丘科技全新發布《EL非監督分割白皮書》,揭秘款極致速度、零門檻操作、穩定可靠的AI質檢神器,解決柔性產線換型慢、未知缺陷難捕捉等行業難題。傳統檢測技術的三大
    的頭像 發表于 07-11 15:21 ?647次閱讀
    EL非<b class='flag-5'>監督</b>分割白皮書丨5張OK圖、1分鐘建模、半小時落地的異常檢測工具!

    機器學習異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測系統

    本文轉:DeepHubIMBA無監督異常檢測作為機器學習領域的重要分支,專門用于在缺乏標記數據的環境中識別異常事件。本文深入探討異常檢測技術的理論基礎與實踐應用,通過IsolationForest
    的頭像 發表于 06-24 11:40 ?1409次閱讀
    機器學習異常檢測實戰:用Isolation Forest快速構建無標簽異常檢測系統

    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    一種無閾值方法:基于 LSTM 網絡的基線(個 LSTM 框架輔助幾個優化步驟)和無監督檢測(神經網絡和多種機器學習算法的組合)協同綜合分析時間序列。當時間序列顯示出清晰的周期性形
    的頭像 發表于 05-22 16:38 ?1021次閱讀
    提高IT運維效率,深度解讀京東云AIOps落地實踐(異常檢測篇)

    使用MATLAB進行無監督學習

    監督學習是一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?1435次閱讀
    使用MATLAB進行無<b class='flag-5'>監督</b>學習

    如何正確使用單相耦調壓變壓器?

    單相耦調壓變壓器是一種常見的電氣設備,廣泛應用于實驗室、工業生產以及家用電器等領域。它通過改變輸入電壓實現輸出電壓的調節,具有結構簡單、效率高、成本低等優點。然而,如果使用不當,不僅會影響設備
    的頭像 發表于 05-11 16:56 ?1853次閱讀
    如何正確使用單相<b class='flag-5'>自</b>耦調壓變壓器?

    使用ad9467-250采集低頻信號,請問有什么方法來提高sfdr嗎?

    你好,我現在在使用ad9467-250采集低頻信號,在測試3Mhz部分時sfdr只有86,采樣頻率是102.4Mhz,請問有什么方法來提高sfdr嗎
    發表于 04-24 06:05

    【幸狐Omni3576邊緣計算套件試用體驗】人臉識別

    RetinaFace 是帝國理工學院在 2019 年 5 月發表的論文中描述的人臉檢測算法,作者開源了相關代碼。 Retinaface 是一種單階段人臉檢測器,它通過聯合額外監督監督
    發表于 04-01 21:46

    一種基于基礎模型對齊的監督三維空間理解方法

    三維空間理解是推動自動駕駛、具身智能等領域中智能系統實現環境感知、交互的核心任務,其中3D語義占據預測 (Semantic Occupancy Prediction) 對三維場景進行精準的體素級建模。然而,當前主流方法嚴重依賴大規模標注數據,制約了模型的可擴展性和泛化能力。
    的頭像 發表于 03-18 15:01 ?973次閱讀
    <b class='flag-5'>一種</b>基于基礎模型對齊的<b class='flag-5'>自</b><b class='flag-5'>監督</b>三維空間理解<b class='flag-5'>方法</b>