国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

3D姿態估計 時序卷積+半監督訓練

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 22:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

首發:AIWalker

標題&作者團隊

1. 論文簡要

在這項工作中,視頻中的3D姿態可以通過全卷積模型來估計,具體是在二維關鍵點上通過空洞時間卷積的模型得到3D姿態。我們還介紹了一種不帶標簽(反向投影)的半監督式訓練方法。我們先從未標注視頻中得到2D姿態,然后估計3D姿態和最后反向投影到輸入的2D關鍵點。在實驗中,全卷積模型相比之前state-of-arts,在Human3.6 M上平均每個關節位置誤差小6mm,對應誤差降低11%,模型在HumanEva-I中也有顯著改進。

代碼和模型的下載地址:https://github.com/facebookre...

2. 背景介紹

我們的工作重點是視頻中的三維人體姿態估計。我們以最先進的方法為基礎,然后將問題描述為2D關鍵點檢測三維姿態估計,這種方法可能導致不同的3D姿態對應相同的2D關鍵點。早期為解決這一問題主要通過RNN構建時序信息,但是由于RNN的串行結構無法多幀并行處理,因此本文提出一個完整的卷積架構,在二維關鍵點上執行時序卷積用于視頻中準確的三維姿態預測,該方法兼容任何二維關鍵點檢測器,并能通過空洞卷積有效地處理較大的上下文信息。與依賴RNNs的方法相比,它在計算復雜度和參數數量方面都提供了更高的精度、簡單性和效率。

在構建一個高度精確和高效的架構之后,接下來需要關注訓練數據,本文引入了半監督訓練的方案,因為3D姿態的監督學習需要大量的帶標簽的訓練數據,收集3D人體姿態標簽需要昂貴的動作捕捉設備和長時間錄制。本文的方法的靈感來自于無監督機器翻譯中的循環一致性,即翻譯到中間語言和翻譯回原始語言的往返應該接近恒等函數。具體地說,使用現有的2D關鍵點檢測器為未標記的視頻預測2D關鍵點,然后預測3D姿態,最后將它們映射回2D空間中。

本文創新點有兩個:(1)在網絡結構方面,基于空洞時序卷積將2D關鍵點軌跡推理出3D人體姿態,在計算量和模型參數量上遠小于基于RNN的模型;(2)在訓練數據方面,采用半監督學習解決數據量不足的問題,相比于其他方法,該方法僅僅需要相機內部參數(數據增強的過程中需要相機參數對ground-truth姿態進行幾何變換),不需要2D標簽或帶有外部攝像機參數的多視圖圖像。

image-20201126105219606

3. 相關工作

深度學習成功之前,大部分的三維姿態估計方法都是基于特征工程和骨骼和關節靈活性的假設。目前大多數的姿態估計方法是在二維姿態估計器的基礎上,建立了一種新的三維姿態估計器,然后 被提升到3D空間中。

視頻姿態估計,大多數以前的工作都是在單幀的背景下進行的,但最近幾年利用視頻的時間信息來產生更可靠的預測,并降低對噪音的敏感性。最近,有人提出了LSTM序列到序列學習模型,該模型將視頻中的二維姿態序列編碼為固定大小的向量,然后解碼為三維姿態序列。然而,輸入和輸出序列具有相同的長度,2D姿態的確定性轉換是更自然的選擇。用seq2seq模型進行的實驗表明,輸出姿勢在較長的序列上容易產生漂移。

4. 本文方法

4.1 時序空洞卷積模型

image-20201126112311029

我們的模型是一個具有殘差結構的完全卷積的架構,它將一個2D姿態序列作為輸入,并通過時間卷積對其進行轉換。卷積模型允許在批處理維度和時間維度上并行化,而RNNs不能在時間維度上并行化。在卷積模型中,無論序列長度如何,輸出和輸入之間的梯度路徑都是固定長度的,這可以緩解影響RNN的消失和爆炸梯度。卷積架構也提供了對時間感受域的精確控制,這有利于建立三維姿態估計任務的時間依賴模型。此外,使用空洞卷積能夠對長期依賴關系進行建模,同時也保持較高計算效率。(上圖表示帶有2D關鍵點的243幀圖像,經過網絡推理得到3D關節點)

4.2 半監督訓練方法

image-20201126113555405

本文引入了一種半監督訓練方法,以提高真實的標記數據不足的情況下的模型的準確性。我們利用未標記的視頻,然后結合一個現成的2D關鍵點檢測器,來擴展監督損失函數一個反向投影損失項。解決了未標記數據的自動編碼問題:編碼器(位姿估計器)根據二維關節坐標進行三維位姿估計,解碼器(投影層)將三維位姿投影回二維關節坐標。當來自解碼器的二維關節坐標遠離原始輸入時,訓練就會受到懲罰。

上圖將監督組件與充當正則化器的非監督組件組合在一起。這兩個目標是共同優化的,標記數據占據Batch的前半部分,未標記數據占據Batch的后半部分一半。對于標記數據,我們使用真實三維姿態作為目標,訓練一個監督損失。未標記的數據用于實現自動編碼器損失,其中預測的3D姿態被投影回2D,然后檢查與輸入的一致性。

軌跡模型,由于透視投影,屏幕上的2D姿態都取決于軌跡(人體根節點整體位置,可以理解成人體中心點)和3D姿態(所有關節點相對于根關節的位置)。目標函數為每個關節的加權平均軌跡的位置誤差(WMPJPE)。

骨骼長度損失,添加一個軟約束來近似匹配未標記batch的受試者與已標記batch的受試者的平均骨長度。

5. 實驗論證

5.1 數據集與評價標準

數據集有兩個分別是Human3.6M,HumanEva-I,評價標準是Protocol 1: MPJPE(每個關節點的平均誤差), Protocol 2:P-MPJPE(與標簽數據對準后的平移、旋轉、縮放誤差),Protocol 3:N-MPJPE(只在比例上與真實標簽相匹配)

5.2 2D姿態估計

2D姿態估計網絡模型:stacked hourglass detector, Mask R-CNN with ResNet-101-FPN,CPN

5.3 3D姿態估計

image-20201126140916717

image-20201126141002629

image-20201126141144006

6. 總結

介紹了一個簡單的完全卷積模型用于視頻中三維人體姿態估計。網絡結構利用時間信息在2D關鍵點軌跡上進行空洞卷積。這項工作的第二個貢獻是反向投影,這是一種半監督訓練方法,在標記數據稀缺的情況下提高性能。該方法適用于未標記的視頻,只需要內在的攝像機參數,使其在運動捕捉具有挑戰性的場景中切實可行。

7. 論文復現

推薦閱讀

本文章著作權歸作者所有,任何形式的轉載都請注明出處。更多動態濾波,圖像質量,超分辨相關請關注我的專欄深度學習從入門到精通

審核編輯:符乾江
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3953

    瀏覽量

    142617
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    常見3D打印材料介紹及應用場景分析

    3D打印材料種類豐富,不同材料性能差異明顯。本文介紹PLA、ABS、PETG等常見3D打印材料的特點與應用場景,幫助讀者了解3D打印用什么材料更合適,為選材提供基礎參考。
    的頭像 發表于 12-29 14:52 ?612次閱讀
    常見<b class='flag-5'>3D</b>打印材料介紹及應用場景分析

    簡單認識3D SOI集成電路技術

    在半導體技術邁向“后摩爾時代”的進程中,3D集成電路(3D IC)憑借垂直堆疊架構突破平面縮放限制,成為提升性能與功能密度的核心路徑。
    的頭像 發表于 12-26 15:22 ?577次閱讀
    簡單認識<b class='flag-5'>3D</b> SOI集成電路技術

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅 在電子工程師的日常工作中,評估和開發磁傳感器是一項常見且重要的任務。英飛凌(Infineon
    的頭像 發表于 12-18 17:15 ?818次閱讀

    iDS iToF Nion 3D相機,開啟高性價比3D視覺新紀元!

    一、友思特新品 友思特 iDS uEye Nion iTof 3D相機將 120 萬像素的卓越空間分辨率與可靠的深度精度相結合—即使在極具挑戰性的環境中也能確保獲取精細的 3D 數據。 其外殼達到
    的頭像 發表于 12-15 14:59 ?369次閱讀
    iDS iToF Nion <b class='flag-5'>3D</b>相機,開啟高性價比<b class='flag-5'>3D</b>視覺新紀元!

    微納尺度的神筆——雙光子聚合3D打印 #微納3D打印

    3D打印
    楊明遠
    發布于 :2025年10月25日 13:09:29

    在Ubuntu20.04系統中訓練神經網絡模型的一些經驗

    模型。 我們使用MNIST數據集,訓練一個卷積神經網絡(CNN)模型,用于手寫數字識別。一旦模型被訓練并保存,就可以用于對新圖像進行推理和預測。要使用生成的模型進行推理,可以按照以下步驟進行操作: 1.
    發表于 10-22 07:03

    玩轉 KiCad 3D模型的使用

    “ ?本文將帶您學習如何將 3D 模型與封裝關聯、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型。? ” ? 在日常的 PCB 設計中,我們大部分
    的頭像 發表于 09-16 19:21 ?1.2w次閱讀
    玩轉 KiCad <b class='flag-5'>3D</b>模型的使用

    季豐電子邀您相約2025國際3D視覺感知與應用大會

    9月20日 - 21日,國際3D視覺感知與應用大會將在蘇州太湖國際會議中心盛大啟幕,大會議題涵蓋3D成像與測量、3D視覺、3D顯示、3D應用
    的頭像 發表于 09-08 15:03 ?1046次閱讀

    AD 3D封裝庫資料

    ?AD ?PCB 3D封裝
    發表于 08-27 16:24 ?7次下載

    3D打印能用哪些材質?

    3D打印的材質有哪些?不同材料決定了打印效果、強度、用途乃至安全性,本文將介紹目前主流的3D打印材質,幫助你找到最適合自己需求的材料。
    的頭像 發表于 07-28 10:58 ?3775次閱讀
    <b class='flag-5'>3D</b>打印能用哪些材質?

    如何在樹莓派 AI HAT+上進行YOLO姿態估計

    大家好,接下來會為大家開一個樹莓派5和YOLO的連載專題。內容包括四個部分:在樹莓派5上使用YOLO進行物體和動物識別-入門指南在樹莓派5上開啟YOLO姿態估計識別之旅!如何在樹莓派AIHAT+上進
    的頭像 發表于 07-20 20:34 ?1009次閱讀
    如何在樹莓派 AI HAT+上進行YOLO<b class='flag-5'>姿態</b><b class='flag-5'>估計</b>?

    3D AD庫文件

    3D庫文件
    發表于 05-28 13:57 ?6次下載

    2025年3D工業相機選型及推薦

    3D工業相機的選型
    的頭像 發表于 05-21 16:49 ?1758次閱讀
    2025年<b class='flag-5'>3D</b>工業相機選型及推薦

    基于RV1126開發板的人臉姿態估計算法開發

    人臉姿態估計是通過對一張人臉圖像進行分析,獲得臉部朝向的角度信息。姿態估計是多姿態問題中較為關鍵的步驟。一般可以用旋轉矩陣、旋轉向量、四元數
    的頭像 發表于 04-14 17:21 ?2209次閱讀
    基于RV1126開發板的人臉<b class='flag-5'>姿態</b><b class='flag-5'>估計</b>算法開發

    3D閃存的制造工藝與挑戰

    3D閃存有著更大容量、更低成本和更高性能的優勢,本文介紹了3D閃存的制造工藝與挑戰。
    的頭像 發表于 04-08 14:38 ?2426次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰