国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌開發pipeline,在移動設備上可實時計算3D目標檢測

牽手一起夢 ? 來源:機器之心 ? 作者:佚名 ? 2020-03-13 15:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3月13日消息,谷歌宣布推出 MediaPipe Objectron,這是一種適用于日常物體的移動端實時3D目標檢測 pipeline,它能夠檢測 2D 圖像中的目標,并通過新創建 3D 數據集上訓練的機器學習模型來估計這些目標的姿態和大小。它在安卓、IOS 網頁等各種平臺上都能應用機器學習媒體模型,并加入了移動端試試 3D 檢測模型。目前 MediaPipe包含人臉檢測、手部檢測、頭發分割和視頻自動橫豎屏轉換等功能。

MediaPipe 是一個用于構建 pipeline 進而處理不同模態感知數據的跨平臺開源框架,Objectron 則在 MediaPipe 中實現,其能夠在移動設備上實時計算目標的定向 3D 邊界框。從單個圖像進行 3D 目標檢測。MediaPipe 可以在移動端上實時確認目標對象的位置、方向以及大小。整個模型非常精簡,速度也非???,研究者將整套方案都開源了出來。

獲取真實的3D訓練數據

隨著依賴于 3D 傳感器(如 LIDAR)的自動駕駛行業發展普及,現在已有大量街道場景的 3D 數據,但對于日常生活中擁有更細顆粒度的目標來說,有標注的 3D 數據集就非常有限了。所以,為了解決此問題,谷歌團隊使用了 AR 會話(Session)數據開發了一種全新的數據 Pipeline。

此外,隨著 ARCore 以及 ARkit 的出現,數億體量的智能手機擁有了 AR 功能,并且能夠通過 AR 會話取獲取更多的信息,包括相機姿態、稀疏 3D 點云、光照估計以及平面區域估計。為了標記真實數據,團隊構建了一個全新的標注工具,并且與 AR 會話數據一起使用,該標注工具使標注者得以快速標記目標的 3D 邊界框。

該工具使用了分屏視圖來顯示 2D 的視頻幀,同時在其左側疊加 3D 邊界框,并在右側顯示 3D 點云,攝像機方位以及所檢測到的水平面。標注器在 3D 視圖中繪制 3D 邊界框,并通過查看 2D 視頻幀中的投影來驗證其位置。

左:帶標注的 3D 邊界框所形成的投影展示在邊界框頂部,更易于驗證標注;右:通過檢測到的目標表面以及稀疏點云數據,可以為不同的相機姿態標注真實世界中的 3D 邊界框。

AR 合成數據

之前常用的方法會根據合成數據補充真實數據,以提高預測的準確性。然而這樣的做法通常會導致質量低下、不真實的數據,且如果要執行圖像的真實感渲染,又需要更多的計算力。

研究者采用了另一種稱之為 AR 合成數據(AR Synthetic Data Generation)的方法,只要將對象放到 AR 系統的工作場景中,我們就能利用相機姿態估計、水平面檢測、光照估計生成物理上可能存在的位置及場景。這種方法能生成高質量合成數據,并無縫匹配實際背景。通過結合真實數據與 AR 合成數據,研究者能將模型的準確性提高約 10%。

3D 目標檢測的流程是什么樣的

對于 3D 目標檢測,研究者先構建了一個單階段模型 MobilePose,以預測單張 RGB 圖像中某個目標的姿態和物理大小。該模型的主干是一個編碼器-解碼器架構,其構建在 MobileNet V2 的基礎上。研究者應用了多任務學習方法,來從檢測與回歸的角度聯合預測目標的形狀,且在預測形狀的過程中,其只依賴于標注的分割圖像。

MobilePose-Shape 網絡在中間層會帶有形狀預測模塊。

在模型的訓練中,如果數據沒有標注形狀,那也是可行的。只不過借助檢測邊界框,研究者可以預測形狀中心與分布。

為了獲得邊界框的最終 3D 坐標,研究者利用了一種完善的姿態估計算法(EPnP),它可以恢復對象的 3D 邊界框,而無需知道對象維度這一先驗知識。給定 3D 邊界框,我們可以輕松計算對象的姿態和大小。

下圖顯示了網絡架構和后處理過程,該模型輕巧到可以在移動設備上實時運行(在 Adreno 650 mobile GPU 上以 26 FPS 的速度運行)。

3D 目標檢測的神經網絡架構與后處理過程。

模型的示例結果,其中左圖為估計邊界框的原始 2D 圖像,中間為帶高斯分布的目標檢測,最右邊為預測的分割 Mask。

在 MediaPipe 中進行檢測和追蹤

當模型對移動設備獲得的每一幀圖像進行計算的時候,它可能會遇到晃動的情況,這是因為每一幀對目標邊界框預測本身的模糊性造成的。為了緩解這個問題,研究者采用了檢測+追蹤的框架,這一框架近期被用于 2D 檢測和追蹤中。這個框架減少了需要在每一幀上運行網絡的要求,因此可以讓模型的檢測更為精確,同時保證在移動端上的實時性。它同時還能保持識別幀與幀之間的目標,確保預測的連貫性,減少晃動。

為了進一步提升這一 pipeline 的效率,研究者設置模型在每幾幀后再進行一次模型推理。之后,他們使用名為快速動作追蹤(instant motion tracking)和 Motion Stills 技術進行預測和追蹤。當模型提出一個新的預測時,他們會根據重疊區域對檢測結果進行合并。

為了鼓勵研究者和開發者基于這一 pipeline 進行試驗,谷歌目前已經將研究成果開源到了 MediaPipe 項目中,包括端到端的移動設備應用 demo,以及在鞋、椅子兩個分類中訓練好的模型。研究者希望這一解決方案能夠更好地幫助到社區,并產生新的方法、應用和研究成果。團隊也希望能夠擴大模型到更多類別中,進一步提升在移動端設備的性能表現。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    3011

    瀏覽量

    115015
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111371
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中國移動咪咕客廳大屏2D3D沉浸先鋒體驗官北京招募啟幕

    月10日開啟,有意向的用戶掃描招募二維碼,填寫個人及家中智能電視相關信息完成報名,后續工作人員將對報名用戶進行篩選,并及時通知符合條件的用戶結果。成功入選后,用戶可免費享受3D智慧盒上門安裝服務,
    發表于 02-14 10:02

    Vitrox的v510i系列的3D AOI光學檢測設備

    V510i部署SMT生產線的 貼片機之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務是: 3D與2D復合檢測
    的頭像 發表于 12-04 09:27 ?653次閱讀

    英倫科技裸眼3D顯示產品與其它廠家有什么差異化?

    懸浮感、地形演變縱深感)。利用AI眼球追蹤(0.02秒響應)和神經網絡實時計算視線落點,解決了行業長期存在的“大尺寸與寬視角不可兼得”矛盾——傳統技術偏離中心視角
    的頭像 發表于 12-03 10:36 ?837次閱讀
    英倫科技裸眼<b class='flag-5'>3D</b>顯示產品與其它廠家有什么差異化?

    Vitrox 3D在線X-RAY檢測技術

    中國的核心代理商,致力于將前沿的自動光學檢測技術帶給國內電子制造業。今天,我們將深入剖析Vitrox核心技術之一——3D在線X-RAY自動檢測系統?的工作原理 一、技術背景:為何需要3D
    的頭像 發表于 12-03 10:05 ?646次閱讀

    使用OpenUSD實現互操作3D工作流(

    通用場景描述簡稱 OpenUSD,是一個開放且擴展的生態系統,用于 3D 世界內描述內容、合成數據、進行仿真和開展協作。
    的頭像 發表于 09-23 15:37 ?922次閱讀

    玩轉 KiCad 3D模型的使用

    “ ?本文將帶您學習如何將 3D 模型與封裝關聯、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型。? ” ? 日常的 PCB 設計中,
    的頭像 發表于 09-16 19:21 ?1.2w次閱讀
    玩轉 KiCad <b class='flag-5'>3D</b>模型的使用

    iTOF技術,多樣化的3D視覺應用

    。 ◆ 應用2—機艙內的 3D 傳感 應用3—自主移動機器人 (AMR) 室外(~150,000 勒克斯)和黑暗環境中進行障礙物檢測
    發表于 09-05 07:24

    存儲1000張人臉特征的3D人臉識別模塊 支持小程序管理

    ,專為用于智能智能門鎖,智能門禁,金融支付等場景研發,支持3D活體檢測,3D人臉識別,紅外活體檢測,可見光活體檢測等,可以抵御照片、視頻等二
    的頭像 發表于 08-25 12:02 ?440次閱讀
    <b class='flag-5'>可</b>存儲1000張人臉特征的<b class='flag-5'>3D</b>人臉識別模塊 支持小程序管理

    3D激光輪廓儀實現在線3D測量和檢測

    Z-Trak? Express 1K5 系列專為實現經濟高效的在線3D測量和檢測而設計,具有高速檢測能力和實時處理性能。
    的頭像 發表于 08-08 17:17 ?968次閱讀
    <b class='flag-5'>3D</b>激光輪廓儀<b class='flag-5'>可</b>實現在線<b class='flag-5'>3D</b>測量和<b class='flag-5'>檢測</b>

    如何提高3D成像設備的部署和設計優勢

    設計時需平衡性能、成本與集成需求。標準化協議(如GigEVision)和軟件方案(如eBUSEdge)解決了設備兼容性問題,通過即插即用功能簡化系統集成,降低開發復雜度,推動3D視覺從專業領域向主流應用轉型。
    的頭像 發表于 08-06 15:49 ?766次閱讀
    如何提高<b class='flag-5'>3D</b>成像<b class='flag-5'>設備</b>的部署和設計優勢

    基于DSP的SPWM混合查表實時計算

    ,內部還集成了三相 PWM 波形發生器。兩者的結合,使我們完全能通過實時計算來產生任意頻率的 SPWM 波。TMS320F241的波形發生器屬于 DSP 芯片的外部事件管理模塊,占用CPU 的時間很少
    發表于 07-28 14:36

    基于樹莓派的工業級 3D 打印機!

    可靠、高性能的解決方案。解決方案樹莓派計算模塊4企業規模大型組織所屬行業制造業Formlabs是一家美國公司,專注于3D打印機以及相關軟件和材料的開發與制造。該公司
    的頭像 發表于 06-29 08:22 ?1158次閱讀
    基于樹莓派的工業級 <b class='flag-5'>3D</b> 打印機!

    海伯森3D閃測傳感器,工業檢測領域的高精度利器

    優勢,解決了接觸式測量效率、精度、適應性的瓶頸,尤其適合大批量生產、復雜結構檢測、高附加值產品場景。工業檢測領域,
    的頭像 發表于 06-20 17:46 ?1466次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業<b class='flag-5'>檢測</b>領域的高精度利器

    TechWiz LCD 3D應用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區域(自定義區域)進行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設置局部摩擦
    發表于 06-16 08:46

    告別漫長等待! 3D測量竟然可以如此的絲滑

    據進行實時處理,快速得到全視角的彩色高精度2D圖像和3D點云。產品優勢01高精度的在線3D檢測采用業界頂級的CMOS感光元件和超低畸變遠心光
    的頭像 發表于 05-12 18:01 ?673次閱讀
    告別漫長等待! <b class='flag-5'>3D</b>測量竟然可以如此的絲滑