国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

BEVSegFormer創造了新的BEV分割SOTA

Nullmax紐勱 ? 來源:紐勱科技 ? 作者:紐勱科技 ? 2022-04-27 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自動駕駛而言,BEV(鳥瞰圖)下的語義分割是一項重要任務。盡管這項工作已經吸引了大量的研究,但靈活處理自動駕駛車輛上的任意相機配置(單個或多個攝像頭),仍然是一項挑戰。

為此,Nullmax的感知團隊提出了BEVSegFormer,這一基于Transformer的BEV語義分割方法,可面向任意配置的相機進行BEV語義分割。

這項研究的題目為《BEVSegFormer: Bird's Eye View Semantic Segmentation From Arbitrary Camera Rigs》,論文鏈接:https://arxiv.org/abs/2203.04050。

為了評估這一算法的效果,Nullmax在nuScenes公開數據集以及Nullmax的自采數據集上進行了驗證。實驗結果表明,BEVSegFormer對任意相機配置的BEV語義分割,具有出色的性能表現。并且在nuScenes驗證集上,BEVSegFormer創造了新的BEV分割SOTA。

在接下來的工作中,我們還計劃針對自動駕駛以及BEV語義分割的一些其他挑戰,展開進一步的研究。

歡迎對計算機視覺及自動駕駛感知感興趣的小伙伴加入我們,一起探索!

01

關于BEVSegFormer

在自動駕駛或者機器人導航系統中,以BEV形式對感知信息進行表征,具有至關重要的作用,因為它可以為規劃和控制提供諸多的便利。

比如,在無地圖導航方案中,構建本地BEV地圖,不僅成為了高精地圖外的另一種選擇,并且對于包括智體行為預測以及運動規劃等感知系統下游任務而言,也非常重要。而利用相機的輸入進行BEV語義分割,通常被視為構建本地BEV地圖的第一步。

為此,傳統方法一般會先在圖像空間生成分割結果,然后通過逆透視變換(IPM)函數轉換到BEV空間。雖然這是一種連接圖像空間和BEV空間的簡單直接的方法,但它需要準確的相機內外參,或者實時的相機位姿估計。所以,視圖變換的實際效果有可能比較差。

以車道線分割為例,在一些挑戰性場景中,比如遮擋或者遠處區域,使用IPM的傳統方法提供的結果就不夠準確,如圖所示。

d90fae6c-c5ca-11ec-bce3-dac502259ad0.png

近年來,深度學習方法已被研究用于BEV語義分割。Lift-Splat-Shoot通過逐像素深度估計結果完成了從圖像視圖到BEV的視圖變換。不過使用深度估計,也增加了視圖變換過程的復雜度。此外,有一些方法應用MLP或者FC算子來進行視圖變換。這些固定的視圖變換方法,學習圖像空間和BEV空間之間的固定映射,因此不依賴于輸入的數據。

而基于Transformer的方法,是在BEV空間下進行感知的另一個研究方向。在目標檢測任務中,DETR3D引入了一種3D邊界框檢測方法,直接從多個相機圖像的2D特征生成3D空間中的預測。3D空間和2D圖像空間之間的視圖變換,通過交叉注意模塊的3D到2D查詢來實現。

受此啟發,我們提出了BEVSegFormer,通過在Transformer中使用交叉注意機制進行BEV到圖像的查詢,來計算視圖變換。

BEVSegFormer由3個主要的組件組成:

共享的主干網絡,用于提取任意相機的特征圖;

Transformer編碼器,通過自注意模塊嵌入特征圖;

BEV Transformer解碼器,通過交叉注意機制處理BEV查詢,輸出最終的BEV語義分割結果。

d944de0c-c5ca-11ec-bce3-dac502259ad0.png

具體來說,BEVSegFormer首先是使用了共享的主干網絡,對來自任意相機的圖像特征進行編碼,然后通過基于可變形Transformer的編碼器對這些特征進行增強。

除此之外,BEVSegFormer還引入了一個BEV Transformer解碼器模塊,對BEV語義分割的結果進行解析,以及一種高效的多相機可變形注意單元,完成BEV到圖像的視圖變換。

最后,根據BEV中的網格布局對查詢進行重塑,并進行上采樣,以有監督的方式生成語義分割結果。

我們分別在nuScenes公開數據集以及Nullmax的自采數據集上,檢驗了BEVSegFormer的算法效果。實驗結果表明,BEVSegFormer在nuScenes驗證集上創造了新的BEV分割SOTA。通過消融實驗,當中每個組件的效果也得到了驗證。

d97c3780-c5ca-11ec-bce3-dac502259ad0.png

02

加入我們

在這項研究中,我們為了應對自動駕駛車輛上任意相機配置的BEV語義分割挑戰,提出了BEVSegFormer。

接下來,我們還計劃在自動駕駛當中,基于Transformer探索內存效率更高、解釋性更強的BEV語義分割方法。

歡迎對BEV、Transformer在自動駕駛中的感知任務感興趣,以及希望從事于計算機視覺和自動駕駛感知研發的同學,加入Nullmax感知團隊。

在這里,你可以直接參與到大量自動駕駛量產項目的落地,以及最前沿技術的預研當中,為你的idea和技術找到一個充分施展的舞臺!

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自動駕駛
    +關注

    關注

    793

    文章

    14883

    瀏覽量

    179888
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124398

原文標題:當BEV語義分割遇上了Transformer,故事的結局是新的SOTA

文章出處:【微信號:Nullmax,微信公眾號:Nullmax紐勱】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SAM(通用圖像分割基礎模型)丨基于BM1684X模型部署指南

    前言SAM是Meta提出的一個分割一切的提示型模型,其在1100萬張圖像上訓練了超過10億個掩碼,實現強大的零樣本泛化,突破了分割界限。本例程對SAM官方開源倉庫的模型和算法進行移植,使之能
    的頭像 發表于 01-12 16:17 ?306次閱讀
    SAM(通用圖像<b class='flag-5'>分割</b>基礎模型)丨基于BM1684X模型部署指南

    自動駕駛BEV Camera數據采集系統:高精度時間同步解決方案

    波動。BEV(Bird's-Eye-View)感知技術以其尺度變化小、視角遮擋少的顯著優勢,正成為自動駕駛領域的關鍵技術,而高精度時間同步是確保BEV感知算法準確性的基礎保障。 2 時間同步精度要求分析 2.1 不同應用場景的精度需求 自動駕駛數據采
    的頭像 發表于 12-11 17:11 ?1317次閱讀
    自動駕駛<b class='flag-5'>BEV</b> Camera數據采集系統:高精度時間同步解決方案

    自動駕駛BEV Camera數據采集:時間同步技術解析與康謀解決方案

    整合多相機圖像等多源數據,完成分類、檢測、分割、跟蹤等關鍵任務,而傳感器融合的準確性直接依賴于時間同步——若不同相機數據存在時間偏差,會導致多視角圖像信息錯位,使BEV算法無法精準構建環境俯視圖,出現目標定位錯誤、軌跡跟蹤失效等問題,嚴重
    的頭像 發表于 12-11 16:36 ?1033次閱讀
    自動駕駛<b class='flag-5'>BEV</b> Camera數據采集:時間同步技術解析與康謀解決方案

    賦能 BEV 感知課題!高校科研多傳感器時間同步方案

    在高校自動駕駛實驗室里,團隊可能常以BEV(Bird’s-EyeView)感知架構為研究主線。旨在通過相機陣列和激光雷達的數據,在空間上重建統一的車周環境,為下游檢測、分割提供高精度“語義地圖”。然而,一旦相機間的時間同步存在幾十毫秒及以上的
    的頭像 發表于 11-14 17:32 ?2941次閱讀
    賦能 <b class='flag-5'>BEV</b> 感知課題!高校科研多傳感器時間同步方案

    傳音TEX AI團隊斬獲ICCV 2025大型視頻目標分割挑戰賽雙料亞軍

    目標分割兩個賽道中均榮獲全球第二名,擊敗眾多國內外強隊,充分展示團隊在復雜視頻理解與多模態視頻目標分割領域的深厚積累與世界級競爭力。
    的頭像 發表于 10-31 09:42 ?558次閱讀
    傳音TEX AI團隊斬獲ICCV 2025大型視頻目標<b class='flag-5'>分割</b>挑戰賽雙料亞軍

    手機板 layout 走線跨分割問題

    初學習layout時,都在說信號線不可跨分割,但是在工作中為了成本不能跨分割似乎也非絕對。 在后續工作中,跨分割的基礎都是相鄰層有一面完整的GND參考,跨分割發生在相鄰的另外一層。 但
    發表于 09-16 14:56

    AURIX tc367通過 MCU SOTA 更新邏輯 IC 閃存是否可行?

    你好專家:我的用例是 MCU 通過 SPI 連接到邏輯 IC,邏輯 IC 連接到 8MB 閃存,但 MCU PFLASH 大小為 2MB,通過 MCU SOTA 更新邏輯 IC 閃存是否可行?
    發表于 08-11 06:36

    求助,關于TC387使能以及配置SOTA 中一些問題求解

    你好, 之前我拿到貴司給一個demo,里面有一些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代碼如下
    發表于 08-08 07:31

    基于黃金分割搜索法的IPMSM最大轉矩電流比控制

    摘 要:在矢量控制理論的基礎上,研究內嵌式永磁同步電機(IPMSM)基于黃金分割搜索法實現最大轉矩電流比控制(MTPA)的方法。該方法利用對理論最優電流矢量角表達式進行多項式擬合所得值作為搜索
    發表于 07-29 16:11

    禁用直接LPB訪問,如何與TC3x 上的 SWAPEN 協同工作?

    禁用直接 LPB 訪問 (xDDIS) 位可通過 TC37x 的 FLASHCON4 和 PROCONTP 進行配置。在 SOTA 場景中,我們應該如何配置上述兩個寄存器? 如果我啟用 SWAPEN,我是否應該禁用 UCB_OTP PROCONTP 中的 DDIS?
    發表于 07-29 10:26

    如何將32個步進伺服驅動器塞進小型板材分割機中?

    板材分割機是工業制造中常見的裝備。機器的內部空間狹小,如何將多達32個步進伺服驅動器安裝在其中顯得非常困難。本文將通過基于EtherCAT總線的插板式步進伺服驅動器剖析其破解之法!傳統銑刀式板材分割
    的頭像 發表于 07-08 11:37 ?541次閱讀
    如何將32個步進伺服驅動器塞進小型板材<b class='flag-5'>分割</b>機中?

    【正點原子STM32MP257開發板試用】基于 DeepLab 模型的圖像分割

    【正點原子STM32MP257開發板試用】圖像分割 本文介紹正點原子 STM32MP257 開發板基于 DeepLab 模型實現圖像分割的項目設計。 DeepLab 模型 DeepLab-v3
    發表于 06-21 21:11

    凡億Allegro Skill布線功能-檢查跨分割

    能會導致設計中的缺陷和問題。為了克服這一挑戰,可以利用凡億skill中的“檢查跨分割”命令。這個工具能夠幫助設計者快速而準確地識別出高速信號參考平面的跨分割問題,從而避免了人工檢查時可能出現的疏漏。通過使用這種自動化
    的頭像 發表于 06-19 11:50 ?2262次閱讀
    凡億Allegro Skill布線功能-檢查跨<b class='flag-5'>分割</b>

    淺析4D-bev標注技術在自動駕駛領域的重要性

    感知領域的一項突破性創新,通過引入時間維度與全局視角,為自動駕駛系統提供高精度、多模態的時空真值數據,重塑自動駕駛系統的開發范式。 4D-BEV標注是什么? 4D-BEV 標注技術
    的頭像 發表于 06-12 16:10 ?2357次閱讀

    labview調用yolo目標檢測、分割、分類、obb

    labview調用yolo目標檢測、分割、分類、obb、pose深度學習,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發表于 03-31 16:28