国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用自監督學習重建動態駕駛場景

NVIDIA英偉達企業解決方案 ? 來源:未知 ? 2023-12-16 16:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgaomV9W2eACTqvAI2RUKtEaQ8569.gif

無論是單調的高速行車,還是平日的短途出行,駕駛過程往往平淡無奇。因此,在現實世界中采集的用于開發自動駕駛汽車(AV)的大部分訓練數據都明顯偏向于簡單場景。

這給部署魯棒的感知模型帶來了挑戰。自動駕駛汽車必須接受全面的訓練、測試和驗證,以便能夠應對復雜的場景,而這需要大量涵蓋此類場景的數據。

在現實世界中,收集此類場景數據要耗費大量時間和成本。而現在,仿真提供了另一個可選方案。但要大規模生成復雜動態場景仍然困難重重。

在近期發布的一篇論文中,NVIDIA Research 展示了一種基于神經輻射場(NeRF)的新方法——EmerNeRF 及其如何使用自監督學習準確生成動態場景。通過自監督方法訓練,EmerNeRF 在動靜態場景重建上的表現超越了之前其他 NeRF 方法。詳細情況請參見 EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision

wKgaomV9W2iAWIQRAIG3gjsjUmk047.gif

wKgaomV9W2qAEBhsAHW-H-Nc2wI223.gif

wKgaomV9W2uADx4ZAGFS9lTdEQ0746.gif

圖 1. EmerNeRF 重建動態駕駛場景的示例

相比其他 NeRF 重建方法,EmerNeRF 的動態場景重建準確率高出 15%,靜態場景高出 11%。新視角合成的準確率也高出 12%。

打破 NeRF 方法的局限性

NeRF 將一組靜態圖像重建成逼真的 3D 場景。這使得依據駕駛日志重建用于 DNN 訓練、測試驗證的高保真仿真環境成為可能。

然而,目前基于 NeRF 的重建方法在處理動態物體時十分困難,而且實踐證明難以擴展。例如有些方法可以生成靜態和動態場景,但它們依賴真值(GT)標簽。這就意味著必須使用自動標注或人工標注員先來準確標注出駕駛日志中的每個物體。

其他 NeRF 方法則依賴于額外的模型來獲得完整的場景信息,例如光流。

為了打破這些局限性,EmerNeRF 使用自監督學習將場景分解為靜態、動態和流場(flow fields)。該模型從原始數據中學習前景、背景之間的關聯和結構,而不依賴人工標注的 GT 標簽。然后,對場景做時空渲染,并不依賴外部模型來彌補時空中的不完整區域,而且準確性更高。

wKgaomV9W22ANZJBAIreJrPM29Q814.gif

圖 2. EmerNeRF 將圖 1 第一段視頻中的場景分解為動態場、靜態場和流場

因此,其他模型往往會產生過于平滑的背景和精度較低的動態物體(前景),而 EmerNeRF 則能重建高保真的背景及動態物體(前景),同時保留場景的細節。

wKgaomV9W22AEIs2AAHQ9VA5HZs560.png

表 1. 將 EmerNeRF 與其他基于 NeRF 的動態場景重建方法進行比較后的評估結果,分為場景重建性能和新視角合成性能兩個類別

wKgaomV9W22AfcY9AAA2G6E-KP4237.png

表 2. 將 EmerNeRF 與其他基于 NeRF 的靜態場景重建方法進行比較后的評估結果

EmerNeRF 方法

EmerNeRF 使用的是自監督學習,而非人工注釋或外部模型,這使得它能夠避開之前方法所遇到的難題。

wKgaomV9W26AEUZHAAIDIitNPLA183.png

圖 3.EmerNeRF 分解和重建管線

EmerNeRF 將場景分解成動態和靜態元素。在場景分解的同時,EmerNeRF 還能估算出動態物體(如汽車和行人)的流場,并通過聚合流場在不同時間的特征以進一步提高重建質量。其他方法會使用外部模型提供此類光流數據,但通常會引入偏差。

通過將靜態場、動態場和流場結合在一起,EmerNeRF 能夠充分表達高密度動態場景,這不僅提高了重建精度,也方便擴展到其他數據源。

使用基礎模型加強語義理解

EmerNeRF 對場景的語義理解,可通過(視覺)基礎大模型監督進一步增強。基礎大模型具有更通用的知識(例如特定類型的車輛或動物)。EmerNeRF 使用視覺 Transformer(ViT)模型,例如 DINO, DINOv2,將語義特征整合到場景重建中。

這使 EmerNeRF 能夠更好地預測場景中的物體,并執行自動標注等下游任務。

wKgaomV9W2-AXLGcAEMAJKXvMk4609.gif

圖 4. EmerNeRF 使用 DINO 和 DINOv2 等基礎模型加強對場景的語義理解

不過,基于 Transformer 的基礎模型也帶來了新的挑戰:語義特征可能會表現出與位置相關的噪聲,從而大大限制下游任務的性能。

wKgaomV9W3CAHehyAD0gOpmySM4007.gif

圖 5. EmerNeRF 使用位置嵌入消除基于 Transformer 的基礎模型所產生的噪聲

為了解決噪聲問題,EmerNeRF 通過位置編碼分解來恢復無噪聲的特征圖。如圖 5 所示,這樣就解鎖了基礎大模型在語義特征上全面、準確的表征能力。

評估 EmerNeRF

正如 EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision 中所述,研究人員整理出了一個包含 120 個獨特場景的數據集來評估 EmerNeRF 的性能,這些場景分為 32 個靜態場景、32 個動態場景和 56 個多樣化場景,覆蓋了高速、低光照等具有挑戰性的場景。

然后根據數據集的不同子集,評估每個 NeRF 模型重建場景和合成新視角的能力。

如表 1 所示,據此,EmerNeRF 在場景重建和新視角合成方面的表現始終明顯優于其他方法。

EmerNeRF 的表現還優于專門用于靜態場景的方法,這表明將場景分解為靜態和動態元素的自監督分解既能夠改善靜態重建,還能夠改善動態重建。

總結

自動駕駛仿真只有在能夠準確重建現實世界的情況下才會有效。隨著場景的日益動態化和復雜化,對保真度的要求也越來越高,而且更難實現。

與以前的方法相比,EmerNeRF 能夠更準確地表現和重建動態場景,而且無需人工監督或外部模型。這樣就能大規模地重建和編輯復雜的駕駛數據,解決目前自動駕駛汽車訓練數據集的不平衡問題。

NVIDIA 正迫切希望研究 EmerNeRF 帶來的新功能,如端到端駕駛、自動標注和仿真等。

如要了解更多信息,請訪問 EmerNeRF 項目頁面并閱讀 EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision

了解更多

  • 適用于自動駕駛汽車的解決方案

    https://www.nvidia.cn/self-driving-cars/

  • EmerNeRF 項目頁面

    https://emernerf.github.io/

  • 閱讀 EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision.

    https://arxiv.org/abs/2311.02077

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。點擊“閱讀原文”掃描下方海報二維碼,立即注冊 GTC 大會


原文標題:使用自監督學習重建動態駕駛場景

文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    23

    文章

    4087

    瀏覽量

    99198

原文標題:使用自監督學習重建動態駕駛場景

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    算法工程師需要具備哪些技能?

    :自動化任務(如數據預處理、模型訓練調度)。Git版本控制:團隊協作開發(如分支管理、代碼合并)。 機器學習監督學習:線性回歸、邏輯回歸、決策樹、SVM等。無監督學習:聚類(K-Means)、降維
    發表于 02-27 10:53

    強化學習會讓自動駕駛模型學習更快嗎?

    是一種讓機器通過“試錯”學會決策的辦法。與監督學習不同,監督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每一步的“正確答案”都告訴你,而是把環境、動作和結果連起來,讓機器自己探索哪個行為長期看起來更有利
    的頭像 發表于 01-31 09:34 ?646次閱讀
    強化<b class='flag-5'>學習</b>會讓自動<b class='flag-5'>駕駛</b>模型<b class='flag-5'>學習</b>更快嗎?

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課(11大系列課程,共5000+分鐘)

    趨勢: 無監督學習普及 當前工業場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統監督學習方案難以落地。課程第11系列(無監督缺陷檢測篇)提供無需標注即可
    發表于 12-04 09:28

    自動駕駛數據標注是所有信息都要標注嗎?

    本身只是像素和點云。標注的工作就是人為地給這些信號貼上語義標簽,告訴模型這是一輛車、這是行人、這是車道線、這個區域不能通行之類的明確信息。沒有這些標簽,監督學習、驗證和評估都無法進行,模型不知道哪些輸入與哪些輸出應該
    的頭像 發表于 12-04 09:05 ?874次閱讀
    自動<b class='flag-5'>駕駛</b>數據標注是所有信息都要標注嗎?

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課程(11大系列課程,共5000+分鐘)

    趨勢: 無監督學習普及 當前工業場景中80%的缺陷檢測項目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統監督學習方案難以落地。課程第11系列(無監督缺陷檢測篇)提供無需標注即可
    發表于 12-03 13:50

    如何深度學習機器視覺的應用場景

    深度學習視覺應用場景大全 工業制造領域 復雜缺陷檢測:處理傳統算法難以描述的非標準化缺陷模式 非標產品分類:對形狀、顏色、紋理多變的產品進行智能分類 外觀質量評估:基于學習的外觀質量標準判定 精密
    的頭像 發表于 11-27 10:19 ?223次閱讀

    如何選擇適合的智駕仿真工具進行場景生成和測試?

    在自動駕駛技術日益發展的背景下,選擇合適的智駕仿真工具進行場景生成和測試顯得尤為重要。該工具不僅需要支持高精度的場景重建,還需滿足多種環境條件和傳感器模型的兼容性。本文將深入探討如何評
    的頭像 發表于 11-25 10:32 ?380次閱讀
    如何選擇適合的智駕仿真工具進行<b class='flag-5'>場景</b>生成和測試?

    僅使用智能手機在NVIDIA Isaac Sim中重建場景

    使用 iPhone 拍攝照片,到利用 3DGUT 進行 3D 場景重建,再到將重建場景導入 NVIDIA Isaac Sim 并添加機器人。若要跳過
    的頭像 發表于 11-10 14:03 ?852次閱讀

    講講如何閉環自動駕駛仿真場景,從重建到可用?

    靜態3D場景無法滿足仿真測試?缺乏動態交通流、難以模擬極端天氣、傳感器模型不逼真!本文帶您看aiSim場景編輯與GGSR渲染器如何破局!自由配置暴雨黑夜與虛擬車流,使用通用高斯潑濺實現廣角無畸變的高保真渲染,為自動
    的頭像 發表于 10-27 11:10 ?7279次閱讀
    講講如何閉環自動<b class='flag-5'>駕駛</b>仿真<b class='flag-5'>場景</b>,從<b class='flag-5'>重建</b>到可用?

    從“重建”到“可用”:aiSim3DGS方案如何閉環自動駕駛仿真場景

    3DGaussianSplatting(3DGS)憑借高效渲染與逼真場景還原能力,逐漸成為三維重建與仿真領域的焦點。然而,實際應用中,如何將多源異構數據高效轉化為可用的3DGS場景,如
    的頭像 發表于 10-24 17:33 ?28次閱讀
    從“<b class='flag-5'>重建</b>”到“可用”:aiSim3DGS方案如何閉環自動<b class='flag-5'>駕駛</b>仿真<b class='flag-5'>場景</b>?

    自動駕駛中常提的“強化學習”是個啥?

    下,就是一個智能體在環境里行動,它能觀察到環境的一些信息,并做出一個動作,然后環境會給出一個反饋(獎勵或懲罰),智能體的目標是把長期得到的獎勵累積到最大。和監督學習不同,強化學習沒有一一對應的“正確答案”給它看,而是靠與環境交互、自我探索來發現
    的頭像 發表于 10-23 09:00 ?677次閱讀
    自動<b class='flag-5'>駕駛</b>中常提的“強化<b class='flag-5'>學習</b>”是個啥?

    生成式 AI 重塑自動駕駛仿真:4D 場景生成技術的突破與實踐

    生成式AI驅動的4D場景技術正解決傳統方法效率低、覆蓋不足等痛點,如何通過NeRF、3D高斯潑濺等技術實現高保真動態建模?高效生成極端天氣等長尾場景?本文為您系統梳理AI驅動的4D場景
    的頭像 發表于 08-06 11:20 ?5162次閱讀
    生成式 AI 重塑自動<b class='flag-5'>駕駛</b>仿真:4D <b class='flag-5'>場景</b>生成技術的突破與實踐

    一種適用于動態環境的3DGS-SLAM系統

    當前基于神經輻射場(NeRF)或3D高斯潑濺(3DGS)的SLAM方法在重建靜態3D場景方面表現出色,但在動態環境中的跟蹤和重建方面卻面臨著挑戰。
    的頭像 發表于 06-13 10:10 ?1404次閱讀
    一種適用于<b class='flag-5'>動態</b>環境的3DGS-SLAM系統

    使用MATLAB進行無監督學習

    監督學習是一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?1450次閱讀
    使用MATLAB進行無<b class='flag-5'>監督學習</b>