国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自動駕駛公開數據集的現狀與挑戰

智能汽車電子與軟件 ? 來源:集微網 ? 2023-11-09 16:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著數據采集設備的優化升級,自動駕駛數據集也在不斷升級迭代。國內外各大自動駕駛公司、研究所都先后推出自動駕駛數據集,為未來自動駕駛領域的技術發展提供重要研究材料。 《自動駕駛開源數據體系:現狀與未來》一文系統性地梳理自動駕駛開源數據集,對于助推產業生態良性循環有著重要意義。該文章是由上海人工智能實驗室聯合上海交大、復旦大學、百度、比亞迪、蔚來等多個單位,發布的自動駕駛開源數據集綜述。該綜述首次系統性梳理了國內外七十余種開源自動駕駛數據集,對如何構建高質量數據集、數據在算法閉環體系中發揮的核心作用、如何利用生成式大模型規模化生產數據等進行了總結。在此基礎上,對未來第三代自動駕駛數據集所應具有的特征、數據規模、需要解決的關鍵科學和技術問題展開深入分析與討論。

概述

自動駕駛作為人工智能重要應用領域之一,有望重塑現有的交通和運輸模式,極大提升交通效率和安全性,對未來城市和社會發展產生深遠影響。目前,國內的智能網聯汽車產業已經邁入商業化的試水和起步階段。道路測試和示范應用場景趨于成熟,自動駕駛功能技術加速迭代,車聯網應用場景日益豐富,各層面相關法規政策加速出臺,共同推動市場進入高速發展期。 一方面,自動駕駛技術需要大量數據來訓練算法模型,以識別和理解道路環境,從而做出正確的決策和行動,實現準確、穩定和安全的駕駛體驗,數據的建設對于自動駕駛技術的發展至關重要。另一方面,自然語言處理和通用視覺領域大模型的出現,更加印證了海量高質量數據的重要性,給予自動駕駛的數據集建設以啟發!

2d619398-7edb-11ee-939d-92fbcf53809c.png

綜述文章架構

自動駕駛數據集

該綜述把目前開源的近百種數據集分為兩代:第一代數據集以 KITTI為標志,該數據集于2012年提出,輸入傳感模態由單目攝像頭與激光雷達構成,并提出了一系列綜合感知任務。第二代數據集以 nuScenes 及 Waymo 數據集為代表,傳感模態復雜度變高,環視相機、激光雷達、定位信息以及高精地圖成為常見組成部分,下游任務面向感知、建圖、預測與路徑規劃綜合任務。

傳感器模態復雜度逐漸提高:環視相機,激光雷達,高精地圖,超聲波雷達傳感器,GPS、IMU、HD Map等。

數據集規模與多樣性日益增長:在數據豐富度方面,主流自動駕駛數據集的采集時長由最初的10小時左右逐漸提升至100小時,隨著自動標注技術及標注工具的演進,近些年也出現了超過 1000 小時的數據集。駕駛場景的多樣性也是自動駕駛系統表現的另一關鍵因素。為了提高算法在特定場景下的表現能力,部分數據集分別在多個大洲多個城市進行采集。

數據集任務從感知延伸至預測與規劃:2016 年推出的 Cityscapes 與 Mapillary 等數據集下游任務聚焦于動態物體檢測。2019 年推出的 SemanticKITTI 、DrivingStereo等數據集引入語義分割、深度估計、光流估計等任務。在傳統預測與規劃模塊一般應用數值計算、優化、搜索等方法求解。2019 年前后提出的 nuScenes、Waymo 、Argoverse V2 等數據集,不僅包括感知任務還涵蓋預測與規劃任務,實現了在同一數據集上進行多種任務研究,同時引領社區在傳統多個模塊范式下端到端自動駕駛研究的潮流。

2d7eb220-7edb-11ee-939d-92fbcf53809c.png

自動駕駛開源數據集影響力估計

數據算法閉環體系

模塊化自動駕駛系統包括感知、決策、規劃、控制等組件,其中大部分功能是通過數據驅動的神經網絡模型實現的。對于這些模塊來說,海量和高質量的數據是確保模塊性能的必要條件。 首先,海量數據的引入對于解決現存自動駕駛系統中的各種問題都很有必要。自動駕駛工程中一直存在的問題是長尾問題。其產生原因在于訓練模型的數據量不足而導致存在少量情況未被模型學習,而在模型推理階段,模型并不能對這些邊緣場景給出正確的結果。另外,對于基于規則的模塊,現有的方式是通過人工設計各種規則來使模塊輸出符合人為設計邏輯的結果。這個方法耗時耗力,并且難以覆蓋所有情況,有可能導致自動駕駛系統在某些未見場景下失效。而使用數據驅動的神經網絡代替這些模塊是一個可能的解決方案。 同時,在神經網絡學習過程中,數據噪聲的引入會不可避免地對優化過程產生負面影響,并降低模型性能。數據質量不僅包括傳感器數據的分辨率和同步性等,還包括標簽的準確性。在這兩個方面中,任意一個方面存在質量問題都直接影響著自動駕駛系統的性能和安全性。 綜上,海量和高質量的數據成為構建自動駕駛系統必不可少的一個環節。

大模型時代下的新一代自動駕駛數據集

當前基礎大模型在自然語言處理、計算機視覺等領域取得了舉世矚目的成果,但目前市面上還沒有面向自動駕駛垂直領域的大模型。以其他領域的大模型作為參照,新一代數據集至少應將數據量提升至與其他領域相近才能夠賦能自動駕駛大模型。 在保證數據數量的前提下,場景豐富度對算法性能更為重要。自動駕駛車輛在真實世界中會不可避免地遇到訓練數據之外的場景大規模地應用自動駕駛技術必然要求模型能夠在罕見場景中做出正確行為,避免發生危險或功能失效的情況。對于絕大多數交通場景來說,并不需要十分大量的數據就能夠覆蓋,而更需要關注的是長尾場景,由于某些交通場景十分罕見,如撞車等,數據的缺失會對自動駕駛系統的性能影響巨大。

第一、二代自動駕駛數據集已經不能夠繼續滿足自動駕駛系統的發展需求,新一代數據集的建設亟待提上日程。在大模型時代,大數據成為新一代數據集不可缺少的一個特點。同時,模塊化設計的自動駕駛系統在落地過程遇到迭代成本高、性能上界受限等問題,端到端自動駕駛架構逐步受到業界的青睞。除此之外,多模態傳感器、高質量標注、模型邏輯推理能力等方面也需要得到重視。基于此,該綜述總結歸納了新一代數據集的發展目標:面向多模態、保質保量;面向端到端、決策導向;面向智能化、邏輯推理。

2da7249e-7edb-11ee-939d-92fbcf53809c.png

大模型時代下的自動駕駛數據集展望

結論

該綜述全面回顧了自動駕駛公開數據集的現狀與挑戰。針對數據算法閉環體系,結合當前大模型發展趨勢,提出了下一代自動駕駛數據集的愿景與規劃。該綜述系統性地總結了自動駕駛發展歷程中所使用的數據集,并展示了通過挑戰賽與榜單促進社區發展的重要性;概括性地分析了自動駕駛數據算法閉環體系,并總結其中各個重要環節的作用,最后通過應用案例展現對數據算法閉環體系的使用方法。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98060
  • 數據集
    +關注

    關注

    4

    文章

    1236

    瀏覽量

    26196
  • 自動駕駛
    +關注

    關注

    793

    文章

    14883

    瀏覽量

    179892

原文標題:自動駕駛公開數據集的現狀與挑戰

文章出處:【微信號:智能汽車電子與軟件,微信公眾號:智能汽車電子與軟件】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何構建適合自動駕駛的世界模型?

    提出的。那世界模型是自動駕駛落地的正解嗎? 什么是世界模型? 世界模型對于自動駕駛汽車來說,更像是給汽車大腦里繪制一張地圖,可以將環境的現狀和未來可能的演變都表示出來,讓自動駕駛系統不
    的頭像 發表于 02-18 08:14 ?1w次閱讀
    如何構建適合<b class='flag-5'>自動駕駛</b>的世界模型?

    如何設計好自動駕駛ODD?

    為確定自動駕駛的可使用范圍,會給自動駕駛設置一個運行設計域(Operational Design Domain,ODD)。ODD的作用就是用來明確自動駕駛在什么情況下能工作,在什么情況下不能工作,給車設定“工作范圍”。
    的頭像 發表于 01-24 09:27 ?1513次閱讀

    自動駕駛BEV Camera數據采集系統:高精度時間同步解決方案

    1 自動駕駛數據采集的時間同步挑戰與重要性 隨著自動駕駛技術的快速發展,車輛準確感知周圍環境的能力變得至關重要。在分布式多傳感器系統中,信號從創建到存儲會歷經多個軟件模塊和系統,產生傳
    的頭像 發表于 12-11 17:11 ?1317次閱讀
    <b class='flag-5'>自動駕駛</b>BEV Camera<b class='flag-5'>數據</b>采集系統:高精度時間同步解決方案

    汽車自動駕駛的太陽光模擬應用研究

    自動駕駛系統的安全性與可靠性,高度依賴于其在復雜多變光照環境中的穩定表現。其中,高動態范圍的自然光照是挑戰車載感知系統的關鍵因素。紫創測控luminbox太陽光模擬器作為能夠精確復現光照輻射的室內
    的頭像 發表于 12-10 18:04 ?377次閱讀
    汽車<b class='flag-5'>自動駕駛</b>的太陽光模擬應用研究

    自動駕駛數據采集時間同步指南:方法、挑戰、場景與康謀解決方案

    自動駕駛數據采集面臨多傳感器協同與多總線協議割裂的挑戰,時間同步精度直接影響系統安全與研發效率。康謀科技推出"全以太網+gPTP"方案,通過硬件級時間戳、多協議轉以太網聚合等技術
    的頭像 發表于 11-21 16:48 ?2097次閱讀

    高程數據自動駕駛中有什么作用?

    最近有小伙伴讓智駕最前沿聊聊自動駕駛高精度地圖對高程數據的使用依賴,其實在聊這個話題之前,還是需要先知道高程數據是什么,在自動駕駛中到底有什么作用。
    的頭像 發表于 11-02 13:44 ?1786次閱讀

    塑造自動駕駛汽車格局的核心技術

    自動駕駛汽車長期以來一直是科幻小說中的情節,但在如今的2025年,它似乎已經離我們越來越近,智能輔助駕駛已經出現在越來越多的新能源汽車中。但距離完全的自動駕駛仍有需要克服的工程挑戰
    的頭像 發表于 08-21 16:03 ?950次閱讀

    什么是自動駕駛數據標注?如何好做數據標注?

    [首發于智駕最前沿微信公眾號]在自動駕駛系統的開發過程中,數據標注是一項至關重要的工作。它不僅決定了模型訓練的質量,也直接影響了車輛感知、決策與控制的性能表現。隨著傳感器種類和數據量的劇增,有效
    的頭像 發表于 07-09 09:19 ?1376次閱讀
    什么是<b class='flag-5'>自動駕駛</b><b class='flag-5'>數據</b>標注?如何好做<b class='flag-5'>數據</b>標注?

    卡車、礦車的自動駕駛和乘用車的自動駕駛在技術要求上有何不同?

    [首發于智駕最前沿微信公眾號]自動駕駛技術的發展,讓組合輔助駕駛得到大量應用,但現在對于自動駕駛技術的宣傳,普遍是在乘用車領域,而對于卡車、礦車的自動駕駛發展,卻鮮有提及。其實在卡車、
    的頭像 發表于 06-28 11:38 ?1391次閱讀
    卡車、礦車的<b class='flag-5'>自動駕駛</b>和乘用車的<b class='flag-5'>自動駕駛</b>在技術要求上有何不同?

    小馬智行助力公路干線物流自動駕駛發展

    近日,世界交通運輸大會-大通道貨車自動駕駛創新探索論壇于蘇州舉行。在論壇上,由中交投資發起,小馬智行和青騅物流參編的《公路干線物流自動駕駛發展報告》正式發布,報告展示了當前干線物流自動駕駛發展
    的頭像 發表于 06-19 13:59 ?1123次閱讀

    自動駕駛安全基石:ODD

    電子發燒友網綜合報道 自動駕駛ODD(Operational Design Domain)即設計運行域,是指自動駕駛系統被設計為安全、有效運行的具體條件范圍。它定義了自動駕駛汽車在哪些環境、場景
    的頭像 發表于 05-19 03:52 ?6429次閱讀

    新能源車軟件單元測試深度解析:自動駕駛系統視角

    。 ?自動駕駛軟件的特殊性? ? 感知層: ?激光雷達、攝像頭等傳感器數據處理算法的單元測試需覆蓋極端場景。例如,激光雷達點云濾波算法在雨雪天氣下的噪聲抑制能力需通過邊界測試驗證。某廠商曾在測試中遺漏
    發表于 05-12 15:59

    東風汽車推出端到端自動駕駛開源數據

    近日,智能網聯汽車智駕數據空間構建研討會暨中汽協會智能網聯汽車分會、數據分會2024年度會議在上海舉辦。會上,東風汽車發布行業規模最大、涵蓋125萬組高質量數據的端到端自動駕駛開源
    的頭像 發表于 04-01 14:54 ?1232次閱讀