国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于大模型的仿真系統研究一——三維重建大模型

賽目科技 ? 來源: 賽目科技 ? 2024-07-30 14:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于大模型的仿真系統框架

傳統的仿真測試驗證普遍基于場景,而場景的構建主要由道路和場景編輯器來人工搭建靜態場景和動態場景,這種方式費時費力,而且也大大限制了場景要素組合的豐富化。針對此痛點問題,賽目推出了基于大模型的仿真系統,利用機器學習深度學習人工智能技術,不僅推出自動標注大模型、多模態檢測大模型和場景生成大模型等模塊,并且引入三維重建大模型加強渲染畫面真實性。

通過上述模塊,賽目的路采場景轉換系統實現了以傳感器原始數據或者目標集數據為輸入,通過感知融合、場景提取和生成等功能,輸出仿真測試所需的靜態路網和動態場景進行仿真,大大提高了仿真測試的效率。

圖:基于大模型的仿真系統框架

三維重建大模型

本文首先介紹三維重建大模型。

三維重建是指根據單視圖或者多視圖重建三維信息、構建三維模型的過程。傳統的計算機圖形學的核心通過復雜的物理模型求解渲染方程。需要的不僅僅是場景中物體的幾何和材質信息、相機的內外參信息,更需要復雜的光照模型來模擬自然光照的影響。

上述工作的重大突破來自Ben Mildenhall等人于2020發表的神經輻射場(NeRF),根據對同一物體不同觀察視角的多張圖像,通過隱式的編碼表示場景實現三維重建的過程,利用體渲染生成新視角圖像。

NeRF訓練渲染流程可以總結如下:

1. 對于給定的相機光線,在光線上進行采樣,對采樣點的空間坐標及觀察方向進行編碼,用深度復雜網絡存獲得輻射場信息;

2. 輻射場輸出空間點的顏色和密度;

3. 根據2的輸出用體素渲染方程獲得生成視角圖片;

4. 在訓練階段與原視角圖片計算損失更新網絡。

圖:NeRF訓練管線[1]

下圖表示了輻射場的網絡結構,其中PE表示位置編碼,x為三維坐標點,d為觀察方向,MLP為多層感知機,ReLU和Sigmoid分別為不同激活函數。輻射場網絡的輸入是空間坐標及方差方向,輸出為對應的顏色和密度值傳遞至體渲染模塊。

圖:NeRF網絡結構

體渲染主要為解決云、煙、果凍等非剛性物體進行渲染建模,將其抽象成一團粒子群,表現了光線穿過時光子和粒子交互的過程,產生的輻亮度的變化。其物理過程包括吸收、外散射、內散射、放射。忽略背景光的影響,體渲染方程為:

上述方法主要針對室內小型場景進行三維重建,對于戶外場景、特別是自駕場景還有許多優化的空間,相關內容將在下節討論。

三維重建大模型-挑戰和對應

對于自駕場景,上述Baseline方法面臨的挑戰包括:

1. 訓練和渲染速度:Baseline方法需要花費數小時、甚至數天進行訓練和生成,這對于仿真來說是難以接受的,同樣不利于算法的迭代優化;

2. 生成畫質清晰度:自駕場景包括了靜態路網、動態環境參與者、背景建筑物、天空等等,需要同時將遠景與近景清晰地渲染生成是一個極大的挑戰;

3. 算法訓練的過擬合現象:與Baseline對同一物體360°環視圖像獲取不同,路采車輛一般沿著固定采集路線前進,對于同一物體的信息收集不夠充沛,影響最終的渲染質量。

4. 動態物體的添加和刪除:利用三維重建大模型能夠獲得不同主車視角的成像結果,但是對于測試場景生成需要靈活地控制環境參與者,因此需要模型能夠自由地對物體進行添加和刪除。

基于上述問題,我們提出了下述的研究路線。

圖:三維重建技術路線

對于無邊界場景,由于可視范圍變大的原因通過NDC坐標變化后的采樣過程會將近景采樣稀疏化,影響最終成像質量導致物體模糊,保持近距離坐標不變,遠距離坐標作非線性轉換是一種解決思路。坐標轉換形式包括了[2-3]:

1.半徑為r的球面內保持坐標不變,球面外坐標以單位向量以及逆半徑重新定義,具體如下





然后利用線性插值法獲得相應分辨率下的特征,輸入至多層感知機中進行訓練。特征柵格主要流程如下。

通過上述三維重建大模型方法,可以在自動駕駛仿真領域提升模型的訓練和渲染速度、重建畫質的清晰度、輻射場中物體深度與表面的準確度等等,同時能夠動態添加環境車、行人等交通參與者進行場景泛化,實現更靈活的場景生成需求。

參考文獻

[1]Mildenhall, Ben, et al. "Nerf: Representing scenes as neural radiance fields for view synthesis." Communications of the ACM 65.1 (2021): 99-106.

[2]Zhang, Kai, et al. "Nerf++: Analyzing and improving neural radiance fields." arXiv preprint arXiv:2010.07492 (2020).

[3]Barron, Jonathan T., et al. "Mip-nerf 360: Unbounded anti-aliased neural radiance fields." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.

[4]Müller, Thomas, et al. "Instant neural graphics primitives with a multiresolution hash encoding." ACM Transactions on Graphics (ToG) 41.4 (2022): 1-15.

賽目科技

專注智能網聯汽車測試

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 仿真系統
    +關注

    關注

    1

    文章

    105

    瀏覽量

    21689
  • 大模型
    +關注

    關注

    2

    文章

    3650

    瀏覽量

    5183

原文標題:基于大模型的仿真系統研究一——三維重建大模型

文章出處:【微信號:gh_c85a8e3c0f2a,微信公眾號:賽目科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    OFDR技術與三維重構的協同價值

    模型上,讓結構缺陷位置、應變分布等信息目了然,為實時監測和精準決策提供了可視化支撐。三維重構軟件核心功能解析數據交互與模型導入軟件支持兩種數據處理模式:通過
    的頭像 發表于 11-14 17:36 ?1318次閱讀
    OFDR技術與<b class='flag-5'>三維</b>重構的協同價值

    從“重建”到“可用”:aiSim3DGS方案如何閉環自動駕駛仿真場景?

    3DGaussianSplatting(3DGS)憑借高效渲染與逼真場景還原能力,逐漸成為三維重建仿真領域的焦點。然而,實際應用中,如何將多源異構數據高效轉化為可用的3DGS場景,如
    的頭像 發表于 10-24 17:33 ?28次閱讀
    從“<b class='flag-5'>重建</b>”到“可用”:aiSim3DGS方案如何閉環自動駕駛<b class='flag-5'>仿真</b>場景?

    如何在vivadoHLS中使用.TLite模型

    MNIST數據集的輸入形狀(28,28,1),可以使用ap_uint<8>作為輸入數據類型,使用三維數組作為輸入緩沖區: void hls_function
    發表于 10-22 06:29

    拆解3D Gaussian Splatting:原理框架、實戰 demo 與自駕仿真落地探索!

    ▍文章來源于康謀自動駕駛01引言當前,三維重建技術正處于從"實驗室演示"邁向"工業級應用"的關鍵時期。每次對場景細節的精準還原,每幀實時流暢的渲染效果
    的頭像 發表于 10-17 17:33 ?3287次閱讀
    拆解3D Gaussian Splatting:原理框架、實戰 demo 與自駕<b class='flag-5'>仿真</b>落地探索!

    種基于多次觀測融合的可交互三維高斯場景重建框架

    在計算機視覺和機器人領域,如何完整、真實地重建個可交互的三維場景,直是個難題。傳統方法往往依賴復雜的多階段流程,比如先做分割,再進行背
    的頭像 發表于 09-29 11:12 ?659次閱讀
    <b class='flag-5'>一</b>種基于多次觀測融合的可交互<b class='flag-5'>三維</b>高斯場景<b class='flag-5'>重建</b>框架

    NVIDIA助力湯元科技突破智能駕駛數據獲取與生成瓶頸

    蘇州湯元科技有限公司(以下簡稱“湯元科技”)是家專注于三維重建與世界模型的科技公司,為自動駕駛與具身智能提供高質量、多樣化的訓練數據。通過將自研的世界模型技術與 NVIDIA Cos
    的頭像 發表于 09-06 15:16 ?1480次閱讀

    構建適用于三維集成系統的互連線長分布模型

    三維集成電路設計中,TSV技術通過垂直互連顯著優化了互連線長分布特性。基于倫特定律的經典分析框架,可構建適用于三維集成系統的互連線長分布模型
    的頭像 發表于 08-21 10:41 ?1136次閱讀
    構建適用于<b class='flag-5'>三維</b>集成<b class='flag-5'>系統</b>的互連線長分布<b class='flag-5'>模型</b>

    航天宏圖全棧式3DGS實景三維重建系統解決方案

    表達的核心技術,通過相機、傳感器等設備獲取物理空間數據,并結合計算機視覺與圖形學算法,將二圖像轉換為三維模型。目前,主流的三維重建方法包括傾斜攝影(多視角立體
    的頭像 發表于 06-27 09:28 ?1650次閱讀
    航天宏圖全棧式3DGS實景<b class='flag-5'>三維重建</b><b class='flag-5'>系統</b>解決方案

    無刷直流電機磁場定向控制系統研究

    了控制策略及實現方法,并建立系統仿真模型,仿真表明基于FOC的BLDCM控制系統性能良好,轉矩脈動小。以STM32FI03B為核心設計了基于
    發表于 06-26 13:31

    模型自適應控制在永磁同步電機轉速中的仿真研究

    的可行性和有效性。 純分享帖,點擊下方附件免費獲取完整資料~~~ *附件:無模型自適應控制在永磁同步電機轉速中的仿真研究.pdf 【免責聲明】本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第
    發表于 06-25 13:01

    激光三維掃描技術:無噴粉條件下高反光表面三維重建的光學原理與應用

    高反光表面的三維重建是工業檢測、文化遺產保護等領域的關鍵技術瓶頸。傳統激光掃描依賴噴粉增強漫反射,但會對精密器件或文物造成不可逆損傷。本文通過融合結構光調制、偏振分析及多視角協同技術,構建無噴粉測量
    的頭像 發表于 06-25 10:19 ?895次閱讀

    十二相同步發電機降階等效模型研究

    摘要:十二相同步發電機整流系統能夠提供高品質直流電能,但是發電機模型復雜,解析分析困難。為此,推導了十二相整流發電機的等效相降階模型和狀態空間平均
    發表于 06-17 08:59

    VirtualLab:光學系統三維可視化

    摘要 為了對光學系統的性質有個基本的了解,對其組件的可視化和光傳播的提示是非常有幫助的。為此,VirtualLab Fusion提供了個工具來顯示光學系統
    發表于 05-30 08:45

    數字孿生 × 爆炸動畫 × 三維拆解

    三維場景中實現模型零件爆炸效果是種常見且非常實用的視覺技術,廣泛應用于產品設計演示、機械運動模擬、建筑可視化等多個領域。
    的頭像 發表于 05-19 15:11 ?684次閱讀
    數字孿生 × 爆炸動畫 × <b class='flag-5'>三維</b>拆解

    種基于基礎模型對齊的自監督三維空間理解方法

    三維空間理解是推動自動駕駛、具身智能等領域中智能系統實現環境感知、交互的核心任務,其中3D語義占據預測 (Semantic Occupancy Prediction) 對三維場景進行精準的體素級建模。然而,當前主流方法嚴重依賴大
    的頭像 發表于 03-18 15:01 ?973次閱讀
    <b class='flag-5'>一</b>種基于基礎<b class='flag-5'>模型</b>對齊的自監督<b class='flag-5'>三維</b>空間理解方法