国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CUDA-NDT的定義與使用實例

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-07-08 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著自主機器的發展,我們可以在生活中經常看到自主機器的應用。有傳統應用的倉庫工廠 AMR、機械臂、銀行酒店里面的服務機器人、家庭機器人、無人物流車、自主礦卡等等。不同的自主機器,軟件架構的方案也不一樣,但核心的模塊定位、導航、感知、控制等都是相通的。

定位模塊是自主機器最核心的模塊之一,定位又包括全局定位和局部定位,對于自主機器,其精度需要達到厘米級別。

本文我們將討論全局定位,即確定自主機器在全局下的位置。傳統的低速自主機器,類似于 AMR 等,其采用的定位方式通常以 SLAM(Simultaneous Localization and Mapping)的方法進行同時建圖和定位,但是該方法實現代價高、難度大,并不適用于室外自主機器——類似于無人物流車、園區接駁車等的實時高精度定位需求。這些室外自主機器行駛速度快、距離遠、環境復雜,使得 SLAM 的精度下降,同時遠距離的行駛將導致實時構建的地圖偏移過大。因此,如果在已有高精度的全局地圖的情況下進行自主機器的定位,將極大的簡化該問題。

因此,將問題分為獨立的兩部分:建圖 Mapping 和定位 Matching。NDT 是一種點云配準算法,可同時用于點云的建圖和定位。

CUDA-NDT

正態分布變換算法(NormalDistributions Transform, NDT)同 ICP 算法的功能一致,即,用于計算兩幀點云數據之間的坐標變換矩陣,從而能夠使不同的坐標下的點云數據合并到同一個坐標系統中。不同的是 NDT 算法對初值不敏感,且不需要進行對應點的特征計算,所以速度較快。NDT 算法使用應用于 3D 點統計模型的標準優化技術來確定兩個點云之間最可能的配準。

NDT 算法和 ICP 算法可以結合使用,以提高配準精度和速度。首先,NDT 算法可用于粗配準,得到轉換參數;然后使用 ICP 算法結合參數進行精細配準。為了改進 NDT 算法在 NVIDIA Jetson 上的性能,我們推薦使用基于 CUDA 加速的 CUDA-NDT。

使用CUDA-NDT

以下是 CUDA-NDT 的使用實例。我們需要初始化相關的類對象,設置相關的參數,并調用接口函數。

cudaNDT ndtTest(nPCountM, nQCountM, stream);ndtTest.setInputSource(source);ndtTest.setInputTarget(target);ndtTest.setResolution(resolution);ndtTest.setMaximumIterations(nr_iterations);ndtTest.setTransformationEpsilon(epsilon);ndtTest.setStepSize(step_size);    ndtTest.ndt(cloud_source, nPCount,               cloud_target, nQCount, guess,transformation_matrix,stream);

CUDA-NDT 計算的輸出是 transformation_matrix,代表的含義如下:

  • 源點云 (P)* transformation_matrix = 目標坐標系的點云 (Q)


因為激光類型的輸出點云的數量為固定值,所以 CUDA-NDT 在輸出化的時候,要求輸入兩幀點云的最大數量,從而分配計算資源。

class cudaNDT{public:    /*       nPCountM and nQCountM are the maximum of count for input clouds       They are used to pre-allocate memory.    */    cudaNDT(int nPCountM, int nQCountM, cudaStream_t stream = 0);    ~cudaNDT(void);void setInputSource (void *source);void setInpuTarget (void *target);void setResolution (float resolution);void setMaximumIterations (int nr_iterations);void setTransformationEpsilon (double epsilon);void setStepSize (double step_size);    /*    cloud_target = transformation_matrix * cloud_source    When the Epsilon of transformation_matrix is less than threshold,    the function will return transformation_matrix.    Input:        cloud_source, cloud_target: data pointer for points cloud        nPCount: the points number of cloud_source        nQCount: the points number of cloud_target        guess: initial guess of transformation_matrix        stream: CUDA stream    Output:        transformation_matrix: rigid transformation matrix    */
    void ndt(float *cloud_source, int nPCount,            float *cloud_target, int nQCount,            float *guess, void *transformation_matrix,            cudaStream_t stream = 0);    void *m_handle = NULL;};

經過 CUDA 加速的 NDT 速度對比微加速版本提升了 4 倍左右,請參考下表的性能對比,經過 NDT 匹配的點云效果對比請參考圖 1 和圖 2。

CUDA-NDT

PCL-NDT

count of

pointscloud

7000

7000

cost time(ms)

34.7789

136.858

fitness_score

0.538

0.540

CUDA-NDT 與 PCL-NDT 的性能對比

開始使用CUDA-NDT

我們希望通過本文介紹使用 CUDA-NDT 從而獲得更好的點云注冊性能。

因為 NDT 在 NVIDIA Jetson 上無法使用 CUDA 進行點云的加速處理,所以我們開發了基于 CUDA 的 CUDA-NDT。

復制鏈接,獲得相關庫和實例代碼。

https://github.com/NVIDIA-AI-IOT/cuda-pcl/tree/main/cuda-ndt

審核編輯:湯梓紅


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109778
  • NDT
    NDT
    +關注

    關注

    0

    文章

    27

    瀏覽量

    15252
  • CUDA
    +關注

    關注

    0

    文章

    127

    瀏覽量

    14476

原文標題:基于CUDA加速的自主機器SLAM技術——CUDA-NDT

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RV生態又一里程碑:英偉達官宣CUDA將兼容RISC-V架構!

    電子發燒友網報道(文/梁浩斌)英偉達生態護城河CUDA,從最初支持x86、Power?CPU架構,到2019年宣布支持Arm?CPU,不斷拓展在數據中心的應用生態。 在2019年至今的六年
    的頭像 發表于 07-19 00:04 ?6601次閱讀
    RV生態又一里程碑:英偉達官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構!

    借助NVIDIA CUDA Tile IR后端推進OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設計目標是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優勢是允許開發者基于其構建自定義的 DS
    的頭像 發表于 02-10 10:31 ?252次閱讀

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發者學習 NVIDIA CUDA Tile 編程,掌握構建高性能 GPU 內核的方法,并以矩陣乘法作為核心示例。
    的頭像 發表于 01-22 16:43 ?4850次閱讀
    如何在NVIDIA <b class='flag-5'>CUDA</b> Tile中編寫高性能矩陣乘法

    加濕器維修實例

    *附件:加濕器維修實例.doc
    發表于 01-06 15:03

    NVIDIA CUDA Tile的創新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA CUDA 平臺發明以來,最大的一次技術進步。這一令人振奮的創新引入了一套面向
    的頭像 發表于 12-24 10:17 ?478次閱讀
    NVIDIA <b class='flag-5'>CUDA</b> Tile的創新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發明以來 GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發表于 12-13 10:12 ?1204次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發明以來,規模最大、內容最全面的一次更新。
    的頭像 發表于 12-13 10:08 ?2216次閱讀

    如何在e203 SOC中添加自定義外設

    外設的基地址和連接e203_soc_top信號使用,并將自定義的外設正確實例化在此對外接口口模塊中。 3、在e203_soc_top中正確實例化第2步中的對外接口模塊 4、在system頂層模塊中正確
    發表于 10-20 10:38

    低漂移霍爾元件的應用實例

    此章節中將介紹低漂移霍爾元件(砷化鎵 (GaAs))的應用實例
    的頭像 發表于 07-10 14:27 ?861次閱讀
    低漂移霍爾元件的應用<b class='flag-5'>實例</b>

    KiCad 中的自定義規則(KiCon 演講)

    “ ?Seth Hillbrand 在 KiCon US 2025 上為大家介紹了 KiCad 的規則系統,并詳細講解了自定義規則的設計與實例。? ” ? 演講主要圍繞 加強 KiCad 中的自定義
    的頭像 發表于 06-16 11:17 ?2158次閱讀
    KiCad 中的自<b class='flag-5'>定義</b>規則(KiCon 演講)

    單片機實例項目:485與CAN總線運用實例

    單片機實例項目:485與CAN總線運用實例,推薦下載!
    發表于 06-03 20:48

    Nordic測距介紹

    的多天線設計,系統資源要求非常高 兩者共同的缺點是: 不是標準的功能,沒有定義和使用藍牙標準 基于此,SIG在2022年11月就公開草案Channel Sounding(簡稱CS),并計劃在2024
    發表于 05-28 16:49

    UIAbility組件啟動模式:實例在啟動時的不同呈現狀態

    請求的UIAbility實例。在EntryAbility中,調用startAbility()方法時,可以在want參數中增加一個自定義參數,例如instanceKey,以此來區分
    發表于 05-16 06:10

    使用NVIDIA CUDA-X庫加速科學和工程發展

    NVIDIA GTC 全球 AI 大會上宣布,開發者現在可以通過 CUDA-X 與新一代超級芯片架構的協同,實現 CPU 和 GPU 資源間深度自動化整合與調度,相較于傳統加速計算架構,該技術可使計算工程工具運行速度提升至原來的 11 倍,計算規模增加至 5 倍。
    的頭像 發表于 03-25 15:11 ?1542次閱讀

    如何添加自定義單板

    在開發過程中,用戶有時需要創建自定義板配置。本節將通過一個實例講解用戶如何創建屬于自己的machine,下面以g2l-test.conf為例進行說明。
    的頭像 發表于 03-12 14:43 ?1362次閱讀