国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于感知引導的多步驟精細操作任務與運動規劃

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2025-11-14 10:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統的任務與運動規劃(TAMP)系統在機器人操作應用中通常依賴靜態模型運行,因此在面對新環境時往往表現不佳。將感知與操作相融合,是應對這一挑戰的有效途徑,使機器人能夠在執行過程中實時更新規劃,從而適應動態變化的場景。

在本期NVIDIA 機器人研發摘要 (R2D2)中,我們探討了如何利用基于感知的 TAMP 以及 GPU 加速的 TAMP 實現遠程操作。同時,我們將介紹用于提升機器人操作能力的框架,并展示如何結合視覺與語言信息,將像素轉化為子目標、任務負載以及可微分的約束條件。

子目標是較小的階段性目標,能夠引導機器人逐步達成最終目標。

Affordance 根據物體或環境的屬性及其所處的上下文,描述機器人可在其上執行的動作。例如,手柄可被“抓取”,按鈕可被“按壓”,杯子可被“傾倒”。

在機器人運動規劃中,可微分約束用于確保機器人的運動滿足物理限制,如關節角度范圍、避障要求或末端執行器的位置精度,同時仍支持通過學習進行調整。由于這些約束具備可微性,GPU 能夠在訓練或實時規劃過程中高效地計算并優化它們。

任務與運動規劃如何將視覺與語言信息轉化為機器人的具體動作

TAMP 涉及確定機器人應執行的任務以及實現這些任務所需的移動方式,需要將高層任務規劃(即執行什么任務)與底層運動規劃(即如何移動以完成任務)相結合。

現代機器人能夠結合視覺與語言信息(如圖像和指令),將復雜任務分解為若干較小的步驟,即子目標。這些子目標有助于機器人明確下一步應執行的動作、需要交互的對象以及如何實現安全移動。

該過程利用高級模型將圖像和書面指令轉化為機器人可在現實世界中執行的清晰計劃。遠程操作需要具備結構化意圖,且依賴規劃人員的有效參與。接下來,我們將探討 OWL-TAMP、VLM-TAMP 和 NOD-TAMP 如何助力解決這一問題:

OWL-TAMP:該工作流使機器人能夠執行以自然語言描述的復雜、長視距操作任務,例如“將橙色物體放到桌子上”。OWL-TAMP 是一種混合式工作流,將視覺語言模型(VLM)與任務與運動規劃(TAMP)相結合。其中,VLM 根據開放世界語言(OWL)指令生成約束條件,描述機器人動作空間中的操作要求。這些約束被整合進 TAMP 系統,并通過仿真反饋機制驗證其物理可行性和執行正確性。

VLM-TAMP:這是一種面向視覺信息豐富環境的機器人多步驟任務規劃工作流。VLM-TAMP 將視覺語言模型與傳統 TAMP 框架融合,能夠在現實場景中生成并優化高層行動計劃。該方法利用 VLM 解析圖像內容,并結合任務指令(如“做一鍋雞湯”)生成初步的高級任務規劃。隨后,通過仿真驗證和運動規劃進行迭代優化,以確保每一步操作的可行性。在涉及 30 至 50 個連續動作、并操作多達 21 個不同物體的長視距廚房任務中,該混合方法的表現優于純 VLM 或純 TAMP 的基準方案。該工作流使機器人能夠綜合利用視覺與語言上下文信息,有效應對任務描述中的模糊性,從而提升在復雜操作任務中的整體性能。

wKgZO2kWkZiADtASAAQ2Yv4Ml1c035.png

圖1展示了VLM-TAMP如何克服單獨使用TAMP或僅依賴VLM進行任務與運動規劃在解決長視距機器人操作問題時所面臨的局限性。

NOD-TAMP: 傳統的TAMP框架在處理長視距操作任務時通常難以實現泛化,因其依賴于顯式的幾何模型和對象表示。NOD-TAMP通過引入神經對象描述符(NOD)來提升對不同對象類型的泛化能力。NOD是一種基于3D激光點云學習得到的表示形式,能夠編碼物體的空間特征與關系屬性。該方法使機器人能夠與新對象有效交互,并支持規劃器進行動態的操作調整。

cuTAMP 如何利用 GPU 并行化加速機器人規劃

經典 TAMP 首先分析任務的動作結構(稱為計劃骨架),再求解相應的連續變量。第二步通常是系統的計算瓶頸,而cuTAMP顯著加速了這一過程。對于cuTAMP中給定的計劃骨架,系統會采樣數千個初始解(粒子),隨后在 GPU 上執行可微分的批量優化,以滿足多種約束條件,例如逆運動學、避障、穩定性以及目標函數成本。

如果框架不可行,算法會進行回溯;如果可行,則會生成一個計劃。對于受限的打包或堆疊任務,該過程通常在幾秒鐘內完成,使機器人能夠在幾秒內找到包裝、堆疊或操作多個物體的解決方案,而無需花費幾分鐘甚至幾小時。

“矢量化滿意度”是實現在現實應用場景中長期解決問題的關鍵。

wKgZO2kWkamAMiGUAAG2JdpaDF8651.png

圖2展示了cuTAMP如何將TAMP幀化為一種回溯式的雙層搜索,以優化計劃骨架。

機器人如何利用Stein變分推斷從故障中學習

長距操作模型在面對訓練過程中未曾遇到的新條件時,可能會出現失效。Fail2Progress是一種使機器人能夠從自身失敗中學習并持續改進操作能力的框架。該框架通過數據驅動的校正與基于仿真的優化,將實際發生的故障整合進技能模型中。為了增強模型的魯棒性,Fail2Progress 利用 Stein 變分推斷生成與觀測到的故障相似的定向合成數據集,從而有效提升模型對異常情況的適應能力。

然后,這些生成的數據集可用于微調并重新調整技能效果模型,從而降低長視野任務中相同故障重復發生的次數。

入門指南

在這篇博客中,我們探討了基于感知的TAMP、GPU加速的TAMP,以及用于機器人操作的基于仿真的優化框架。我們分析了傳統TAMP中常見的挑戰,并介紹了這些研究工作為應對這些挑戰所提出的方法與思路。

本文是NVIDIA 機器人研發摘要(R2D2)系列的一部分,旨在幫助開發者深入了解NVIDIA Research在物理 AI 與機器人應用領域的最新突破。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    30491

    瀏覽量

    219113
  • NVIDIA
    +關注

    關注

    14

    文章

    5480

    瀏覽量

    108958
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5076

    瀏覽量

    134285
  • 仿真
    +關注

    關注

    52

    文章

    4393

    瀏覽量

    137597

原文標題:R2D2:基于感知引導的多步驟精細操作任務與運動規劃

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    運動控制速度規劃

    電機控制速度規劃運動控制的一大關鍵點。這里提供一個討論話題的平臺,大家可以在這里分享自己的心得!有啥關于速度好的想法,或者覺得有意思的資料可以發到這里,大家分享!
    發表于 09-04 11:38

    做個任務規劃大師來幫你!

    `這是我在Instructable上的第一個創客項目,名字叫做任務規劃大師。我相信許多人對智能手機是又愛又恨,它們每天都能給我們帶來新鮮,但其過量的信息又會讓我們感覺喘不過氣來。再加上許多人
    發表于 12-17 15:50

    什么是運動控制系統?運動控制系統的任務是什么?

    什么是運動控制系統?運動控制系統的任務是什么?
    發表于 10-29 07:40

    近距輕掃和運動感知視頻展示雷達IC應用

    運動感知和人體存在感知等功能。我們收集到方案商應用場景視頻,分享給大家,給予設計靈感啟發。 還有應用案例: 運動感知:浴室鏡子,接近就可亮燈,0.8—1.2m的距離可調,人體一直存在輕微的動作,鏡子
    發表于 11-16 14:31

    分布式多步驟入侵場景建模及其抽象描述

    本文從入侵檢測的角度提出了一種完全非集中方式,將分布式多步驟入侵場景建模為分布于被保護網絡系統中多個節點上的檢測子任務序列。本文基于巴科斯范式對分布式多步驟
    發表于 09-03 08:57 ?8次下載

    如何使用壓縮感知進行移動群智感知任務分發機制的資料說明

    針對移動群智 感知任務中區域全覆蓋感知成本過高問題,提出基于壓縮感知的移動群智感知任務分發(CS
    發表于 03-28 11:29 ?5次下載
    如何使用壓縮<b class='flag-5'>感知</b>進行移動群智<b class='flag-5'>感知</b><b class='flag-5'>任務</b>分發機制的資料說明

    如何使用壓縮感知實現移動群智感知任務分發機制的資料說明

    針對移動群智感知任務中區域全覆蓋感知成本過高問題,提出基于壓縮感知的移動群智感知任務分發(CS-
    發表于 10-24 11:25 ?3次下載
    如何使用壓縮<b class='flag-5'>感知</b>實現移動群智<b class='flag-5'>感知</b><b class='flag-5'>任務</b>分發機制的資料說明

    如何使用壓縮感知實現移動群智感知任務分發機制

    針對移動群智感知任務中區域全覆蓋感知成本過高問題,提出基于壓縮感知的移動群智感知任務分發(CS-
    發表于 01-26 11:53 ?17次下載
    如何使用壓縮<b class='flag-5'>感知</b>實現移動群智<b class='flag-5'>感知</b><b class='flag-5'>任務</b>分發機制

    鋅合金壓鑄機主機操作方法和步驟

    鋅合金壓鑄機的操作方式分為兩種,手動和自動,今天我們來說一下壓鑄機手動操作的方法和步驟:開機,起壓,調模運動,鎖模運動,開模
    的頭像 發表于 03-17 17:16 ?6485次閱讀

    STM32實現多步進電機的加減速運動控制

    目標: 1、指定簡單的電機控制協議,支持通過串口通訊對多步進電機進行運動控制 2、支持詳細參數輸入的運動控制模式:控制方向、轉速、加減速率、細分等 3、支持位置控制模式,按照協議格式,輸入電機編號和位置,對多電機進行控制
    發表于 03-23 10:23 ?11次下載
    STM32實現<b class='flag-5'>多步</b>進電機的加減速<b class='flag-5'>運動</b>控制

    自動駕駛綜述之定位、感知規劃常見算法匯總

    自駕車自動駕駛系統的體系結構一般分為感知系統和決策系統。感知系統一般分為許多子系統,負責自動駕駛汽車定位、靜態 障礙物測繪、移動障礙物檢測與跟蹤、道路測繪、交通信號檢測與識別等任務。決策系統通常被劃分為許多子系統,負責諸如
    發表于 06-02 16:11 ?0次下載
    自動駕駛綜述之定位、<b class='flag-5'>感知</b>、<b class='flag-5'>規劃</b>常見算法匯總

    基于邊界點優化和多步路徑規劃的機器人自主探索策略

    機器人對未知環境的自主探索是機器人智能化的關鍵技術。為了提高搜索效率,作者提出了一種基于邊界點優化和多步路徑規劃的搜索策略。他們主要對邊界點優化、邊界點選擇、路徑規劃三個方面對路徑規劃
    的頭像 發表于 06-19 10:19 ?2296次閱讀
    基于邊界點優化和<b class='flag-5'>多步</b>路徑<b class='flag-5'>規劃</b>的機器人自主探索策略

    基于感知質量的無人機ActiveSLAM解決方案

    在對于基于視覺的狀態估計中,攝像機的運動對估計精度有重要影響。因此,在規劃無人機的運動時,既要考慮以上的任務,又要考慮感知質量。
    發表于 07-01 09:56 ?1364次閱讀
    基于<b class='flag-5'>感知</b>質量的無人機ActiveSLAM解決方案

    倒閘操作的基本步驟

    一、正常情況倒閘操作的基本步驟 1、接受任務 當系統調度員下達操作任務時,操作前,預先用電話或傳
    的頭像 發表于 09-22 11:35 ?1.1w次閱讀

    引導線的左轉場景下,自動駕駛如何規劃軌跡?

    對于很多新手司機來說,在無引導線左轉的場景中,開車會非常謹慎,但依舊會很好地處理好這一操作。但對于自動駕駛汽車來說,其行駛需要有較為明顯的參考線,在沒有白色虛線、沒有箭頭感知“我的車道在哪兒”的交通
    的頭像 發表于 09-18 09:12 ?384次閱讀
    無<b class='flag-5'>引導</b>線的左轉場景下,自動駕駛如何<b class='flag-5'>規劃</b>軌跡?