国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DIPO框架實現應用于具身智能仿真的3D鉸鏈物體生成新范式

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 2025-12-03 09:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DIPO

雙狀態約束×復雜數據驅動應用于具身智能仿真的3D鉸鏈物體生成新范式

在具身智能從理解環境向與環境交互進化的當下,構建真實且可交互的仿真環境是重要路徑。單一剛體生成已難滿足需求,機器人需要面對的是柜門、抽屜、微波爐等大量具有物理約束的鉸鏈物體。受限于復雜的運動學結構,高質量3D鉸鏈物體資產極為稀缺。

地平線與合作者們提出DIPO,創新性地利用“靜止+活動”雙狀態圖像作為條件,結合思維鏈(Chainof Thought)圖推理,僅需兩張圖片實現結構合理、運動一致、可供機器人交互操作的鉸鏈3D資產生成。此外,還打造了自動化鉸鏈資產構建鏈路,開源了大規模復雜鉸鏈物體數據集PM-X。為機器人操作和通用場景仿真下的鉸鏈物體生成開啟了新的范式。該成果已被學術頂會NeurIPS2025錄用。

?技術報告:

https://arxiv.org/abs/2505.20460

?Huggingface Demo:

https://huggingface.co/spaces/HorizonRobotics/DIPO

?PM-X數據集:

https://huggingface.co/datasets/HorizonRobotics/DIPO-Dataset

? 項目主頁:

https://rq-wu.github.io/projects/DIPO

行業痛點:3D鉸鏈物體的資產荒

邁向通用具身智能,需要機器人需要在仿真環境中與冰箱、烤箱等復雜鉸鏈(可活動關節)物體進行深度交互訓練。然而此類資產的構建面臨“采集難、建模慢、數據簡”的挑戰:真實物體的關節參數與運動范圍測量成本極高;人工逐件裝配與URDF標注耗時費力;主流數據集(如 PartNet-Mobility)平均部件數不足5個,其低復雜度結構滯后于真實世界的物理多樣性,嚴重制約了智能體的場景泛化能力。

模型方案:雙狀態輸入+思維鏈推理

DIPO摒棄了“單圖猜結構”的傳統路徑,開辟了一條新的技術路線:通過輸入物體“靜止狀態圖”與“關節活動狀態圖”這一對雙狀態圖像,顯式編碼關鍵的運動信息。

8b5e4286-cad1-11f0-8c8f-92fbcf53809c.png

提出了一個雙狀態注入模塊,通過注意力機制讓模型學習“靜止”與“活動”兩張圖像之間的差異,捕捉圖像對間的關聯特征,從而生成可靠的部件布局與關節參數。為了解決復雜物體部件連接關系(如多層抽屜、雙開門)的識別難題,DIPO引入了基于思維鏈的圖推理器。 這個推理器模擬了人類的認知過程,分步驟進行邏輯推斷,大幅提升了模型對復雜拓撲結構的理解的準確性。

數據引擎:自動化構建復雜資產

為了增強模型對復雜物體的泛化能力,靠現有的簡單數據集(如 PartNet-Mobility)是遠遠不夠的。為此,DIPO提出了一套全自動的數據集構建流程。

8c1f1254-cad1-11f0-8c8f-92fbcf53809c.png

基于此流程,發布了大規模數據集PM-X。該數據集單個鉸鏈物體平均部件數達到19.4個,現有數據集僅為5-8個,極大地豐富了訓練數據的結構多樣性與生成模型的泛化性。

8c7dae36-cad1-11f0-8c8f-92fbcf53809c.png

實驗結果:SOTA 性能表現

實驗表明,DIPO在多項指標上均超越了現有最先進方法,在PartNet-Mobility測試集與分布外的ACD測試集上,重建指標與圖預測準確率均顯著高于基線方法。

8cd9a5f6-cad1-11f0-8c8f-92fbcf53809c.png

8d37462a-cad1-11f0-8c8f-92fbcf53809c.png

DIPO與基線模型的可視化對比。 涵蓋PM、ACD數據集及真實場景樣本,展示了基于雙狀態圖像輸入的連接圖預測與鉸鏈生成結果,紅框標記了基線方法的連接錯誤。

8d920e98-cad1-11f0-8c8f-92fbcf53809c.png

總結與展望

DIPO通過引入雙狀態圖像這一低成本、高信息的輸入模態,結合思維鏈推理與自動化數據工廠,解決復雜鉸鏈物體生成的難題。這項工作不僅大幅提升了生成資產的結構合理性與運動一致性,更為具身智能仿真環境的快速構建提供了一種高效、可擴展的新范式。DIPO的代碼與PM-X數據集已向社區開源,持續推動3D生成與具身智能仿真領域的技術發展。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31069

    瀏覽量

    222162
  • 仿真
    +關注

    關注

    54

    文章

    4482

    瀏覽量

    138232
  • 具身智能
    +關注

    關注

    0

    文章

    388

    瀏覽量

    857

原文標題:開發者說|DIPO:應用于具身智能仿真的3D鉸鏈物體生成新范式

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于3D數據卷積神經網絡的物體識別

    FusionNet的核心是全新的、應用于3D物體的三維卷積神經網絡(Convolutional Neural Networks, CNN)。我們必須在多個方面調整傳統的CNN以使其有效。
    發表于 01-16 16:36 ?4237次閱讀
    基于<b class='flag-5'>3D</b>數據卷積神經網絡的<b class='flag-5'>物體</b>識別

    英特爾? 智能大小腦融合方案發布:構建智能落地新范式

    套件和AI加速框架打造。憑借創新性地模塊化設計,其不僅能夠兼顧操作精度和智能泛化能力,而且以卓越的性價比滿足不同領域需求,為智能的規模化
    發表于 04-18 17:26 ?992次閱讀
    英特爾? <b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>大小腦融合方案發布:構建<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>落地新<b class='flag-5'>范式</b>

    智能機器人系統》第1-6章閱讀心得之智能機器人系統背景知識與基礎模塊

    意味著在“智能”領域,還沒有哪一個玩家能像O社那樣能站在AGI的制高點。 智能從字面上拆
    發表于 12-19 22:26

    【「智能機器人系統」閱讀體驗】+初品的體驗

    ,逐漸學習并優化自己的行為,以更好地服務家庭成員。 目前,智能機器人在解決實際問題中已展現出巨大的潛力,例如它已應用于養老、醫療、災害救援等領域。 盡管
    發表于 12-20 19:17

    【「智能機器人系統」閱讀體驗】1.初步理解智能

    的各個方面。 第5部分(第14章)通過一個實際案例的應用研究對本書提到的概念進行總結,作者實際構建了一個智能機器人計算系統,用于室內倉儲環境下的
    發表于 12-28 21:12

    【「智能機器人系統」閱讀體驗】2.智能機器人的基礎模塊

    目前高速發展的大模型能給智能帶來一些突破性的進展。 對于感知系統,要做的主要任務是物體檢測,語義分割,立體視覺,鳥瞰視角感知。 有很多算法都可以
    發表于 01-04 19:22

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+智能芯片

    的好處: ①使處理速度變得非常快 ②更加安全 3、觸覺 智能的關鍵之一:了解周圍的外部刺激。 面向觸覺感知的神經形態模型主要用于模擬手部
    發表于 09-18 11:45

    全場應變測量與仿真優化分析系統MatchID-2D/3D

    Hopkinson Bar 試驗-混凝土動態性能研究,采用超高速相機采集照片MatchID-2D/3D全場應變測量與仿真優化分析系統廣泛的應用于汽車機械、航空航天、橋梁地質、生物力學等
    發表于 07-23 12:44

    PYNQ框架下如何快速完成3D數據重建

    實現基于這些約束的三維重建的完整管道。  在這個項目中,作者的目標是朝著實時生成3D視覺數據邁進一步。首先,在CPU上生成3D點云,然后使
    發表于 01-07 17:25

    人工智能系統VON,生成最逼真3D圖像

    研究團隊寫道:“我們的關鍵思想是將圖像生成過程分解為三個要素:形狀、視角和紋理,這種分離的3D表示方式使我們能夠在對抗學習框架下從3D和2D
    的頭像 發表于 12-07 09:28 ?8538次閱讀

    華為基于AI技術實現3D圖像數字服務

    華為3D建模服務(3D Modeling Kit)是華為在圖形圖像領域又一技術開放,面向有3D模型、動畫制作等能力訴求的應用開發者,基于AI技術,提供3D
    的頭像 發表于 08-12 14:50 ?6306次閱讀

    手套3d資料分享

    手套3d資料分享
    發表于 07-05 15:19 ?1次下載

    PLC如何應用于建筑的3D打印?

    3D打印技術應用于制造樣機或在醫藥、汽車或食品等一系列行業中雕琢小細節。可以減少復雜的幾何形狀生產過程中耗時且成本昂貴的生產步驟。 那么,如果我們將這種解決方案應用于大型3D打印機的使
    的頭像 發表于 08-01 14:19 ?1361次閱讀
    PLC如何<b class='flag-5'>應用于</b>建筑的<b class='flag-5'>3D</b>打印?

    3D人體生成模型HumanGaussian實現原理

    3D 生成領域,根據文本提示創建高質量的 3D 人體外觀和幾何形狀對虛擬試穿、沉浸式遠程呈現等應用有深遠的意義。傳統方法需要經歷一系列人工制作的過程,如 3D 人體模型回歸、綁定、
    的頭像 發表于 12-20 16:37 ?3170次閱讀
    <b class='flag-5'>3D</b>人體<b class='flag-5'>生成</b>模型HumanGaussian<b class='flag-5'>實現</b>原理

    NVIDIA助力影眸科技3D生成工具Rodin升級

    。在 NVIDIA Omniverse 平臺、OpenUSD 以及 Isaac Lab 解決方案的助力下,影眸科技實現了 Rodin 平臺的升級,顯著提升了 3D 資產生成的速度、質量與用戶體驗,推動
    的頭像 發表于 04-27 15:09 ?1291次閱讀