伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

面向視覺語言導航的任務驅動式地圖學習框架MapDream介紹

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 2026-03-02 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MapDream

地圖不再是專家設計的產物

而是在任務目標下學習出的決策參考

在視覺語言導航(VLN)中,地圖長期作為獨立模塊構建,并通過固定接口交由導航策略使用。無論是BEV網格、拓撲圖還是語義記憶模塊,這些表示大多脫離策略學習而設計。結果是,機器人即使掌握場景的信息,也仍可能繞行甚至偏離目標,因為地圖中編碼的,并不一定是決定導航成功的關鍵信息。

我們認為,VLN邁向長期可靠決策的關鍵一步,是讓地圖表示進入訓練閉環,由任務目標在學習階段主導其形成方式,而不再停留在固定規則或外部模塊的層面。

MapDream正是沿著這一方向提出的:我們將地圖構建納入端到端訓練框架,在大規模數據支撐下,通過監督預訓練與強化學習聯合微調,使空間表示在訓練階段始終圍繞導航目標展開,并與策略決策緊密耦合,從而形成真正服務于長程指令執行的核心中間表示。

? 論文題目

MapDream: Task-Driven Map Learning for Vision-Language Navigation

?論文鏈接

https://arxiv.org/abs/2602.00222

? 項目主頁:

https://horizonrobotics.github.io/robot_lab/mapdream

從專家設計到任務主導

傳統VLN系統中的地圖通常依賴專家規則或獨立建圖模塊生成,其語義與幾何結構在訓練過程中保持固定。導航策略只能被動消費這些表示,無法反向影響地圖該強調哪些空間線索。MapDream打破了這一結構:我們在大規模數據支撐下,將地圖構建納入端到端訓練框架,通過監督預訓練與強化學習聯合微調,使空間表示直接圍繞導航目標學習。VLN中真正重要的,并非完整復原環境,而是為當前任務生成最有價值的空間接口

7a1e3ce6-130c-11f1-90a1-92fbcf53809c.png

MapDream將地圖表示納入訓練閉環,由任務直接塑造,而非專家預設。

在MapDream中,地圖被重新定義為一種可學習的中間表示。系統接收多幀單目觀測與自然語言指令,自回歸生成任務相關的BEV表示,僅保留三類與決策高度相關的要素——可通行結構、目標相關距離以及語義錨點。這種緊湊表達被輸入到VLN策略中用于多步動作預測,并在強化學習階段與策略同步優化,使最終得到的地圖分布與成功導航行為保持一致。

兩階段訓練

讓地圖真正進入學習閉環

MapDream采用兩階段訓練流程,使地圖從專家先驗出發,最終由任務目標決定。

7a7b7f5a-130c-11f1-90a1-92fbcf53809c.png

MapDream采用兩階段訓練:先建立建圖—控制接口,再以強化學習聯合優化,使地圖服務于導航決策而非幾何重建。

第一階段是監督預訓練。通過輕量化的任務驅動BEV監督,模型學習基礎空間抽象,同時訓練策略學會使用這些地圖進行決策,從而建立穩定的“建圖—控制”接口。

第二階段是強化學習聯合微調。地圖模塊與VLN策略在統一導航獎勵下同步更新。此時地圖不再僅追求幾何一致性,而是被任務回報直接牽引,系統性地調整為最有利于完成指令的空間表達。

通過這一閉環過程,地圖真正成為由任務目標主導學習的核心表示。

任務決定地圖

改變機器人的導航方式

當地圖表示進入學習閉環后,機器人的行為模式發生了顯著變化。在長程指令執行中,它不再僅依賴局部觀測,而是借助生成的BEV抽象形成更穩定的全局方向感。路徑更加貼近示范軌跡,回溯與繞行明顯減少,整體執行呈現出更強的空間連貫性。

7ad8e2a8-130c-11f1-90a1-92fbcf53809c.png

MapDream僅憑單目生成緊湊BEV地圖,緊貼真實路徑,優于在模糊路口易偏離的無地圖基線。

在標準VLN基準中,MapDream在單目設置下取得領先結果,并在跨數據集泛化與真實機器人實驗中保持穩定表現。這表明,由任務目標塑造的地圖能夠捕捉具有遷移性的空間結構,而不僅僅適配單一環境。

7b3cca2a-130c-11f1-90a1-92fbcf53809c.png

在R2R-CE與RxR-CE Val-Unseen上,MapDream單目性能最佳,路徑效率優于全景方法。

總結與展望

MapDream重新界定了視覺語言導航中“地圖”的角色。它不再是專家規則主導的靜態模塊,而是一種在訓練階段由任務目標塑造、并與決策系統端到端耦合的生成式空間接口。機器人在決定“下一步往哪走”之前,先通過地圖理解當前最關鍵的空間關系,從而形成更高效、更穩定的長程決策能力。

未來,我們希望將這一任務驅動地圖學習范式擴展到更長期的空間記憶、更復雜的交互任務以及真實環境中的自主探索,為具身智能構建真正以任務目標為核心的空間認知系統。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31240

    瀏覽量

    223081
  • 導航
    +關注

    關注

    7

    文章

    578

    瀏覽量

    44004
  • 地圖
    +關注

    關注

    0

    文章

    43

    瀏覽量

    13998

原文標題:開發者說|MapDream:讓導航任務決定地圖如何生成,而不應由專家預設

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Progress-Think框架賦能機器人首次實現語義進展推理

    視覺語言導航(VLN)中,機器人長期缺乏一種關鍵能力:它能持續前進,卻無法判斷自己的任務推進到了哪一步。導航在空間中不斷展開,畫面節節推進
    的頭像 發表于 12-03 09:27 ?394次閱讀
    Progress-Think<b class='flag-5'>框架</b>賦能機器人首次實現語義進展推理

    iMLite AI Map 2.1 正式上線:智能穿戴迎來嵌入離線地圖導航新體驗

    智能穿戴迎來嵌入離線地圖導航新體驗,在極小的資源占用下實現了完整的地圖功能,代碼空間控制在 80KB以內,運行內存僅需幾十KB,讓即使是配置受限的智能設備也能流暢運行離線
    的頭像 發表于 12-01 10:26 ?1522次閱讀
    iMLite AI Map 2.1 正式上線:智能穿戴迎來嵌入<b class='flag-5'>式</b>離線<b class='flag-5'>地圖</b><b class='flag-5'>導航</b>新體驗

    沒有地圖,純視覺自動駕駛就只能摸瞎嗎?

    [首發于智駕最前沿微信公眾號]最近在一篇討論高精度地圖的文章中,有位小伙伴提到一個非常有趣的觀點“如果人在陌生的目的地,只依托純視覺(眼睛)去辨別道路,若沒有導航,就只能摸瞎”。對于純視覺
    的頭像 發表于 11-27 17:22 ?1529次閱讀
    沒有<b class='flag-5'>地圖</b>,純<b class='flag-5'>視覺</b>自動駕駛就只能摸瞎嗎?

    地圖:自動駕駛的“數字直覺“

    ,通過"學習"來"理解"道路環境。特斯拉的World Models、NVIDIA的CosMos、小鵬的WFM等創新方案,正在重新定義自動駕駛系統的認知方式。 隱地圖的"黑箱哲學" 從"地圖
    的頭像 發表于 11-19 09:26 ?508次閱讀
    隱<b class='flag-5'>式</b><b class='flag-5'>地圖</b>:自動駕駛的“數字直覺“

    AGV視覺導航:智能物流的“智慧之眼”

    ? AGV 導航一直是智能小車AGV的核心技術,磁條導航、激光導航、二維碼導航、自然導航等技術之后,最近,
    的頭像 發表于 11-04 15:54 ?662次閱讀
    AGV<b class='flag-5'>視覺</b><b class='flag-5'>導航</b>:智能物流的“智慧之眼”

    Aux-Think打破視覺語言導航任務的常規推理范式

    視覺語言導航(VLN)任務的核心挑戰,是讓機器人在復雜環境中聽懂指令、看懂世界,并果斷行動。我們系統性地引入推理任務,探索其在
    的頭像 發表于 07-08 10:00 ?693次閱讀
    Aux-Think打破<b class='flag-5'>視覺</b><b class='flag-5'>語言</b><b class='flag-5'>導航</b><b class='flag-5'>任務</b>的常規推理范式

    UI開發概述

    使用UI開發框架開發應用時,主要涉及如下開發過程。開發者可以先通過第一個入門實例了解整個應用的UI開發過程。 任務簡介相關指導學習ArkTS介紹了ArkTS的基本語法、狀態管理和渲
    發表于 06-24 06:36

    鴻蒙5開發寶藏案例分享---一多開發實例(地圖導航

    案例!最近在肝鴻蒙項目時意外發現了這個地圖導航的\"一多\"開發實例,簡直像發現新大陸!這就帶大家沉浸體驗這個超實用的開發模板~ ? 先劃重點:這個案例完美演示了如何用一套代碼搞定
    發表于 06-03 16:17

    谷歌地圖GPS定位

    谷歌地圖GPS定位:精準導航背后的技術解析 谷歌地圖作為全球最受歡迎的地圖服務之一,其精準的GPS定位功能為用戶提供了極大便利。本文將深入探討谷歌
    的頭像 發表于 05-29 16:54 ?1579次閱讀

    高德地圖攜手雷鳥創新打造新一代AI+AR智能導航解決方案

    近日,高德地圖與雷鳥創新RayNeo宣布達成戰略合作,雙方將深度融合人工智能體和空間交互等前沿技術框架,共同打造新一代AI+AR智能導航解決方案。此次合作,標志著高德空間計算引擎進一步實現跨模態
    的頭像 發表于 05-26 16:01 ?785次閱讀

    詳細介紹機場智能指路機器人的工作原理

    ,在屏幕上顯示相關的文字信息、地圖導航圖和圖片等,以更直觀的方式向旅客展示指引內容,方便旅客理解和查看。 運動系統 動力驅動與控制 :運動系統負責驅動機器人在機場內移動。通常采用輪式
    發表于 05-10 18:26

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    閱讀心得體會:ROS2機器人視覺地圖構建技術 通過對本書第7章(ROS2視覺應用)和第8章(ROS2地圖構建)的學習,我對機器人
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】+ROS2應用案例

    這一部分內容,我掌握了如何在ROS 2中實現SLAM,這對于提高機器人的自主導航能力具有重要意義。 其他內容概述 除了二維碼識別和SLAM技術,書中還介紹了其他視覺應用和地圖構建的內
    發表于 04-27 11:42

    一種實時多線程VSLAM框架vS-Graphs介紹

    ,vSGraphs優于當前最先進的VSLAM方法,在真實數據上平均降低3.38%的軌跡誤差,最大降幅達9.58%。同時,所提出的框架還具有良好的可擴展性,能夠處理大規模場景。此外,僅通過視覺特征,本框架實現的語義實體檢測精度即可
    的頭像 發表于 04-19 14:07 ?1093次閱讀
    一種實時多線程VSLAM<b class='flag-5'>框架</b>vS-Graphs<b class='flag-5'>介紹</b>

    高德地圖推出全球首個AI導航智能體

    地圖導航與AI深度融合,一場關于出行效率與體驗的革命,正在悄然發生。
    的頭像 發表于 04-15 17:01 ?1359次閱讀