国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MonoDream框架賦能機器人僅憑單目相機重構全景與未來

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 2025-12-03 09:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MonoDream

機器人僅憑一枚普通單目相機也能擁有全局觀、洞察力與前瞻性

視覺語言導航(VLN)的關鍵挑戰,是讓機器人在真實環境中聽懂指令、理解空間、保持方位并連續決策。過去的高性能方案往往依賴全景RGB-D傳感器,以填補視野盲區并提供幾何線索,但帶來高成本、高功耗和復雜集成,使其難以在真實機器人中規模化落地。MonoDream提出另一種路徑:不增加傳感器,而是強化單目模型的想象力。

地平線與合作者們為VLA大模型構建了統一導航表征(UNR),并提出隱式全景想象(LPD),在訓練階段讓模型僅憑單目輸入推測當前與未來的全景RGB-D隱特征,從而學會在有限視野下重建空間、推演動態。在實際部署中,MonoDream只需單目圖像即可導航,無需全景、無需深度、無需重建模塊,實現輕量感知下的全局理解與前瞻決策。它不僅縮小了單目與全景導航的性能差距,也拓展了具身智能在輕傳感器配置下的能力邊界。

? 論文題目:

MonoDream: Monocular Vision-Language Navigation with Panoramic Dreaming

? 論文鏈接:

https://arxiv.org/abs/2508.02549

?項目主頁:

https://horizonrobotics.github.io/robot_lab/monodream/

從依賴傳感器,到發掘想象力

在視覺語言導航 (VLN) 中,高性能系統往往依賴全景RGB-D傳感器,以獲取寬視野與幾何線索,但這種方案成本高、功耗大、集成復雜。相比之下,單目相機雖最普及、最易部署,卻長期被視為能力不足,無法支撐高成功率導航。

MonoDream提出了另一種路徑:不依賴多傳感器堆疊,而是激發VLA大模型的潛在想象力,使單目智能體具備從局部推斷全局的能力。這一設計與認知科學高度契合。預測編碼理論1指出,人類視覺系統會基于局部觀測主動生成全局場景預測;神經影像研究2則表明,大腦能夠從有限視野重建不可見空間并用于行動規劃。MonoDream采用類似機制,從片段觀測中補全潛在全景、推測可行動路徑,實現可靠導航。

9460e71c-cad1-11f0-8c8f-92fbcf53809c.png

MonoDream一邊用單目圖像做導航決策,一邊在訓練隱式全景想象力,讓模型在有限視野下也能推演完整空間與未來。

如何在機器人腦中構建想象力

具體來說,我們不是試圖用有限視野去對抗空間不完整性,而是讓模型在訓練過程中學會用單目畫面推演一個看不見的世界。MonoDream通過統一導航表征 (UNR) 和隱式全景想象機制 (LPD) ,在訓練階段逼迫模型僅憑單目輸入去預測當前與未來的全景RGB-D潛特征。這不僅讓它在空間維度上從缺失視角中重建完整結構,也讓它在時間維度上形成前瞻能力。重要的是,這些想象并不依賴顯式渲染或生成,而是內化為導航決策的一部分,沉淀在模型內部。

進入真實部署時,MonoDream選擇完全回歸現實:不需要全景輸入,不需要深度圖,不需要顯式重建,只憑一枚普通單目相機即可完成導航決策。訓練時擁有“看見更多的自由”,推理時卻保持“設備極簡的克制”。這正是MonoDream設計上的關鍵轉折——讓“想象”成為真正的能力,而不是額外消耗。

94c7cce8-cad1-11f0-8c8f-92fbcf53809c.png

MonoDream能在轉角和盲區中做出正確導航決策,而無想象能力的模型會誤判路徑、走錯房間。

單目潛能遠不止于此

實驗結果顯示,這條路徑不僅可行,而且強大。在R2R-CE和RxR-CE等標準基準上,MonoDream在單目設定下取得了領先表現,甚至在訓練數據有限的情況下依然保持穩定泛化,并顯著縮小了與全景方案之間的性能差距。事實證明,過去單目表現不佳的根源,并非傳感器本身,而是模型缺乏補全視野與空間認知的能力。

952cc1c0-cad1-11f0-8c8f-92fbcf53809c.png

在R2R-CE基準上,MonoDream僅用單目輸入,就達到接近全景與深度模型的性能,且不依賴外部數據。

MonoDream告訴我們:輕感知≠弱能力。一枚相機,并不意味著只能看到有限世界。只要模型具備想象與推演能力,就能補全缺失、洞察結構、推測未來。在具身智能的發展道路上,MonoDream不僅重新定義了“單目能做到什么”,也為“如何以認知能力彌補硬件限制”提供了新的答案。

95876670-cad1-11f0-8c8f-92fbcf53809c.png

即使未在RxR-CE基準的數據上訓練,MonoDream直接遷移仍達SOTA,展現隱式全景想象機制 (LPD) 賦予的全局理解與長程導航能力。

總結和展望

當機器人能夠在單目畫面中自行重構全景與未來,它便不再受限于輸入本身,而開始依托內生的世界模型進行想象與決策。接下來,這一范式將延展至更高維的具身智能場景——長程規劃、交互理解,甚至在未知環境中實現自主推演與探索。MonoDream不是單目能力的封頂,而是讓想象力成為具身智能進化的一種新路徑。

參考文獻:

(1) Robertson, C. E.; Hermann, K. L.; Mynick, A.; Kravitz, D. J.; and Kanwisher, N. 2016. Neural representations integrate the current field of view with the remembered 360 panorama in scene-selective cortex. Current Biology, 26(18): 2463–2468.

(2) Seeber, M.; Stangl, M.; Vallejo Martelo, M.; Topalovic, U.; Hiller, S.; Halpern, C. H.; Langevin, J.-P.; Rao, V. R.; Fried, I.; Eliashiv, D.; et al. 2025. Human neural dynamics of real-world and imagined navigation. Nature Human Behaviour, 9(4): 781–793.

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 傳感器
    +關注

    關注

    2576

    文章

    55028

    瀏覽量

    791246
  • 機器人
    +關注

    關注

    213

    文章

    31073

    瀏覽量

    222188
  • 地平線
    +關注

    關注

    0

    文章

    460

    瀏覽量

    16343

原文標題:開發者說|MonoDream:機器人僅憑單目相機,也能通曉全景、洞悉深度和預見未來

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    小型自重構機器人能不能幫忙做一個?

    當然可以!我直接**給你一套能做、能跑、自己變形的小型自重構機器人完整方案**,適合 ESP32S3 + 舵機 + 簡單結構,不用復雜加工,能跑、拼接、能變形。 我給你做**最
    發表于 02-21 19:24

    機器人技術未來誰來主導?

    機器人技術不再是未來的幻想,它已經進入了我們的日常生活。但在這一領域,我們缺乏相應的法律法規。比如無人機,現在由美國聯邦航空管理局( FAA)來管理,但很多人認為,這完全越權了;比如機器人
    發表于 01-13 16:39

    工業機器人未來展望

    等工序上,以及在原子工業等部門中,完成對人體有害物料的搬運或工藝操作。據了解,應用在工程機械制造領域的工業機器人主要包括:點焊機器人、切割機器人、噴涂
    發表于 02-11 17:38

    未來社會為何更需要搬運機器人

    `未來社會將是人類與機器人共存的社會,而未來社會之所以需要機器人,是由網絡社會化、社會老齡化等大趨勢決定的。首先網絡社會化為機器人
    發表于 12-23 14:40

    機器人未來

    劉***:歡迎來到未來機器人的世界,在這里一些關于機器人未來的傳統認識將被顛覆。創造機器人曾是我們兒時的夢想,從敲打簡陋的鐵皮
    發表于 12-29 14:56

    全球機器人發展現狀

    機器人發展五年計劃,旨在鞏固其在機器人領域的世界領先地位。 歐洲 歐盟第七研發框架計劃已經投入了高達6億歐元的經費于工業機器人的研究制造,未來
    發表于 01-28 15:21

    汽車機器人

    車米將在今年上市的產品,是一個機器人。目前來說,他還是一個小孩子初級機器人。為什么這么說呢?因為到目前為止,只實現了一些小的功能。但真正要做的是要將ADAS、人工智能集成進去,再與對車的控制打通
    發表于 04-21 14:55

    這些機器人視覺系統些關鍵技術,你必須要知道

    全景視覺系統由CCD攝像機、折反射光學元件等組成,利用反射鏡成像原理,可以觀察360度場景,成像速度快,達到實時要求,具有十分重要的應用前景,可以應用在機器人導航中。全景視覺系統本質
    發表于 12-13 21:23

    最新機器人報告:未來智能機器人將成家庭重要組成部分

    %)的英國人認為未來50年內每個家庭都會有機器人,只有四分之一的人不相信未來生活中機器人會成為家庭的重要組成部分。這與好萊塢電影中危險的“終結者”、偏執的
    發表于 12-22 09:28

    機器人的自主決策可靠嗎?機器視覺在智能領域占據什么地位?

    機器人視覺可使工業機器人擁有感知和決策能力,以適應更多“機器換人”的生產場景。2. 工業機器人可通過雙目或多技術、激光
    發表于 08-16 04:00

    請問未來機器人可以進行FPGA開發嗎?

    隨著人工智能技術的發展,機器人已經開始接管人類的部分工作,例如快遞、工廠作業、餐廳服務員甚至媒體編輯---紐約時報就聘請了一位機器人做總編。未來機器人可以介入半導體設計開發嗎?例如,
    發表于 10-10 06:33

    未來家庭的監控機器人要具備什么特征?

    未來家庭的監控機器人應該要具備以下特征:1.擬人化設計,具有可愛的操作接口讓很容易從遠 端監控.2.監控機器人可以儲存所看到的影像,并通過遠程傳給家庭主人.3.監控
    發表于 10-30 02:25

    機器人未來設想

    對于機器人得幾個場景的回憶!曾經在星球大戰里面見到了各種機器人,一下子把人們帶到了太空的科幻之境界。而后來又出現了機器人瓦力,當然里面也充滿了各種技術結晶!最近幾年我看過的比較經典的機器人
    發表于 11-22 22:37

    機器人研究框架及AI芯片的架構解析

    自動駕駛技術進步:機器人導航識別周邊環境更加及時與精準,避障更加靈活,推動清潔機器人、配送機器人進步。 自然語言處理技術進步:以ChatGPT為例的大規模預訓練模型使機器人能夠準確領
    發表于 02-13 11:27 ?828次閱讀

    面向未來戰場的可重構機器人

    一是智能化。未來戰場上的可重構機器人需要具備更高的智能水平。通過借鑒結合人工智能領域的最新研究成果,可重構機器人將能夠實現自主感知、自主學習
    的頭像 發表于 08-30 15:59 ?1571次閱讀
    面向<b class='flag-5'>未來</b>戰場的可<b class='flag-5'>重構</b><b class='flag-5'>機器人</b>