国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Progress-Think框架賦能機器人首次實現語義進展推理

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 2025-12-03 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Progress-Think

機器人首次實現語義進展推理

標簽在指令結構中定位任務進展

在視覺語言導航(VLN)中,機器人長期缺乏一種關鍵能力:它能持續前進,卻無法判斷自己的任務推進到了哪一步。導航在空間中不斷展開,畫面節節推進,但模型并不知道自己在自然語言指令里處于什么階段,因此容易漂移、兜圈,或做出難以解釋的決策。我們認為,引入語義進展推理,是破解長程導航不穩定性的關鍵路徑。

Progress-Think讓機器人第一次具備語義層面的“進展坐標系”。我們首次揭示了視覺觀測序列與指令語義之間的結構性關聯,并將其提煉為可學習的進展信號,使模型無需額外標注即可學會思考:“我剛完成了什么”。通過自監督的進展對齊、進展引導決策以及進展一策略聯合微調,僅憑單目相機輸入,模型就能顯著減少偏航并提升穩定性。Progress-Think在R2R-CE等標準數據集上取得領先表現,并進一步推動具身推理朝更明確的任務導向發展。

? 論文題目:

Progress-Think: Semantic Progress Reasoning for Vision-Language Navigation

? 論文鏈接:

https://arxiv.org/abs/2511.17097

?項目主頁:

https://horizonrobotics.github.io/robot_lab/progress-think

從空間定位到進展定位

在視覺語言導航 (VLN) 中,機器人往往只會執行動作,卻難以理解任務的推進。它能在空間中持續移動,卻無法判斷指令走到了哪一步;視覺觀測不斷更新,但任務完成度可能在它的認知里存在偏差。這種缺乏“語義位置感”的現象,使導航在遇到復雜場景時容易失去方向,出現漂移、兜圈或反復確認等不穩定行為。

視覺觀測與指令語義呈協同單調推進;即隨著觀測累積(上),匹配的指令前綴同步單調擴展(下),后續進展(紅)始終在早期進展(藍)上遞進。

Progress-Think的核心洞見在于:視覺語言導航本質上不僅是幾何運動,而是執行一段結構化語言指令的語義進展過程。基于這一視角,我們揭示了視覺觀測序列與指令語義之間存在協同單調關系:當畫面從“床邊”走向“門口”時,指令也應從“離開床邊”自然推進到“朝門口轉向”。我們進一步將這一結構規律提煉為任務層面的語義方位基準,為后續決策提供進展的建模。

零標注學習語義進展

為了在沒有進展標注的情況下習得進展定位能力,我們設計了一個三階段的學習框架。第一階段,通過前綴對齊的自監督訓練,模型在視覺軌跡中自動推斷出與指令前綴的對應關系,使“當前觀察對應哪一語義段落”成為一種內生表征,而非依賴外部標注。第二階段,我們將進展表示作為上下文注入導航VLA策略,使決策在結合指令和觀測的同時,也能參考自身的任務進展,從而形成明確的語義方向感。第三階段,通過進展推理與導航VLA策略的聯合優化,使模型在推理時保持一致、穩健的進展定位能力,并形成從語義對齊到動作生成的完整閉環。

2eb15256-cdd5-11f0-8c8f-92fbcf53809c.png

Progress-Think模型在原有VLA結構上加入“進展推理模塊”,用于判斷當前指令完成到哪一步,并據此引導動作生成。整個系統通過三階段、無需標注的流程完成訓練:① 自監督的進展對齊;② 進展引導的策略預訓練;③ 進展–策略聯合優化。

在三階段學習下,進展不再是一個回歸值或附加標簽,而演化為貫穿視覺理解、語義推理與行動決策的結構性信號。機器人由此首次具備真正的“進展定位”能力,能夠在執行中持續推理“我完成到哪了”,并據此更清晰地決策“下一步該做什么”。

語義進展助力多步驟指令導航

具備可推理的進展定位后,機器人的行為方式發生了明顯變化。它不再像傳統模型那樣給出與任務無關或時序混亂的描述,而是能夠持續跟蹤自己處于指令的哪一步。導航軌跡因此更穩、更有方向感,執行過程也呈現出清晰的語義連貫性,讓人類能一眼看出它正在完成任務的哪一段。

2f0da6c8-cdd5-11f0-8c8f-92fbcf53809c.png

GPT-4o和NVILA的描述經常跑偏,無法用于判斷進展;消融版Progress-Think偶有幻覺,可靠性不足;而完整版Progress-Think能穩定推理出與真實進展對齊的結果。

在R2R-CE等基準上,Progress-Think在僅使用單目RGB的條件下,便超越了依賴全景或深度的傳統方案,顯著提升了長程任務的成功率、穩定性與可解釋性。結果表明,長程導航的核心限制在于缺失語義進展這一結構性能力;當機器人能夠理解“自己做到哪”,導航才真正具備持續、可靠的任務推進能力。

2f6bc514-cdd5-11f0-8c8f-92fbcf53809c.png

在R2R Val-Unseen上,Progress-Think在無深度、無全景、零外部數據的條件下依然取得最佳表現。

總結和展望

隨著Progress-Think的引入,機器人第一次擁有了自身行為在任務語義層面的“進展坐標系”,能夠在任務結構中定位自己,并以此為決策提供額外的進展約束。它在決策“下一步怎么走”前,先思考“我已經走到哪一步”,從而讓長程行為更連貫、更可解釋。我們期待將這種語義進展推理能力擴展至高層規劃、多輪交互和自主探索,讓具身智能逐步邁向真正的任務理解與長期推理。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31070

    瀏覽量

    222162
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52096
  • 地平線
    +關注

    關注

    0

    文章

    460

    瀏覽量

    16341

原文標題:開發者說|Progress-Think:語義進展推理,讓機器人理解每次行動的意義

文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊

    具身智能機器人的基礎模塊,這個是本書的第二部分內容,主要分為四個部分:機器人計算系統,自主機器人的感知系統,自主機器人的定位系統,自主機器人
    發表于 01-04 19:22

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品

    大象機器人成立于2016年,專注協作機器人研發與應用,產品線涵蓋輕量級協作機器人、人形機器人、仿生機器人等多種形態。拳頭產品myCobot系
    發表于 04-25 17:59

    智能清潔機器人

    項目說明:室內地面清潔是人們生活中較為頻繁的勞動,傳統吸塵器工作時需要人的參與,且操作不便。室內地面清潔機器人將智能手機、移動機器人技術和吸塵器技術有機地融合起來,結構靈巧,實現了室內環境的自主清潔
    發表于 11-08 22:30

    什么是工業機器人

    申請了專利。該專利的要點是借助伺服技術控制機器人的關節,利用人手對機器人進行動作示教,機器人實現動作的記錄和再現。這就是所謂的示教再現
    發表于 01-19 10:58

    語義機器人

    客服機器人系統、智能硬件和機器人的對話系統建設,能讓人機對話的過程變得更加自然流暢;另外還可以接入類似幼兒教育、聽廣播、訂機票等外部服務,功能可以無限擴展。
    發表于 03-10 16:52

    什么是龍四足機器人

    四足機器人是一種仿生機器人,由Openduino控制板控制,有四條腿,每條腿兩個自由度,由兩個舵機驅動,實現兩種步態行走。配有三個超聲
    發表于 03-24 16:17

    機器人彈鋼琴,實現難度如何?

    鋼琴曲目的機器人,只需要它實現彈奏曲目。因為現在剛剛接觸機器人制作方面,只懂一些中斷和舵機啥的,不知道做成的難度有多大,,,,希望各位前輩能夠不舍賜教。如果能做成,都需要
    發表于 05-22 17:06

    機器人彈鋼琴

    鋼琴曲目的機器人,只需要它實現彈奏曲目。因為現在剛剛接觸機器人制作方面,只懂一些中斷和舵機啥的,不知道做成的難度有多大,,,,希望各位前輩能夠不舍賜教。如果能做成,都需要
    發表于 05-22 17:09

    辰漢-如何實現服務機器人的運算與控制

    、無線網絡模塊、顯示模塊,可以連接手機,通過手機APP端對機器人進行相關設置,同時機器人攝像頭采集到的圖像也實時傳給手機,也可以和手機進行語音對講。機器人也帶有語音識別模塊,如可以向
    發表于 06-09 17:18

    智能機器人現身武漢車管所,能說會道還能辦業務!

    實現了在語義理解、知識學習、推理與表示等方面較為完備的智能支撐體系。同時,通過事前的人工訓練和日常的業務積累,機器人能夠不斷地積累經驗和知識,假以時日,不但會在業務水平與服務能力方面
    發表于 07-12 17:11

    分享:人工智能算法將帶領機器人走向何方?

    機器人是可編程的;(3)機器人通常是自主或半自主的; 什么是人工智能人工智能是一個大的范疇,里面包括了很多小的分支,是依靠算法實現的,它通過開發計算機程序來完成智能的任務,幫助載體
    發表于 08-16 10:44

    機器人正在快速進入智能停車設備領域

    據報道,在11月22日舉辦的2018上海停車展上多家企業都將agv機器人作為新品首次展出。深圳怡豐在現場首發其第三代泊車機器人,新型滾筒式泊車agv機器人——getamodelw;無線
    發表于 11-28 16:20

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡檢機器人開發

    本帖最后由 馬猛 于 2020-11-26 10:17 編輯 項目名稱:基于HiSpark AI Camera HarmonyOS 智能巡檢機器人開發試用計劃:HiSpark AI
    發表于 11-18 18:15

    桁架機器人的概念與特點都有哪些?

    替代。在機器人和自動化工業生產領域中,龍門式機器人實現了制造過程的完全自動化,并采用了集成加工技術,適 用于機床、生產線的上下料、工件翻轉、工件轉序等, 同時其高精度夾持定位工具系統為機器人
    發表于 11-30 09:44

    Aux-Think打破視覺語言導航任務的常規推理范式

    :無論是行動前推理(Pre-Think),還是行動后推理(Post-Think),一旦在測試階段顯式生成推理鏈,反而更容易讓
    的頭像 發表于 07-08 10:00 ?633次閱讀
    Aux-<b class='flag-5'>Think</b>打破視覺語言導航任務的常規<b class='flag-5'>推理</b>范式