国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NeurIPS 2023 | 北大具身智能團隊提出需求驅動導航:對齊人類需求,讓機器人更高效

智能感知與物聯網技術研究所 ? 來源:未知 ? 2023-11-12 22:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

如果想讓機器人幫助你,你通常需要下達一個較為精準的指令,但指令在實際中的實現效果不一定理想。如果考慮真實環境,當要求機器人找某個特定的物品時,這個物品不一定真的存在當前的環境內,機器人無論如何也找不到;但是環境當中是不是可能存在一個其他物品,它和用戶要求的物品有類似的功能,也能滿足用戶的需求呢?這就是用 “需求” 作為任務指令的好處了。


近日,北京大學董豪團隊提出了一個新的導航任務 —— 需求驅動導航(Demand-driven Navigation,DDN),目前已被 NeurIPS 2023 接收。在這個任務當中,機器人被要求根據一條用戶給定的需求指令,尋找能夠滿足用戶需求的物品。同時,董豪團隊還提出了學習基于需求指令的物品屬性特征,有效地提高了機器人尋找物品的成功率。




論文地址:

https://arxiv.org/pdf/2309.08138.pdf

項目主頁:

https://sites.google.com/view/demand-driven-navigation/home



▲項目視頻



任務說明

具體地說,在任務的一開始,機器人會收到一條需求指令,比如 “我餓了”,“我渴了”,然后機器人就需要在場景內尋找一個能滿足該需求的物品。因此,需求驅動導航本質上還是一個尋找物品的任務,在這之前已經有類似的任務 —— 視覺物品導航(Visual Object Navigation)。這兩個任務的區別在于,前者是告知機器人 “我的需求是什么”,后者是告知機器人 “我要什么物品”。




將需求作為指令,意味著機器人需要對指令的內容進行推理和探索當前場景中的物品種類,然后才能找到滿足用戶需求的物品。從這一點上來說,需求驅動導航要比視覺物品導航難很多。雖說難度增加了,但是一旦機器人學會了根據需求指令尋找物品,好處還是很多的。比如:
  • 用戶只需要根據自己的需求提出指令,而不用考慮場景內有什么。
  • 用需求作為指令可以提高用戶需求被滿足的概率。比如當 “渴了” 的時候,讓機器人找 “茶” 和讓機器人找 “能解渴的物品”,顯然是后者包含的范圍更大。
  • 用自然語言描述的需求擁有更大的描述空間,可以提出更為精細、更為確切的需求。


為了訓練這樣的機器人,需要建立一個需求指令到物品的映射關系,以便于環境給予訓練信號。為了降低成本,董豪團隊提出了一種基于大語言模型的、“半自動” 的生成方式:先用 GPT-3.5 生成場景中存在的物品能滿足的需求,然后再人工過濾不符合要求的。



算法設計

考慮到能滿足同一個需求的物品之間有相似的屬性,如果能學到這種物品屬性上的特征,機器人似乎就能利用這些屬性特征來尋找物品。比如,對于 “我渴了” 這一需求,需要的物品應該具有 “解渴” 這一屬性,而 “果汁”、“茶” 都具有這一屬性。這里需要注意的是,對于一個物品,在不同的需求下可能表現出不同的屬性,比如 “水” 既能表現出 “清潔衣物” 的屬性(在 “洗衣服” 的需求下),也能表現出 “解渴” 這一屬性(在 “我渴了” 的需求下)。


屬性學習階段


那么,如何讓模型理解這種 “解渴”、“清潔衣物” 這些需求呢?注意到在某一需求下物品所表現出的屬性,是一種較為穩定的常識。而最近幾年,隨著大語言模型(LLM)逐漸興起,LLM 所表現出的對人類社會常識方面的理解讓人驚嘆。


因此,北大董豪團隊決定向 LLM 學習這種常識。他們先是讓 LLM 生成了很多需求指令(在圖中稱為 Language-grounding Demand,LGD),然后再詢問 LLM,這些需求指令能被哪些物品滿足(在圖中稱為 Language-grounding Object,LGO)。



在這里要說明,Language-grounding 這一前綴強調了這些 demand/object 是可以從 LLM 中獲取而不依賴于某個特定的場景;下圖中的 World-grounding 強調了這些 demand/object 是與某個特定的環境(比如 ProcThor、Replica 等場景數據集)緊密結合的。


然后為了獲取 LGO 在 LGD 下所表現出的屬性,作者們使用了 BERT 編碼 LGD、CLIP-Text-Encoder 編碼 LGO,然后拼接得到 Demand-object Features。注意到在一開始介紹物品的屬性時,有一個 “相似性”,作者們就利用這種相似性,定義了 “正負樣本”,然后采用對比學習的方式訓練 “物品屬性”。


具體來說,對于兩個拼接之后的 Demand-object Features,如果這兩個特征對應的物品能滿足同一個需求,那么這兩個特征就互為正樣本(比如圖中的物品 a 和物品 b 都能滿足需求 D1,那么 DO1-a 和 DO1-b 就互為正樣本);其他任何拼接均互為負樣本。作者們將 Demand-object Features 輸入到一個 TransformerEncoder 架構的 Attribute Module 之后,就采用 InfoNCE Loss 訓練了。


導航策略學習階段


通過對比學習,Attribute Module 中已經學到了 LLM 提供的常識,在導航策略學習階段,Attribute Module 的參數被直接導入,然后采用模仿學習的方式學習由 A* 算法收集的軌跡。在某一個時間步,作者采用 DETR 模型,將當前視野中的物品分割出來,得到 World-grounding Object,然后由 CLIP-Visual-Endocer 編碼。其他的流程與屬性學習階段類似。最后將對需求指令的 BERT 特征、全局圖片特征、屬性特征拼接,送入一個 Transformer 模型,最終輸出一個動作。



值得注意的是,作者們在屬性學習階段使用了 CLIP-Text-Encoder,而在導航策略學習階段,作者們使用了 CLIP-Visual-Encoder。這里巧妙地借助于 CLIP 模型在視覺和文本上強大的對齊能力,將從 LLM 中學習到的文本常識轉移到了每一個時間步的視覺上。



實驗結果

實驗是在 AI2Thor simulator 和 ProcThor 數據集上進行,實驗結果表明,該方法顯著高于之前各種視覺物品導航算法的變種、大語言模型加持下的算法。



VTN 是一種閉詞匯集的物品導航算法(closed-vocabulary navigation),只能在預先設定的物品上進行導航任務。作者們對它的算法做了一些變種,然而不管是將需求指令的 BERT 特征作為輸入、還是將 GPT 對指令的解析結果作為輸入,算法的結果都不是很理想。當換成 ZSON 這種開詞匯集的導航算法(open-vocabulary navigation),由于 CLIP 在需求指令和圖片之間的對齊效果并不好,導致了 ZSON 的幾個變種也無法很好的完成需求驅動導航任務。


而一些基于啟發式搜索 + LLM 的算法由于 Procthor 數據集場景面積較大,探索效率較低,其成功率并沒有很高。純粹的 LLM 算法,例如 GPT-3-Prompt 和 MiniGPT-4 都表現出較差的對場景不可見位置的推理能力,導致無法高效地發現滿足要求的物品。


消融實驗表明了 Attribute Module 顯著提高了導航成功率。作者們展示了 t-SNE 圖很好地表現出 Attribute Module 通過 demand-conditioned contrastive learning 成功地學習到了物品的屬性特征。而將 Attribute Module 架構換成 MLP 之后,性能出現了下降,說明 TransformerEncoder 架構更適合用于捕捉屬性特征。BERT 很好提取了需求指令的特征,使得對 unseen instruction 泛化性得到了提升。




下面是一些可視化:


本次研究的通訊作者董豪博士現任北京大學前沿計算研究中心助理教授,博士生導師、博雅青年學者和智源學者,他于 2019 年創立并領導北大超平面實驗室(Hyperplane Lab),目前已在 NeurIPS、ICLR、CVPR、ICCV、ECCV 等國際頂尖會議 / 期刊上發表論文 40 余篇,Google Scholar 引用 4700 余次,曾獲得 ACM MM 最佳開源軟件獎和 OpenI 杰出項目獎。他還曾多次擔任國際頂尖會議如 NeurIPS、 CVPR、AAAI、ICRA 的領域主席和副編委,承擔多項國家級和省級項目,主持科技部新一代人工智能 2030 重大項目。


原文標題:NeurIPS 2023 | 北大具身智能團隊提出需求驅動導航:對齊人類需求,讓機器人更高效

文章出處:【微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2945

    文章

    47820

    瀏覽量

    415052

原文標題:NeurIPS 2023 | 北大具身智能團隊提出需求驅動導航:對齊人類需求,讓機器人更高效

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    破解柔性生產難題:知識驅動智能工業機器人的實戰應用指南

    解鎖工業機器人潛力的關鍵。然而,如何在復雜多變的工業場景中機器人擁有“常識”和“專業知識”?本文將深度解析前沿的知識驅動
    的頭像 發表于 03-06 15:49 ?76次閱讀
    破解柔性生產難題:知識<b class='flag-5'>驅動</b><b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>工業<b class='flag-5'>機器人</b>的實戰應用指南

    智能交流會

    。展會匯聚 90%+ 核心部件國產化供應鏈,可快速實現技術落地,坐享粵港澳大灣區 “機器人谷” 核心紅利。 2 、同期多展聯動 與工業自動化展、機器視覺展同期舉辦,形成 “感知(視覺)→決策(
    發表于 01-22 09:55

    從汽車到智能,TSN如何構建機器人的確定性未來?

    TSN提供的統一網絡,能夠機器人開發人員將精力集中在應用軟件和高級算法上,而不是被底層的通信問題所困擾。這正是智能時代的呼喚:將關注點
    的頭像 發表于 01-14 14:14 ?7299次閱讀
    從汽車到<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>,TSN如何構建<b class='flag-5'>機器人</b>的確定性未來?

    資訊速遞 | 智能PMC(籌)發布“零成本”開源鴻蒙智能機器人系統

    面向智能機器人系統與應用開發,Ubuntu 等操作系統可以用 ROS2 生態、機器人仿真器、英偉達算力。 然而在國產化方面,開源鴻蒙操作
    的頭像 發表于 01-05 16:24 ?419次閱讀
    資訊速遞 | <b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>PMC(籌)發布“零成本”開源鴻蒙<b class='flag-5'>智能</b><b class='flag-5'>機器人</b>系統

    廣和通智能開發平臺Fibot實現雙臂機器人疊衣服

    疊衣服、整理家務……這些看似簡單的日常任務,對機器人而言卻是巨大的技術挑戰。如何機器人快速學會疊衣服?廣和通
    的頭像 發表于 12-11 13:43 ?1423次閱讀

    廣和通斬獲智能家務機器人黑客松競賽二等獎

    近日,廣和通受邀參加由 Hugging Face、NVIDIA 與 Seeed Studio 聯合舉辦的“智能家務機器人黑客松”競賽。在本次前沿賽事中,廣和通
    的頭像 發表于 11-08 14:51 ?1705次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+智能芯片

    。 決策層: 決策層是智能的第三個主要層次,負責根據已有信息做出決策或行動。 包括各種規則引擎、決策配套系統等。它的作用是根據已有信息做出最優決策或行動。決策層可以使用各種控制器,如機器人
    發表于 09-18 11:45

    瑞可達榮獲智能機器人技術先鋒獎

    近日,“2025年(第二屆)“智能機器人場景應用生態大會暨
    的頭像 發表于 06-16 18:09 ?1244次閱讀

    智能時代來臨,靈途科技助力人形機器人“感知升級”

    驅動系統與AI算法的落地應用,展覽與沙龍雙線并行,全面呈現人形機器人的前沿進展。 作為智能核心零部件供應商,靈途科技攜多款自研高性能光
    的頭像 發表于 04-28 09:31 ?699次閱讀
    <b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>時代來臨,靈途科技助力人形<b class='flag-5'>機器人</b>“感知升級”

    智能工業機器人:引爆制造業‘自進化’革命

    智能工業機器人:引爆制造業‘自進化’革命 在工業4.0浪潮席卷全球的今天,制造業正經歷從“自動化”到“智能化”的質變。作為這場變革的核心
    的頭像 發表于 04-17 13:49 ?982次閱讀
    <b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>工業<b class='flag-5'>機器人</b>:引爆制造業‘自進化’革命

    廣汽集團重磅發布智能機器人核心部件 一體式關節產品和低壓伺服驅動

    機器人核心部件——新一代一體式關節產品和低壓伺服驅動器,產品覆蓋機器人從精密操作到高負載運動的全場景需求,技術指標全面對標國際頂尖水平,部分性能甚至實現超越。 廣汽集團
    的頭像 發表于 04-09 18:08 ?1711次閱讀
    廣汽集團重磅發布<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b><b class='flag-5'>機器人</b>核心部件 一體式關節產品和低壓伺服<b class='flag-5'>驅動</b>器

    智造升級新引擎:智能工業機器人仿真軟件推薦與富唯智能的突圍之道

    在工業4.0與智能制造深度融合的今天,企業對柔性生產、快速迭代的需求日益迫切。然而,傳統工業機器人因場景適應性差、調試周期長、研發成本高等問題,難以滿足動態市場的要求。如何通過
    的頭像 發表于 04-02 15:29 ?1172次閱讀
    智造升級新引擎:<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>工業<b class='flag-5'>機器人</b>仿真軟件推薦與富唯<b class='flag-5'>智能</b>的突圍之道

    普渡科技推出類人形智能服務機器人閃電匣Arm

    近日,普渡機器人發布了全球首款商用場景類人形智能服務機器人閃電匣Arm。
    的頭像 發表于 04-01 17:48 ?1481次閱讀

    解碼“什么是智能工業機器人

    在工業4.0與人工智能深度融合的浪潮中,“什么是智能工業機器人”成為制造業智能化轉型的核心議
    的頭像 發表于 03-21 14:47 ?2110次閱讀
    解碼“什么是<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>工業<b class='flag-5'>機器人</b>”

    移遠通信:領航AI大模型時代,驅動智能機器人產業未來

    當前,隨著大模型技術的不斷突破,智能產業迎來了重要的發展機遇,成為了產業界熱議的焦點。3月13日,由蓋世汽車主辦的2025第三屆
    的頭像 發表于 03-13 19:04 ?1374次閱讀
    移遠通信:領航AI大模型時代,<b class='flag-5'>驅動</b><b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b><b class='flag-5'>機器人</b>產業未來