国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器人如何獲得能夠有效泛化到各種現實世界物體和環境的技能?

Tensorflowers ? 來源:未知 ? 作者:胡薇 ? 2018-07-12 17:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡管設計一套能夠在受控環境中有效執行重復任務的機器人系統(例如,在裝配線上組裝產品)十分平常,但設計一種能夠觀察周圍環境和確定最佳行動方案,同時對意外結果做出反應的機器人卻非常困難。

不過,有兩種工具可以幫助機器人從經驗中獲得這些技能:深度學習和強化學習。前者非常適合處理非結構化的現實世界場景,而后者可以實現更長期的推理,同時展現出更復雜、更強大的順序決策能力。如果將這兩種技術結合,將有可能讓機器人不斷地從經驗中學習,使它們能夠通過數據而非人為設計來掌握基本的感覺運動技能。

設計用于機器人學習的強化學習算法本身提出了一系列挑戰:現實世界的物體具有各種各樣的視覺和物理屬性,接觸力的細微差別都可能會使物體運動難以預測,并且相關物體可能會受到遮擋。此外,機器人傳感器本身具有噪聲,這也增加了復雜性。所有這些因素綜合到一起,使得學習一個通用解異常困難,除非訓練數據足夠多樣化,然而,收集這樣的數據又十分耗時。

這就促使人們去探索一種能夠有效重用過往經驗的學習算法,類似于我們之前一項關于抓取的研究,這項研究就受益于大數據集。不過,這項研究無法推斷動作的長期后果,而這一點對學習如何抓取十分重要。例如,如果多個物體聚集在一起,那么將其中一個分開(稱為“分割”)將使得抓取更容易,即使這樣做與成功抓取并無直接關聯。

分割示例

為了提高效率,我們需要采用脫策強化學習,這種算法可以從數小時、數天或數周前收集的數據中學習。為了設計這樣一種可以利用從歷史互動中獲得的大量不同經驗的脫策強化學習算法,我們將大規模分布式優化與一個新的擬合深度 Q 學習算法(我們稱之為 QT-Opt)相結合。arXiv 上提供了預印本。

QT-Opt 是一種分布式 Q 學習算法,支持連續動作空間,非常適合解決機器人問題。為了使用 QT-Opt,我們首先使用已收集的數據以完全離線的方式訓練模型。此過程不需要運行真正的機器人,因而更易于擴展。然后,我們在真正的機器人上部署并微調該模型,使用新收集的數據進一步訓練模型。通過運行 QT-Opt,我們得以積累更多的離線數據,這使得我們能夠訓練出更好的模型,而這反過來又有利于收集更好的數據,從而形成一個良性循環。

為了將這種方法應用于機器人抓取,我們使用了 7 個現實世界的機器人,在 4 個月的時間里,機器人總共運行了 800 個小時。為了引導收集過程,我們首先使用手動設計的策略,成功率為 15-30%。在表現提升后,數據收集轉向學到的模型。策略利用相機圖像并返回手臂和抓手的移動方式。離線數據包含對 1000 多種不同物體的抓取。

使用的一些訓練物體

通過過去的研究,我們已經發現在機器人之間共享經驗可以加快學習速度。我們將此訓練和數據收集過程擴展到 10 個 GPU、7 個機器人和多個 CPU,因此得以收集和處理包含超過 580,000 次抓取嘗試的大型數據集。在這個過程的最后,我們成功訓練了一種抓取策略,此策略在現實世界機器人上運行并且可以泛化到訓練時未見過的各種具有挑戰性的物體。

七個機器人正在收集抓取數據

從量化角度來看,在關于以前未見過物體的 700 次抓取試驗中,QT-Opt 方法的抓取成功率達到 96%。先前基于監督式學習的抓取方法的成功率為 78%,相比之下,新方法將錯誤率降低了五倍以上。

評估時使用的物體

為了使任務具有挑戰性,我們增加了物體尺寸、

紋理和形狀的多樣性

值得注意的是,策略展現出了標準機器人抓取系統中少見的各種閉環、反應性行為:

? 當面對一組無法一起拾起的聯鎖塊時,策略先將一個塊與其他塊分開,然后再將它拾起。

? 當面對難以抓取的物體時,策略會推算出它應該調整抓手位置并重新抓取,直到抓牢為止。

? 當在一堆物體中抓取時,策略會探測不同的物體,直到抓手緊緊握住一個物體時才會將它拾起。

? 當我們故意將物體從抓手上弄掉以擾亂機器人時(訓練期間未經歷過這種情況),它會自動重新調整抓手位置,進行另一次嘗試。

最重要的是,這些行為都并非人為設計。這些行為基于 QT-Opt 的自監督式訓練自動出現,因為它們提高了模型的長期抓取成功率。

學到的行為示例

在左側的 GIF 中,策略針對移動的球進行更正

在右側的 GIF 中,策略在多次抓取嘗試后

成功拾起難以抓握的物體

此外,我們發現 QT-Opt 使用較少的訓練數據達到了較高的成功率,盡管收斂時間較長。這對機器人技術來說尤其令人興奮,因為,此領域的瓶頸通常是收集現實機器人數據,而不是訓練時間。將此策略與其他數據效率技術(例如我們之前關于抓取領域自適應的研究)相結合,可以在機器人技術領域開辟一些有趣

總體而言,QT-Opt 算法是一種通用的強化學習方法,在現實世界機器人上表現非常出色。除獎勵定義外,QT-Opt 沒有任何特定于機器人抓取的限制。我們認為這是向更通用的機器人學習算法邁出的重要一步,并期待看到其他適用的機器人任務。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31079

    瀏覽量

    222259
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124398
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    德州儀器助力人形機器人從走向規模應用

    從科幻設想走向工程現實,人形機器人正成為工業領域最具挑戰性的技術前沿之一。融合人工智能算法、精密運動控制系統與類結構設計,它能夠在復雜環境
    的頭像 發表于 03-06 13:49 ?230次閱讀

    從概念到落地:靈巧手為何是人形機器人產業的決勝環節?

    人形機器人被譽為下一代通用型機器人平臺,其終極目標是能夠無縫接入人類環境,使用人類工具,執行多樣任務。然而,能否“靈巧”地操作
    的頭像 發表于 02-01 11:03 ?695次閱讀

    NVIDIA Cosmos世界基礎模型如何塑造機器人未來

    在這一演進過程中,世界模型逐漸成為連接高層智能與底層執行的關鍵基礎設施。通過對環境狀態及其時間演化進行建模,世界模型使機器人系統能夠在受控
    的頭像 發表于 01-22 16:38 ?524次閱讀
    NVIDIA Cosmos<b class='flag-5'>世界</b>基礎模型如何塑造<b class='flag-5'>機器人</b>未來

    如何利用NVIDIA Cosmos Cookbook提升機器人操作能力

    機器人操控系統在進入動態現實環境時,難以應對持續變化的物體、光照條件及接觸動力學。此外,仿真與現實之間的差距,以及未經過優化的抓手或工具,通
    的頭像 發表于 12-31 16:05 ?2013次閱讀
    如何利用NVIDIA Cosmos Cookbook提升<b class='flag-5'>機器人</b>操作能力

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    更多"、"互動更流暢"是開發者面臨的核心挑戰。傳統的單一屏幕和有限的視覺輸入已成為提升機器人智能水平的瓶頸。而瑞芯微RK3576高性能處理器的出現
    發表于 10-29 16:41

    智能決策、2厘米級控制,星燦機器人發布割草機器人

    電子發燒友網報道(文/莫婷婷)傳統機器人化性差,智能程度相對較低。具身智能機器人具有高通用性,可在各類場景完成復雜任務,包括快速理解復雜環境、能夠
    的頭像 發表于 08-29 11:30 ?8545次閱讀
    智能決策、2厘米級控制,星燦<b class='flag-5'>機器人</b>發布割草<b class='flag-5'>機器人</b>

    機器人競技幕后:磁傳感器芯片激活 “精準感知力”

    機器人獲得更接近人類的觸覺反饋。 賽事首席技術官王博士表示:“當機器人開始‘感知’而非‘計算’環境時,真正的智能競技時代才算到來?!?未
    發表于 08-26 10:02

    工業機器人的特點

    0.3%的年化生產力提升。因此,發展工業機器人推動國內自動水平,提高產出是目前的不二之選。 ** 適用范圍廣** 機器人相對于工人的優勢還體現在應用范圍廣。機器人可以運用在危險、惡劣
    發表于 07-26 11:22

    機器人測試:從虛擬現實機器人如何才能變成真正的打工牛馬?

    從虛擬世界的算法優化,現實中的 “抗造” 考驗,再到細節處的容錯能力,機器人的每一輪測試,本質上都是在模仿人類 “打工人” 的成長路徑:先在練習中練熟
    的頭像 發表于 07-11 09:16 ?1746次閱讀
    <b class='flag-5'>機器人</b>測試:從虛擬<b class='flag-5'>到</b><b class='flag-5'>現實</b>,<b class='flag-5'>機器人</b>如何才能變成真正的打工牛馬?

    盤點#機器人開發平臺

    地瓜機器人RDK X5開發套件地瓜機器人RDK X5開發套件產品介紹 旭日5芯片10TOPs算力-電子發燒友網機器人開發套件 Kria KR260機器人開發套件 Kria KR260-
    發表于 05-13 15:02

    詳細介紹機場智能指路機器人的工作原理

    負責接收旅客的語音指令,以便機器人理解旅客的需求。 環境感知與信息融合 :這些傳感器收集的信息會進行融合處理。例如,激光雷達提供的距離信息和攝像頭捕捉的視覺信息相結合,能讓機器人更準
    發表于 05-10 18:26

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    : 一、機器人視覺:從理論到實踐 第7章詳細介紹了ROS2在機器視覺領域的應用,涵蓋了相機標定、OpenCV集成、視覺巡線、二維碼識別以及深度學習目標檢測等內容。通過學習,我認識: 相機標定的重要性
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】機器人入門的引路書

    的非常好的,特別是一些流程圖,很清晰的闡釋了概念 很適合作為初學者入門的引路書 還能了解很多技術和框架,破除初學者的自負困境,讓初學者知道功能是由很多開發者維護的,前人已經為各種產品搭建了完善的框架。避免陷入得一個單打獨斗的錯覺 一直蠢蠢欲動ros2和
    發表于 04-30 01:05

    工業機器人工作站的建設意義

    整合機器人資源,工作站可以有效縮小工作空間,簡化操作流程,使工人只需負責裝卸工件,從而降低工作強度。同時,隨著新材料和智能輔助設備的應用,傳統的惡劣作業環境得到了顯著改善,為工人提供
    發表于 03-17 14:49

    AgiBot World Colosseo:構建通用機器人智能的規模數據平臺

    AgiBot World Colosseo:構建通用機器人智能的規模數據平臺 隨著人工智能在語言處理和計算機視覺領域取得突破,機器人技術仍面臨現實場景
    的頭像 發表于 03-12 11:42 ?1985次閱讀
    AgiBot World Colosseo:構建通用<b class='flag-5'>機器人</b>智能的規模<b class='flag-5'>化</b>數據平臺