国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

當(dāng)機器人遇見強化學(xué)習(xí),會碰出怎樣的火花?

hl5C_deeptechch ? 來源:麻省理工科技評論 ? 作者:麻省理工科技評論 ? 2021-04-13 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當(dāng)機器人遇見強化學(xué)習(xí),會碰出怎樣的火花?

一名叫 Cassie 的機器人,給出了生動演繹。

最近,24 歲的中國南昌小伙李鐘毓和其所在團隊,用強化學(xué)習(xí)教 Cassie 走路 ,目前它已學(xué)會蹲伏走路和載重走路等。

相關(guān)論文以 《雙足機器人魯棒參數(shù)化運動控制的強化學(xué)習(xí)》(Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots)為題,已被機器人國際學(xué)術(shù)頂會 ICRA 收錄。

通過強化學(xué)習(xí),它能自己走路,并能進行自我恢復(fù)。在現(xiàn)實世界中,通過反復(fù)試驗來訓(xùn)練大型機器人會很危險,為解決這些問題,李鐘毓所在小組使用了兩個不同的仿真環(huán)境。

研究中,一個虛擬版本的 Cassie,通過與環(huán)境交互產(chǎn)生的大量數(shù)據(jù),來學(xué)習(xí)穩(wěn)定的步態(tài)。

習(xí)得的步態(tài)控制器,被轉(zhuǎn)移到名為 SimMechanics 的第二個仿真環(huán)境中進行驗證,該環(huán)境有更高的準(zhǔn)確性,可用以模擬現(xiàn)實世界的物理過程,但是會減慢仿真運行速度。

而通過使用在仿真環(huán)境中學(xué)習(xí)的步態(tài)控制器,Cassie 能非常平穩(wěn)地行走,且無需進行任何額外微調(diào)。它不僅能像人類一樣前后左右地走,還能蹲著走,也能承受意料之外的負載,更能從強行推動造成的失穩(wěn)狀態(tài)中恢復(fù)過來。

比如,在測試期間,Cassie 損壞了它右腿的兩個電機,但它仍能調(diào)整其步行策略、并進行適應(yīng)。

機器人如何更魯棒?答案是強化學(xué)習(xí)

Cassie 是李鐘毓所在的 Hybrid Robotics Group 實驗室、從美國 Agility Robotics 公司買來的,它大概有一米多高,內(nèi)部擁有十個電機,以及二十個自由度。

據(jù)他介紹,Cassie 于 2017 年首次開始出售,他從 2019 年開始接觸,目前已經(jīng)研究兩年有余。

買來后,其主要用于測試和驗證不同算法,如控制算法和導(dǎo)航控制算法等。在李鐘毓這里,Cassie 更像是一個研究平臺。

事實上,足式機器人的核心正是控制算法。研究中,李鐘毓主要使用 Python 進行編程,主體代碼由其所在小組搭建,剩余一部分基于其他學(xué)者的開源代碼。

由于是二足機器人,算法控制上會更難。而該研究的創(chuàng)新點在于,用強化學(xué)習(xí)的方法,得到控制二足機器人步態(tài)的算法,相比傳統(tǒng)基于模型的算法,性能可得到顯著提升。

由此帶來的魯棒性也比較強,怎么推它都不會倒,即便在幾乎快要摔倒的情況下,也能快速恢復(fù)穩(wěn)定狀態(tài),這也是業(yè)內(nèi)首次展示出二足機器人如此穩(wěn)定的性能。

在強化學(xué)習(xí)之前,傳統(tǒng)基于模型的方法,需要很多時間和技巧給機器人做建模,尤其對于二足機器人而言,一旦其自身性質(zhì)和周圍環(huán)境發(fā)生改變,比如電機壞了、地面摩擦力有變化,模型很有可能就會失效。

其次,對于雙足式的機器人系統(tǒng),其非線性非常高,并且由于是高自由度的混合系統(tǒng),每一次踏步都會受到地面沖擊力,因此很難獲得精確模型。

而要想做一個實時控制算法,就要使用相對完整的動力學(xué)模型。但是,即便具備好的模型,部署在非常高自由度的非線性系統(tǒng)上,也很難做到較快的實時計算。

因此,使用傳統(tǒng)方法時,很多學(xué)者都會做出權(quán)衡取舍,比如往往用簡化模型來做控制算法。

這樣做出的算法有兩個缺點:一是無法完整利用動力學(xué)模型,無法充分發(fā)揮機器人系統(tǒng)的靈敏性;二是基于模型的算法,一旦超過其穩(wěn)定區(qū)域,算法就會輕易崩潰。

而強化學(xué)習(xí)的優(yōu)點在于,通過相對完整的機器人動力系統(tǒng),Cassie 在仿真環(huán)境反復(fù)嘗試后,就能獲得大量和環(huán)境交互的數(shù)據(jù),從而學(xué)會用穩(wěn)定步態(tài)行走。

f32eaf2e-9be5-11eb-8b86-12bb97331649.png

圖 | 本次研究的核心:基于強化學(xué)習(xí)的步態(tài)控制器(來源:受訪者)

如上圖所示,這是本次研究提出的基于學(xué)習(xí)的步行控制器,控制器的輸入包括所期望的步態(tài)參數(shù)、期望的轉(zhuǎn)彎偏航速度、由期望的步態(tài)參數(shù)解碼的參考步態(tài)、一段時間內(nèi)的觀察到的機器人狀態(tài)以及控制器的輸出。

另據(jù)悉,控制器可輸出十個電機的期望位置,通過低通濾波器(LPF)后,可被發(fā)送到各個關(guān)節(jié)處的 PD 控制器產(chǎn)生期望的電機力矩。

兩大創(chuàng)新,讓 Cassie 可模仿各種步態(tài)

李鐘毓告訴 DeepTech,該研究主要有兩大創(chuàng)新點。

第一個創(chuàng)新點,在于采用了步態(tài)庫,里面有各種各樣不同的步行速度和步行高度的步態(tài),比如有 1 米每秒的前進速度、0.3 米每秒的側(cè)向行走速度、和 0.7 米的步行高度下的步態(tài)。這樣就能在步態(tài)庫中各取所需,從而讓機器人模仿不同的參考步態(tài),同時還能追蹤參考步態(tài)的速度和步行高度。

通過步態(tài)庫,在訓(xùn)練中使用神經(jīng)網(wǎng)絡(luò)所代表的控制器,就能控制不同的步行速度和步行高度,比如往前或者往后。此外,不同步態(tài)之間還可實現(xiàn)來回切換。

此外,步態(tài)庫還能提供更多參考動作,Cassie 在仿真學(xué)習(xí)時,就能見到各種步態(tài),同時還能學(xué)會在各種動作下保持平衡。

如下圖所示,Cassie 滑了一跤,幾乎差點摔倒,但在用安全繩把自己拉起來后,它能迅速恢復(fù)穩(wěn)定步態(tài),這個能力是前所未有的,而且李鐘毓也并未就該能力,專門訓(xùn)練過它。

也就是說,這是 Cassie 通過在訓(xùn)練中模仿各種步態(tài),并讓自己從不同步態(tài)的過渡中“自摸學(xué)會”的能力,這在大部分基于模型控制算法的機器人身上很難實現(xiàn)。

試想一下,如果機器人自己倒在地上,沒有人扶它,無論對它自己還是對周圍人都非常危險。

第二個創(chuàng)新點在于,結(jié)合了機器人的歷史輸入和輸出,從而實現(xiàn)對 Cassie 和其所在環(huán)境的在線系統(tǒng)辨識。

這樣,控制器就能讓 Cassie 適應(yīng)不同的環(huán)境, 比如不同地面的摩擦力。

測試中,Cassie 的兩個電機壞了,但它仍能快速適應(yīng)系統(tǒng)變化。再比如,把不同重物放在 Cassie 身上,即便拉著后面的安全架,它也能迅速適應(yīng)這種變化。

據(jù)悉,該研究由李鐘毓所在的、由 Prof. Koushil Sreenath 帶領(lǐng)的課題組,和伯克利大學(xué) Prof. Sergey Levine、以及 Prof. Pieter Abbeel 兩個課題組合作。

李鐘毓所在的小組,專注于機器人和控制算法領(lǐng)域,其他兩個小組則是強化學(xué)習(xí)方面的專家。此外,該工作的成功也離不開團隊成員程旭欣、Xue Bin Peng、Glen Berseth 的共同努力。

可應(yīng)用于災(zāi)后搜救和快遞 “最后一公里”

相比其他機器人,Cassie 有更大的運動空間,因為人類社會的環(huán)境,主要圍繞人類需求而建造。而二足控制算法,能讓 Cassie 在人類環(huán)境中更好地運動比如爬樓梯,這也是輪式機器人無法實現(xiàn)的。

具體應(yīng)用中,當(dāng)發(fā)生地震時,Cassie 能在塌房中做救援工作;或者在 “最后一公里” 的快遞中,在此之前先用快遞車運送到固定地方,但因為收件人一般在室內(nèi),這時 Cassie 就能替代快遞小哥,把快遞當(dāng)面送給用戶。

此外,Cassie 這類二足機器人,形態(tài)上和人類相似,人類也更傾向于和它們做更好的交互,比如可以給其設(shè)計富有感情的動作,冷冰冰的機器也能變得更有溫度。

李鐘毓之前的論文 《動畫Cassie:一個可讀的動力學(xué)機器人角色》(Animated Cassie:A Dynamic Relatable Robotic Character), 首次用動畫軟件給 Cassie 設(shè)計了富有表情的動作,并使用基于模型的軌跡優(yōu)化的算法,設(shè)計出來的動作能讓 Cassie 在現(xiàn)實世界中復(fù)現(xiàn)出來,上述論文也入選了 IROS 2020 最佳娛樂應(yīng)用論文。

據(jù)悉,這也是首次在二足機器人上做這種嘗試,Cassie 也因此能用肢體語言表達感情和人交互。

未來,李鐘毓會就 Cassie 的算法技術(shù)做以局部開源,相關(guān)研究方法已經(jīng)以論文形式發(fā)表,以推動足式機器人的進步。

看好中國機器人發(fā)展態(tài)勢,博士畢業(yè)后或?qū)⒒貒l(fā)展

談及研究中難忘的事情,李鐘毓表示,當(dāng)時仿真訓(xùn)練做了很久都“顆粒無收”,不過此前也沒有學(xué)者能一次就做成功。

仿真訓(xùn)練模型,非常難以部署到真實世界中。畢竟真實環(huán)境和仿真環(huán)境的差異非常大。為此,他折騰很久都沒有眉目,導(dǎo)師也勸他再做不出來就要換方向。

但他秉持 “不是有希望才堅持,而是堅持才有希望” 的想法,首次把訓(xùn)練得到的控制器部署在 Cassie 就取得了成功。

實驗成功后,他激動得給導(dǎo)師發(fā)了一條短信,導(dǎo)師知道后也非常振奮。這等于無需進行算法調(diào)參,開發(fā)好就能直接部署到機器人上。

李鐘毓生于 1996 年,來自江西南昌,本科就讀于浙江大學(xué)竺可楨學(xué)院,學(xué)習(xí)機械電子工程,大四時申請到去卡內(nèi)基梅隆大學(xué)(CMU)機器人研究所做科研實習(xí)。

在那里,他專門在機器人 Ballbot 的開發(fā),該機器人能在一個球上保持平衡,并能帶領(lǐng)盲人避開障礙物,這也為他后續(xù)工作夯實了基礎(chǔ)。

由于表現(xiàn)優(yōu)秀,本科畢業(yè)后,CMU 的導(dǎo)師把其推薦到伯克利大學(xué)機械系控制和機器人方向直博。

今年他在讀博二,雖然畢業(yè)去向還未明朗,但他認為回國是很好的選擇。因為他認為,中國現(xiàn)在有非常成熟的機器人平臺,兩足機器人也有著很好的發(fā)展空間。

原文標(biāo)題:24歲浙大畢業(yè)生研發(fā)兩足機器人,已學(xué)會蹲伏走路和載重走路,應(yīng)用于“最后一公里快遞”和災(zāi)后搜救 | 專訪

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    213

    文章

    31006

    瀏覽量

    221643
  • 強化學(xué)習(xí)
    +關(guān)注

    關(guān)注

    4

    文章

    270

    瀏覽量

    11950

原文標(biāo)題:24歲浙大畢業(yè)生研發(fā)兩足機器人,已學(xué)會蹲伏走路和載重走路,應(yīng)用于“最后一公里快遞”和災(zāi)后搜救 | 專訪

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    自動駕駛中常提的離線強化學(xué)習(xí)是什么?

    [首發(fā)于智駕最前沿微信公眾號]在之前談及自動駕駛模型學(xué)習(xí)時,詳細聊過強化學(xué)習(xí)的作用,由于強化學(xué)習(xí)能讓大模型通過交互學(xué)到策略,不需要固定的規(guī)則,從而給自動駕駛的落地創(chuàng)造了更多可能。 強化學(xué)習(xí)
    的頭像 發(fā)表于 02-07 09:21 ?103次閱讀
    自動駕駛中常提的離線<b class='flag-5'>強化學(xué)習(xí)</b>是什么?

    強化學(xué)習(xí)讓自動駕駛模型學(xué)習(xí)更快嗎?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛大模型訓(xùn)練時,有的技術(shù)方案采用模仿學(xué)習(xí),而有些采用強化學(xué)習(xí)。同樣作為大模型的訓(xùn)練方式,強化學(xué)習(xí)
    的頭像 發(fā)表于 01-31 09:34 ?570次閱讀
    <b class='flag-5'>強化學(xué)習(xí)</b><b class='flag-5'>會</b>讓自動駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    多智能體強化學(xué)習(xí)(MARL)核心概念與算法概覽

    (Multi-AgentReinforcementLearning,MARL),但是這樣很快變得混亂。什么是多智能體強化學(xué)習(xí)MARL是多個決策者(智能體)在同一環(huán)境中交互的強化學(xué)習(xí)。環(huán)境類型可
    的頭像 發(fā)表于 01-21 16:21 ?161次閱讀
    多智能體<b class='flag-5'>強化學(xué)習(xí)</b>(MARL)核心概念與算法概覽

    今日看點:智元推出真機強化學(xué)習(xí);美國軟件公司SAS退出中國市場

    智元推出真機強化學(xué)習(xí)機器人訓(xùn)練周期從“數(shù)周”減至“數(shù)十分鐘” ? 近日,智元機器人宣布其研發(fā)的真機強化學(xué)習(xí)技術(shù),已在與龍旗科技合作的驗證產(chǎn)線中成功落地。據(jù)介紹,此次落地的真機
    發(fā)表于 11-05 09:44 ?1056次閱讀

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    引擎,訪問并顯示米爾官方網(wǎng)頁,承擔(dān)人機信息查詢與交互角色。· MINI DP接口(27寸顯示器):實時顯示8路攝像頭捕捉的圖像預(yù)覽,充當(dāng)機器人的"視覺監(jiān)控中心"
    發(fā)表于 10-29 16:41

    自動駕駛中常提的“強化學(xué)習(xí)”是個啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學(xué)習(xí)(Reinforcement Learning,簡稱RL)”,強化學(xué)習(xí)是一類讓機器通過試錯來學(xué)會做決策的技術(shù)。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?599次閱讀
    自動駕駛中常提的“<b class='flag-5'>強化學(xué)習(xí)</b>”是個啥?

    機器人競技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”

    機器人獲得更接近人類的觸覺反饋。 賽事首席技術(shù)官王博士表示:“當(dāng)機器人開始‘感知’而非‘計算’環(huán)境時,真正的智能化競技時代才算到來。” 未來,磁傳感器技術(shù)的持續(xù)進化,必將不斷改寫人形機器人運動的競爭規(guī)則與技術(shù)標(biāo)準(zhǔn),推動
    發(fā)表于 08-26 10:02

    工業(yè)機器人的特點

    的基礎(chǔ),也是三者的實現(xiàn)終端,智能制造裝備產(chǎn)業(yè)包括高檔數(shù)控機床、工業(yè)機器人、自動化成套生產(chǎn)線、精密儀器儀表、智能傳感器、汽車自動化焊接線、柔性自動化生產(chǎn)線、智能農(nóng)機、3D 打印機等領(lǐng)域。而智能制造裝備中工業(yè)
    發(fā)表于 07-26 11:22

    NVIDIA Isaac Lab可用環(huán)境與強化學(xué)習(xí)腳本使用指南

    Lab 是一個適用于機器人學(xué)習(xí)的開源模塊化框架,其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,Isaac Lab 同時支持模仿學(xué)習(xí)(模仿人類)和強化學(xué)習(xí)(在嘗試和錯誤中進行學(xué)習(xí)),為所有
    的頭像 發(fā)表于 07-14 15:29 ?2284次閱讀
    NVIDIA Isaac Lab可用環(huán)境與<b class='flag-5'>強化學(xué)習(xí)</b>腳本使用指南

    當(dāng)機器人遇上“語言障礙”:CCLINKIE轉(zhuǎn)Profinet的“破冰外掛”來啦\\!

    在汽車焊裝車間的技術(shù)角,工程師小陳的筆記本記滿了“跨協(xié)議難題”:當(dāng)搭載Profinet的庫卡機器人遇上CCLINKIE總線的三菱PLC,數(shù)據(jù)交互像隔著玻璃喊話——PLC發(fā)送的坐標(biāo)指令要“繞地球半圈
    發(fā)表于 06-04 14:31

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機器人開發(fā)套件 Kria KR260機器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02

    詳細介紹機場智能指路機器人的工作原理

    控制 :為了確保機器人在行走過程中的平衡和穩(wěn)定性,運動系統(tǒng)還配備了多種傳感器,如加速度計、陀螺儀等。這些傳感器實時監(jiān)測機器人的運動狀態(tài)和姿態(tài)變化,當(dāng)機器人遇到顛簸、傾斜或外力干擾時,控制系統(tǒng)
    發(fā)表于 05-10 18:26

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會:ROS2機器人視覺與地圖構(gòu)建技術(shù) 通過對本書第7章(ROS2視覺應(yīng)用)和第8章(ROS2地圖構(gòu)建)的學(xué)習(xí),我對機器人視覺感知和自主導(dǎo)航的核心技術(shù)有了更深入的理解。以下是我的心得體會
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書

    ROS的全稱:Robot Operating System 機器人操作系統(tǒng) ROS的 目的 :ROS支持通用庫,是通信總線,協(xié)調(diào)多個傳感器 為了解決機器人里各廠商模塊不通用的問題,讓機器人快速開發(fā)
    發(fā)表于 04-30 01:05

    名單公布!【書籍評測活動NO.58】ROS 2智能機器人開發(fā)實踐

    手機為平臺的移動互聯(lián)網(wǎng)時代,下一個以機器人為核心的智能機器人時代,是否也遵循這樣的邏輯? 隨著ROS 2的誕生,智能機器人開發(fā)迎來新篇章 ,它不僅為開發(fā)者提供了更為強大、靈活的工具,
    發(fā)表于 03-03 14:18