超碰777,国产精品亚洲一区二区无码麻店,玖玖性爱

當(dāng)機(jī)器人遇見強(qiáng)化學(xué)習(xí)，會(huì)碰出怎樣的火花？

一名叫 Cassie 的機(jī)器人，給出了生動(dòng)演繹。

最近，24 歲的中國南昌小伙李鐘毓和其所在團(tuán)隊(duì)，用強(qiáng)化學(xué)習(xí)教 Cassie 走路，目前它已學(xué)會(huì)蹲伏走路和載重走路等。

相關(guān)論文以《雙足機(jī)器人魯棒參數(shù)化運(yùn)動(dòng)控制的強(qiáng)化學(xué)習(xí)》（Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots）為題，已被機(jī)器人國際學(xué)術(shù)頂會(huì) ICRA 收錄。

通過強(qiáng)化學(xué)習(xí)，它能自己走路，并能進(jìn)行自我恢復(fù)。在現(xiàn)實(shí)世界中，通過反復(fù)試驗(yàn)來訓(xùn)練大型機(jī)器人會(huì)很危險(xiǎn)，為解決這些問題，李鐘毓所在小組使用了兩個(gè)不同的仿真環(huán)境。

研究中，一個(gè)虛擬版本的 Cassie，通過與環(huán)境交互產(chǎn)生的大量數(shù)據(jù)，來學(xué)習(xí)穩(wěn)定的步態(tài)。

習(xí)得的步態(tài)控制器，被轉(zhuǎn)移到名為 SimMechanics 的第二個(gè)仿真環(huán)境中進(jìn)行驗(yàn)證，該環(huán)境有更高的準(zhǔn)確性，可用以模擬現(xiàn)實(shí)世界的物理過程，但是會(huì)減慢仿真運(yùn)行速度。

而通過使用在仿真環(huán)境中學(xué)習(xí)的步態(tài)控制器，Cassie 能非常平穩(wěn)地行走，且無需進(jìn)行任何額外微調(diào)。它不僅能像人類一樣前后左右地走，還能蹲著走，也能承受意料之外的負(fù)載，更能從強(qiáng)行推動(dòng)造成的失穩(wěn)狀態(tài)中恢復(fù)過來。

比如，在測試期間，Cassie 損壞了它右腿的兩個(gè)電機(jī)，但它仍能調(diào)整其步行策略、并進(jìn)行適應(yīng)。

機(jī)器人如何更魯棒？答案是強(qiáng)化學(xué)習(xí)

Cassie 是李鐘毓所在的 Hybrid Robotics Group 實(shí)驗(yàn)室、從美國 Agility Robotics 公司買來的，它大概有一米多高，內(nèi)部擁有十個(gè)電機(jī)，以及二十個(gè)自由度。

據(jù)他介紹，Cassie 于 2017 年首次開始出售，他從 2019 年開始接觸，目前已經(jīng)研究兩年有余。

買來后，其主要用于測試和驗(yàn)證不同算法，如控制算法和導(dǎo)航控制算法等。在李鐘毓這里，Cassie 更像是一個(gè)研究平臺(tái)。

事實(shí)上，足式機(jī)器人的核心正是控制算法。研究中，李鐘毓主要使用 Python 進(jìn)行編程，主體代碼由其所在小組搭建，剩余一部分基于其他學(xué)者的開源代碼。

由于是二足機(jī)器人，算法控制上會(huì)更難。而該研究的創(chuàng)新點(diǎn)在于，用強(qiáng)化學(xué)習(xí)的方法，得到控制二足機(jī)器人步態(tài)的算法，相比傳統(tǒng)基于模型的算法，性能可得到顯著提升。

由此帶來的魯棒性也比較強(qiáng)，怎么推它都不會(huì)倒，即便在幾乎快要摔倒的情況下，也能快速恢復(fù)穩(wěn)定狀態(tài)，這也是業(yè)內(nèi)首次展示出二足機(jī)器人如此穩(wěn)定的性能。

在強(qiáng)化學(xué)習(xí)之前，傳統(tǒng)基于模型的方法，需要很多時(shí)間和技巧給機(jī)器人做建模，尤其對于二足機(jī)器人而言，一旦其自身性質(zhì)和周圍環(huán)境發(fā)生改變，比如電機(jī)壞了、地面摩擦力有變化，模型很有可能就會(huì)失效。

其次，對于雙足式的機(jī)器人系統(tǒng)，其非線性非常高，并且由于是高自由度的混合系統(tǒng)，每一次踏步都會(huì)受到地面沖擊力，因此很難獲得精確模型。

而要想做一個(gè)實(shí)時(shí)控制算法，就要使用相對完整的動(dòng)力學(xué)模型。但是，即便具備好的模型，部署在非常高自由度的非線性系統(tǒng)上，也很難做到較快的實(shí)時(shí)計(jì)算。

因此，使用傳統(tǒng)方法時(shí)，很多學(xué)者都會(huì)做出權(quán)衡取舍，比如往往用簡化模型來做控制算法。

這樣做出的算法有兩個(gè)缺點(diǎn)：一是無法完整利用動(dòng)力學(xué)模型，無法充分發(fā)揮機(jī)器人系統(tǒng)的靈敏性；二是基于模型的算法，一旦超過其穩(wěn)定區(qū)域，算法就會(huì)輕易崩潰。

而強(qiáng)化學(xué)習(xí)的優(yōu)點(diǎn)在于，通過相對完整的機(jī)器人動(dòng)力系統(tǒng)，Cassie 在仿真環(huán)境反復(fù)嘗試后，就能獲得大量和環(huán)境交互的數(shù)據(jù)，從而學(xué)會(huì)用穩(wěn)定步態(tài)行走。

圖 | 本次研究的核心：基于強(qiáng)化學(xué)習(xí)的步態(tài)控制器（來源：受訪者）

如上圖所示，這是本次研究提出的基于學(xué)習(xí)的步行控制器，控制器的輸入包括所期望的步態(tài)參數(shù)、期望的轉(zhuǎn)彎偏航速度、由期望的步態(tài)參數(shù)解碼的參考步態(tài)、一段時(shí)間內(nèi)的觀察到的機(jī)器人狀態(tài)以及控制器的輸出。

另據(jù)悉，控制器可輸出十個(gè)電機(jī)的期望位置，通過低通濾波器（LPF）后，可被發(fā)送到各個(gè)關(guān)節(jié)處的 PD 控制器產(chǎn)生期望的電機(jī)力矩。

兩大創(chuàng)新，讓 Cassie 可模仿各種步態(tài)

李鐘毓告訴 DeepTech，該研究主要有兩大創(chuàng)新點(diǎn)。

第一個(gè)創(chuàng)新點(diǎn)，在于采用了步態(tài)庫，里面有各種各樣不同的步行速度和步行高度的步態(tài)，比如有 1 米每秒的前進(jìn)速度、0.3 米每秒的側(cè)向行走速度、和 0.7 米的步行高度下的步態(tài)。這樣就能在步態(tài)庫中各取所需，從而讓機(jī)器人模仿不同的參考步態(tài)，同時(shí)還能追蹤參考步態(tài)的速度和步行高度。

通過步態(tài)庫，在訓(xùn)練中使用神經(jīng)網(wǎng)絡(luò)所代表的控制器，就能控制不同的步行速度和步行高度，比如往前或者往后。此外，不同步態(tài)之間還可實(shí)現(xiàn)來回切換。

此外，步態(tài)庫還能提供更多參考動(dòng)作，Cassie 在仿真學(xué)習(xí)時(shí)，就能見到各種步態(tài)，同時(shí)還能學(xué)會(huì)在各種動(dòng)作下保持平衡。

如下圖所示，Cassie 滑了一跤，幾乎差點(diǎn)摔倒，但在用安全繩把自己拉起來后，它能迅速恢復(fù)穩(wěn)定步態(tài)，這個(gè)能力是前所未有的，而且李鐘毓也并未就該能力，專門訓(xùn)練過它。

也就是說，這是 Cassie 通過在訓(xùn)練中模仿各種步態(tài)，并讓自己從不同步態(tài)的過渡中“自摸學(xué)會(huì)”的能力，這在大部分基于模型控制算法的機(jī)器人身上很難實(shí)現(xiàn)。

試想一下，如果機(jī)器人自己倒在地上，沒有人扶它，無論對它自己還是對周圍人都非常危險(xiǎn)。

第二個(gè)創(chuàng)新點(diǎn)在于，結(jié)合了機(jī)器人的歷史輸入和輸出，從而實(shí)現(xiàn)對 Cassie 和其所在環(huán)境的在線系統(tǒng)辨識(shí)。

這樣，控制器就能讓 Cassie 適應(yīng)不同的環(huán)境，比如不同地面的摩擦力。

測試中，Cassie 的兩個(gè)電機(jī)壞了，但它仍能快速適應(yīng)系統(tǒng)變化。再比如，把不同重物放在 Cassie 身上，即便拉著后面的安全架，它也能迅速適應(yīng)這種變化。

據(jù)悉，該研究由李鐘毓所在的、由 Prof. Koushil Sreenath 帶領(lǐng)的課題組，和伯克利大學(xué) Prof. Sergey Levine、以及 Prof. Pieter Abbeel 兩個(gè)課題組合作。

李鐘毓所在的小組，專注于機(jī)器人和控制算法領(lǐng)域，其他兩個(gè)小組則是強(qiáng)化學(xué)習(xí)方面的專家。此外，該工作的成功也離不開團(tuán)隊(duì)成員程旭欣、Xue Bin Peng、Glen Berseth 的共同努力。

可應(yīng)用于災(zāi)后搜救和快遞 “最后一公里”

相比其他機(jī)器人，Cassie 有更大的運(yùn)動(dòng)空間，因?yàn)槿祟惿鐣?huì)的環(huán)境，主要圍繞人類需求而建造。而二足控制算法，能讓 Cassie 在人類環(huán)境中更好地運(yùn)動(dòng)比如爬樓梯，這也是輪式機(jī)器人無法實(shí)現(xiàn)的。

具體應(yīng)用中，當(dāng)發(fā)生地震時(shí)，Cassie 能在塌房中做救援工作；或者在 “最后一公里” 的快遞中，在此之前先用快遞車運(yùn)送到固定地方，但因?yàn)槭占艘话阍谑覂?nèi)，這時(shí) Cassie 就能替代快遞小哥，把快遞當(dāng)面送給用戶。

此外，Cassie 這類二足機(jī)器人，形態(tài)上和人類相似，人類也更傾向于和它們做更好的交互，比如可以給其設(shè)計(jì)富有感情的動(dòng)作，冷冰冰的機(jī)器也能變得更有溫度。

李鐘毓之前的論文《動(dòng)畫Cassie：一個(gè)可讀的動(dòng)力學(xué)機(jī)器人角色》（Animated Cassie：A Dynamic Relatable Robotic Character），首次用動(dòng)畫軟件給 Cassie 設(shè)計(jì)了富有表情的動(dòng)作，并使用基于模型的軌跡優(yōu)化的算法，設(shè)計(jì)出來的動(dòng)作能讓 Cassie 在現(xiàn)實(shí)世界中復(fù)現(xiàn)出來，上述論文也入選了 IROS 2020 最佳娛樂應(yīng)用論文。

據(jù)悉，這也是首次在二足機(jī)器人上做這種嘗試，Cassie 也因此能用肢體語言表達(dá)感情和人交互。

未來，李鐘毓會(huì)就 Cassie 的算法技術(shù)做以局部開源，相關(guān)研究方法已經(jīng)以論文形式發(fā)表，以推動(dòng)足式機(jī)器人的進(jìn)步。

看好中國機(jī)器人發(fā)展態(tài)勢，博士畢業(yè)后或?qū)⒒貒l(fā)展

談及研究中難忘的事情，李鐘毓表示，當(dāng)時(shí)仿真訓(xùn)練做了很久都“顆粒無收”，不過此前也沒有學(xué)者能一次就做成功。

仿真訓(xùn)練模型，非常難以部署到真實(shí)世界中。畢竟真實(shí)環(huán)境和仿真環(huán)境的差異非常大。為此，他折騰很久都沒有眉目，導(dǎo)師也勸他再做不出來就要換方向。

但他秉持 “不是有希望才堅(jiān)持，而是堅(jiān)持才有希望” 的想法，首次把訓(xùn)練得到的控制器部署在 Cassie 就取得了成功。

實(shí)驗(yàn)成功后，他激動(dòng)得給導(dǎo)師發(fā)了一條短信，導(dǎo)師知道后也非常振奮。這等于無需進(jìn)行算法調(diào)參，開發(fā)好就能直接部署到機(jī)器人上。

李鐘毓生于 1996 年，來自江西南昌，本科就讀于浙江大學(xué)竺可楨學(xué)院，學(xué)習(xí)機(jī)械電子工程，大四時(shí)申請到去卡內(nèi)基梅隆大學(xué)（CMU）機(jī)器人研究所做科研實(shí)習(xí)。

在那里，他專門在機(jī)器人 Ballbot 的開發(fā)，該機(jī)器人能在一個(gè)球上保持平衡，并能帶領(lǐng)盲人避開障礙物，這也為他后續(xù)工作夯實(shí)了基礎(chǔ)。

由于表現(xiàn)優(yōu)秀，本科畢業(yè)后，CMU 的導(dǎo)師把其推薦到伯克利大學(xué)機(jī)械系控制和機(jī)器人方向直博。

今年他在讀博二，雖然畢業(yè)去向還未明朗，但他認(rèn)為回國是很好的選擇。因?yàn)樗J(rèn)為，中國現(xiàn)在有非常成熟的機(jī)器人平臺(tái)，兩足機(jī)器人也有著很好的發(fā)展空間。

原文標(biāo)題：24歲浙大畢業(yè)生研發(fā)兩足機(jī)器人，已學(xué)會(huì)蹲伏走路和載重走路，應(yīng)用于“最后一公里快遞”和災(zāi)后搜救 | 專訪

文章出處：【微信公眾號(hào)：DeepTech深科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
213

文章
31303

瀏覽量
223318
強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)

+關(guān)注

關(guān)注
4

文章
273

瀏覽量
11994

文章出處：【微信號(hào)：deeptechchina，微信公眾號(hào)：deeptechchina】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

搜索歷史

當(dāng)機(jī)器人遇見強(qiáng)化學(xué)習(xí)，會(huì)碰出怎樣的火花？

評論