去年年底,波士頓動力發(fā)布的機器人組團載歌載舞賀新年的視頻賺足了全球觀眾的眼球。這幾天,江西圖書館兩個斗嘴機器人也迅速圈了一批粉。今天,我們來瞧瞧“絕影”機器狗get到的新功夫:無論推倒我還是踢翻我,我都能自己學著站起來。
人類在面對從未遇到的新情況時,可以本能地切換不同的技能來進行嘗試和應對,但對機器人來說卻是一項不小的挑戰(zhàn)。波士頓動力的機器人雖然舞技超人,但還都是基于預先設(shè)定好的程序,一旦超出預定程序以外很難做到隨機應變。
據(jù)《科學·機器人》雜志報道,浙江大學和愛丁堡大學的聯(lián)合研究團隊開發(fā)出了一套新的人工智能(AI)加強式學習方案。它能利用所謂的多專家學習架構(gòu)(MELA),讓浙大的“絕影”機器狗掌握自行應對陌生情況的技能。
研究人員從培訓可以指導虛擬機器狗的軟件開始。他們開發(fā)了具有8種算法“專家”的學習體系,可以幫助機器狗產(chǎn)生復雜的行為。對于每種方式,都使用深度神經(jīng)網(wǎng)絡來訓練機器狗的計算機模型以實現(xiàn)一個特定技能,這八項技能包括:站立平衡、大步小跑、左轉(zhuǎn)、姿勢控制、摔倒后翻正、小步小跑、側(cè)滾和右轉(zhuǎn)。
如果虛擬機器人的嘗試更接近目標,它將獲得一次數(shù)字獎勵;如果它做得不太理想,就給它記上一次數(shù)字過失。這個過程被稱為強化學習。經(jīng)過許多次這樣的嘗試后,模擬機器人就成為了某項技能的專家。 一旦對8位算法“專家”進行了培訓,“他們”就需要學習團隊合作。研究人員將它們組合成一個總體網(wǎng)絡,以充當教練或隊長的角色。
這使機器人的人造大腦可以利用每位“專家”的知識——如何奔跑,轉(zhuǎn)身或正確站立。研究人員解釋說,教練或隊長會告訴誰做什么,或者誰和誰應該一起工作。所有“專家”都可以在一個團隊中一起協(xié)作,從而大大提高了技能的能力。例如,當機器人跌倒并需要恢復時,系統(tǒng)可以檢測到該運動并喚醒負責平衡的“專家”。
如動圖所示,8位“專家”相對應的數(shù)據(jù)條會顯示在屏幕左上角。當虛擬機器人在模擬環(huán)境中移動,追逐浮動的綠球時,網(wǎng)絡會根據(jù)特定時刻所需的技能來調(diào)高或調(diào)低每個“專家”的專業(yè)技能的影響力。
然后,研究人員可以將數(shù)字機器人在模擬中學到的東西移植到現(xiàn)實世界中的機器人大腦中。在上面的動圖中,機器狗大腦中的“教練”正在與AI專家進行協(xié)調(diào),以幫助機器狗在滑過石子路時保持其立足點。當專業(yè)人員用棍子推倒“絕影”時,機器狗在原地重新站立了起來。對任何環(huán)境下的四足機器人來說,這都是非凡的能力,更不用說是需要行走在石子路上的機器人了。
當然,研究人員并不滿足于讓機器狗輕松過關(guān),他們甚至還抓住機器狗頭部的手柄,將它摔個臉著地。但每次這只機器狗都會重新站起來。這并不是因為研究人員編寫了針對這種特殊攻擊類型的反應代碼,而是因為“絕影”現(xiàn)在已學會了就其行為策略咨詢它的AI專家。當研究人員讓機器人在光滑的表面或草地上而不是石子路上行走時,它也適應了這種情況。
這項研究的總體思路是使機器人學習步態(tài)的方式與人類幼兒類似。對機器人運動進行編碼的傳統(tǒng)方法是在機器上加載有關(guān)現(xiàn)實世界工作原理的假設(shè)。例如,腳如何以不同的方式在硬木地板和地毯上踩穩(wěn),并逐點給出指令。但是想象一下,你告訴一個小孩:要爬上樓梯,就必須這樣移動胳膊和腿,他們根本不會聽你的。他們會通過各種試錯來學會如何行動。他們必須通過體驗,來學會在不同場景下如何調(diào)整其運動方式。
同樣,一臺機器人不能僅通過遵循腳本來適應環(huán)境,因為現(xiàn)實世界中的環(huán)境極其復雜。研究人員表示,“所有預設(shè)在您進入野外時都會被徹底打破,因為您沒有關(guān)于此環(huán)境的完整信息。” 因此,解決方案是讓“絕影”機器狗像人類一樣學習,使其能夠?qū)崟r組合其靈巧和自適應的技能,來處理它從未見過的各種不同任務。
責任編輯:xj
原文標題:“絕影”機器狗學會新功夫:人類再也弄不翻我了
文章出處:【微信公眾號:天津機器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
機器人
+關(guān)注
關(guān)注
213文章
31079瀏覽量
222255 -
四足機器人
+關(guān)注
關(guān)注
1文章
99瀏覽量
15691 -
波士頓
+關(guān)注
關(guān)注
1文章
62瀏覽量
16611
原文標題:“絕影”機器狗學會新功夫:人類再也弄不翻我了
文章出處:【微信號:tjrobot,微信公眾號:天津機器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
從“秧歌”到“功夫”,解鎖春晚機器人背后的核“芯”密碼
四足機器狗面臨的熱管理與散熱挑戰(zhàn):持續(xù)運行的隱形障礙
SGS為商湯絕影頒發(fā)ISO 21448預期功能安全產(chǎn)品認證證書
商湯絕影亮相汽車之家全球AI科技大會
商湯絕影亮相2025長安汽車科技生態(tài)大會
產(chǎn)品案例 | 遛“狗”新方式,盒子來幫忙
商湯絕影攜手NVIDIA亮相第三屆鏈博會
機器人看點:越疆機器人正式發(fā)布六足仿生機器狗 智元公布機器人運動控制模型專利
完全按照rt-thread 里的串口DMA接收寫的,還是接收內(nèi)存無論怎么擴大還是報錯?
工信部辛國斌到訪上海車展商湯絕影展臺
商湯絕影亮相2025上海車展
樹莓派遇上機器狗:科技界的“春晚明星”是怎樣煉成的?
商湯絕影王曉剛亮相NVIDIA GTC 2025并發(fā)表主題演講
揭秘Amass連接器:機器人企業(yè)爭相選擇的背后真相!
“絕影”機器狗get新功夫:無論推倒還是踢翻,都能自己學著站起來
評論