国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于分層強化學(xué)習(xí)的多Agent路徑規(guī)劃

大小:0.88 MB 人氣: 2017-12-27 需要積分:2

  針對路徑規(guī)劃算法收斂速度慢及效率低的問題,提出了一種基于分層強化學(xué)習(xí)及人工勢場的多Agent路徑規(guī)劃算法。首先,將多Agent的運行環(huán)境虛擬為一個人工勢能場,根據(jù)先驗知識確定每點的勢能值,它代表最優(yōu)策略可獲得的最大回報;其次,利用分層強化學(xué)習(xí)方法的無環(huán)境模型學(xué)習(xí)以及局部更新能力將策略更新過程限制在規(guī)模較小的局部空間或維度較低的高層空間上,提高學(xué)習(xí)算法的性能;最后,針對出租車問題在柵格環(huán)境中對所提算法進(jìn)行了仿真實驗。為了使算法貼近真實環(huán)境,增加算法的可移植性,在三維仿真環(huán)境中對該算法進(jìn)行驗證,實驗結(jié)果表明該算法收斂速度快,收斂過程穩(wěn)定。

基于分層強化學(xué)習(xí)的多Agent路徑規(guī)劃

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?