国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛中的決策規(guī)劃算法概述

ml8z_IV_Technol ? 來源:YXQ ? 2019-07-14 12:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文將分別介紹各層的主要作用與常見算法,并且比較各種算法的優(yōu)劣性及適用情景。

1. 引言

在一套完整的自動駕駛系統(tǒng)中,如果將感知模塊比作人的眼睛和耳朵,那么決策規(guī)劃就是自動駕駛的大腦。大腦在接收到傳感器的各種感知信息之后,對當(dāng)前環(huán)境作出分析,然后對底層控制模塊下達(dá)指令,這一過程就是決策規(guī)劃模塊的主要任務(wù)。同時(shí),決策規(guī)劃模塊可以處理多么復(fù)雜的場景,也是衡量和評價(jià)自動駕駛能力最核心的指標(biāo)之一[1]。

圖1. 自動駕駛系統(tǒng)中的決策規(guī)劃模塊分層結(jié)構(gòu),引用自[2]

如圖1所示,典型的決策規(guī)劃模塊可以分為三個(gè)層次。

其中,全局路徑規(guī)劃(Route Planning)在接收到一個(gè)給定的行駛目的地之后,結(jié)合地圖信息,生成一條全局的路徑,作為為后續(xù)具體路徑規(guī)劃的參考;

行為決策層(Behavioral Layer)在接收到全局路徑后,結(jié)合從感知模塊得到的環(huán)境信息(包括其他車輛與行人,障礙物,以及道路上的交通規(guī)則信息),作出具體的行為決策(例如選擇變道超車還是跟隨);

最后,運(yùn)動規(guī)劃(Motion Planning)層根據(jù)具體的行為決策,規(guī)劃生成一條滿足特定約束條件(例如車輛本身的動力學(xué)約束、避免碰撞、乘客舒適性等)的軌跡,該軌跡作為控制模塊的輸入決定車輛最終行駛路徑。

2. 全局路徑規(guī)劃(Route Planning)

全局路徑規(guī)劃是指在給定車輛當(dāng)前位置與終點(diǎn)目標(biāo)后,通過搜索選擇一條最優(yōu)的路徑,這里的“最優(yōu)”包括路徑最短,或者到達(dá)時(shí)間最快等條件。這一過程類似于我們生活中經(jīng)常用到的“導(dǎo)航”功能,區(qū)別在于自動駕駛中使用的高精地圖與我們常見的地圖不太一樣,在高精地圖中包含了每條車道在內(nèi)的更多信息。常見的全局路徑規(guī)劃算法包括Dijkstra和A算法,以及在這兩種算法基礎(chǔ)上的多種改進(jìn)。Dijkstra算法[3]和A*算法[4]也是在許多規(guī)劃問題中應(yīng)用最為廣泛的兩種搜索算法。

圖2. 全局路徑規(guī)劃示意

1. Dijkstra算法

Dijkstra算法是由計(jì)算機(jī)科學(xué)家Edsger W. Dijkstra在1956年提出,用來尋找圖形中節(jié)點(diǎn)之間的最短路徑。在Dijkstra算法中,需要計(jì)算每一個(gè)節(jié)點(diǎn)距離起點(diǎn)的總移動代價(jià)。同時(shí),還需要一個(gè)優(yōu)先隊(duì)列結(jié)構(gòu)。對于所有待遍歷的節(jié)點(diǎn),放入優(yōu)先隊(duì)列中會按照代價(jià)進(jìn)行排序。在算法運(yùn)行的過程中,每次都從優(yōu)先隊(duì)列中選出代價(jià)最小的作為下一個(gè)遍歷的節(jié)點(diǎn)。直到到達(dá)終點(diǎn)為止。

Dijkstra算法的優(yōu)點(diǎn)是:給出的路徑是最優(yōu)的;缺點(diǎn)是計(jì)算時(shí)間復(fù)雜度比較高(O(N2)),因?yàn)槭窍蛑車M(jìn)行探索,沒有明確的方向。

2. A*算法

為了解決Dijkstra算法的搜索效率問題,1968年,A算法由Stanford研究院的Peter Hart, Nils Nilsson以及Bertram Raphael發(fā)表,其主要改進(jìn)是借助一個(gè)啟發(fā)函數(shù)來引導(dǎo)搜索的過程。具體來說,A算法通過下面這個(gè)函數(shù)來計(jì)算每個(gè)節(jié)點(diǎn)的優(yōu)先級:

其中:

f(n) 是節(jié)點(diǎn)n的綜合優(yōu)先級。當(dāng)我們選擇下一個(gè)要遍歷的節(jié)點(diǎn)時(shí),我們總會選取綜合優(yōu)先級最高(值最小)的節(jié)點(diǎn)。

g(n)是節(jié)點(diǎn)n距離起點(diǎn)的代價(jià)。

h(n) 是節(jié)點(diǎn)n距離終點(diǎn)的預(yù)計(jì)代價(jià),這也就是A*算法的啟發(fā)函數(shù)。

3. 行為決策(Behavioral Layer)

在確定全局路徑之后,自動駕駛車輛需要根據(jù)具體的道路狀況、交通規(guī)則、其他車輛與行人等情況作出合適的行為決策。

這一過程面臨三個(gè)主要問題:

首先,真實(shí)的駕駛場景千變?nèi)f化,如何覆蓋?

其次,真實(shí)的駕駛場景是一個(gè)多智能體決策環(huán)境,包括主車在內(nèi)的每一個(gè)參與者所做出的行為,都會對環(huán)境中的其他參與者帶來影響,因此我們需要對環(huán)境中其他參與者的行為進(jìn)行預(yù)測;

最后,自動駕駛車輛對于環(huán)境信息不可能做到100%的感知,例如存在許多被障礙物遮擋的可能危險(xiǎn)情形。

綜合以上幾點(diǎn),在自動駕駛行為決策層,我們需要解決的是在多智能體決策的復(fù)雜環(huán)境中,存在感知不確定性情況的規(guī)劃問題。可以說這一難題是真正實(shí)現(xiàn)L4、L5級別自動駕駛技術(shù)的核心瓶頸之一,近年來隨著深度強(qiáng)化學(xué)習(xí)等領(lǐng)域的快速發(fā)展,為解決這一問題帶來了新的思路和曙光。

以下將行為決策層的模型分為四類分別介紹[5]:

1. 有限狀態(tài)機(jī)模型

自動駕駛車輛最開始的決策模型為有限狀態(tài)機(jī)模型[6],車輛根據(jù)當(dāng)前環(huán)境選擇合適的駕駛行為,如停車、換道、超車、避讓、緩慢行駛等模式,狀態(tài)機(jī)模型通過構(gòu)建有限的有向連通圖來描述不同的駕駛狀態(tài)以及狀態(tài)之間的轉(zhuǎn)移關(guān)系,從而根據(jù)駕駛狀態(tài)的遷移反應(yīng)式地生成駕駛動作。

有限狀態(tài)機(jī)模型因?yàn)楹唵巍⒁仔校?a target="_blank">無人駕駛領(lǐng)域目前最廣泛的行為決策模型,但該類模型忽略了環(huán)境的動態(tài)性和不確定性,此外,當(dāng)駕駛場景特征較多時(shí),狀態(tài)的劃分和管理比較繁瑣,多適用于簡單場景下,很難勝任具有豐富結(jié)構(gòu)化特征的城區(qū)道路環(huán)境下的行為決策任務(wù)。

2. 決策樹模型

決策/行為樹模型[7]和狀態(tài)機(jī)模型類似,也是通過當(dāng)前駕駛狀態(tài)的屬性值反應(yīng)式地選擇不同的駕駛動作,但不同的是該類模型將駕駛狀態(tài)和控制邏輯固化到了樹形結(jié)構(gòu)中,通過自頂向下的“輪詢”機(jī)制進(jìn)行駕駛策略搜索。這類決策模型具備可視化的控制邏輯,并且控制節(jié)點(diǎn)可復(fù)用,但需要針對每個(gè)駕駛場景離線定義決策網(wǎng)路,當(dāng)狀態(tài)空間、行為空間較大時(shí),控制邏輯將比較復(fù)雜。另外,該類模型同樣無法考慮交通環(huán)境中存在的不確定性因素。

3. 基于知識的推理決策模型

基于知識的推理決策模型由“場景特征-駕駛動作”的映射關(guān)系來模仿人類駕駛員的行為決策過程,該類模型將駕駛知識存儲在知識庫或者神經(jīng)網(wǎng)絡(luò)中,這里的駕駛知識主要表現(xiàn)為規(guī)則、案例或場景特征到駕駛動作的映射關(guān)系。進(jìn)而,通過“查詢”機(jī)制從知識庫或者訓(xùn)練過的網(wǎng)絡(luò)結(jié)構(gòu)中推理出駕駛動作。

該類模型主要包括:基于規(guī)則的推理系統(tǒng)[8]、基于案例的推理系統(tǒng)[9]和基于神經(jīng)網(wǎng)絡(luò)的映射模型[10]。

該類模型對先驗(yàn)駕駛知識、訓(xùn)練數(shù)據(jù)的依賴性較大,需要對駕駛知識進(jìn)行精心整理、管理和更新,雖然基于神經(jīng)網(wǎng)絡(luò)的映射模型可以省去數(shù)據(jù)標(biāo)注和知識整合的過程,但是仍然存在以下缺點(diǎn):

其“數(shù)據(jù)”驅(qū)動機(jī)制使得其對訓(xùn)練數(shù)據(jù)的依賴性較大,訓(xùn)練數(shù)據(jù)需要足夠充分[11];

將映射關(guān)系固化到網(wǎng)絡(luò)結(jié)構(gòu)中,其解釋性較差;

存在“黑箱”問題,透明性差,對于實(shí)際系統(tǒng)中出現(xiàn)的問題可追溯性較差,很難發(fā)現(xiàn)問題的根本原因。

4. 基于價(jià)值的決策模型

根據(jù)最大效用理論,基于效用/價(jià)值的決策模型的基本思想是依據(jù)選擇準(zhǔn)則在多個(gè)備選方案中選擇出最優(yōu)的駕駛策略/動作[12]。

為了評估每個(gè)駕駛動作的好壞程度,該類模型定義了效用(utility)或價(jià)值(value)函數(shù),根據(jù)某些準(zhǔn)則屬性定量地評估駕駛策略符合駕駛?cè)蝿?wù)目標(biāo)的程度,對于無人駕駛?cè)蝿?wù)而言,這些準(zhǔn)則屬性可以是安全性、舒適度、行車效率等,效用和價(jià)值可以是由其中單個(gè)屬性決定也可以是由多個(gè)屬性決定。

澳大利亞格里菲斯大學(xué)的Furda和Vlacic提出了多準(zhǔn)則決策方法從候選動作集中選擇最優(yōu)的駕駛動作[13];新加坡國立大學(xué)的Bandyopadhyay等人提出了基于POMDP的行為決策模型[14],用以解決存在感知不確定性的情況;卡內(nèi)基梅隆大學(xué)的Wei J等人提出基于PCB(Prediction and-Cost-function Based)的行為決策模型[15],其側(cè)重點(diǎn)在于如何構(gòu)建恰當(dāng)?shù)拇鷥r(jià)函數(shù)來指導(dǎo)對環(huán)境的預(yù)測;為了解決在多智能體參與的復(fù)雜環(huán)境中的決策問題,許多基于博弈論的模型也被研究者用來推理車輛之間的交互行為[16],[17];此外,因?yàn)樵谔卣魈崛》矫娴膬?yōu)勢,深度強(qiáng)化學(xué)習(xí)技術(shù)也開始被廣泛應(yīng)用,以完成最優(yōu)駕駛動作的生成[18]。

4. 運(yùn)動規(guī)劃(Motion Planning)

在確定具體的駕駛行為之后,我們需要做的是將“行為”轉(zhuǎn)化成一條更加具體的行駛“軌跡”,從而能夠最終生成對車輛的一系列具體控制信號,實(shí)現(xiàn)車輛按照規(guī)劃目標(biāo)的行駛。這一過程稱為運(yùn)動規(guī)劃(Motion Planning),運(yùn)動規(guī)劃的概念在機(jī)器人領(lǐng)域已經(jīng)有較長時(shí)間的研究歷史,我們可以從數(shù)學(xué)的角度將它看做如下的一個(gè)優(yōu)化問題:

路徑規(guī)劃(Path Planning)

圖3. 路徑規(guī)劃的定義

在以機(jī)器人為代表的許多場景中,我們可以認(rèn)為周圍的環(huán)境是確定的。在這種情況下,所謂的路徑規(guī)劃,是指在給定的一個(gè)狀態(tài)空間Χ,尋找一個(gè)滿足一定約束條件的映射σ:[0,1]?Χ,這些約束包括:

確定的起始狀態(tài)以及目標(biāo)點(diǎn)所在的區(qū)域

避免碰撞

對路徑的微分約束(例如在實(shí)際問題中路徑曲率不能太小,對應(yīng)于其二階導(dǎo)數(shù)的約束)

該優(yōu)化問題的目標(biāo)泛函定義為J(σ),其具體意義可以表示為路徑長度、控制復(fù)雜度等衡量標(biāo)準(zhǔn)。

然而在自動駕駛問題中,車輛周圍的環(huán)境是持續(xù)動態(tài)變化的,因此單純的路徑規(guī)劃不能給出在行駛過程中一直有效的解,因此我們需要增加一個(gè)維度——時(shí)間T,相應(yīng)的規(guī)劃問題通常被稱為軌跡規(guī)劃。

軌跡規(guī)劃(Trajectory Planning)

圖4. 軌跡規(guī)劃的定義

時(shí)間維度的增加為規(guī)劃問題帶來了巨大的挑戰(zhàn)。例如,對于一個(gè)在2D環(huán)境中移動一個(gè)抽象為單點(diǎn)的機(jī)器人,環(huán)境中的障礙物近似為多邊形的問題。路徑規(guī)劃問題可以在多項(xiàng)式時(shí)間內(nèi)求解,而加入時(shí)間維度的軌跡規(guī)劃問題已經(jīng)被證明是NP-hard問題。

在自動駕駛的實(shí)際場景中,無論是對車輛本身還是對周圍環(huán)境,建立更為精確的模型意味著對優(yōu)化問題更為復(fù)雜的約束,同時(shí)也意味著求解的更加困難。因此實(shí)際采用的算法都是建立在對實(shí)際場景的近似前提下,在模型精確性和求解效率二者之間尋求一個(gè)最佳的平衡點(diǎn)。

下文對自動駕駛領(lǐng)域目前常見的幾類運(yùn)動規(guī)劃算法分別進(jìn)行介紹,在實(shí)際中,往往是其中幾類思想的結(jié)合才能最終達(dá)到比較好的規(guī)劃結(jié)果,并滿足更多的不同場景。

1. 基于搜索的規(guī)劃算法

通過搜索來解決運(yùn)動規(guī)劃問題是最樸素的思路之一,其基本思想是將狀態(tài)空間通過確定的方式離散成一個(gè)圖,然后利用各種啟發(fā)式搜索算法搜索可行解甚至是最優(yōu)解。

在將狀態(tài)空間離散化的過程中,需要注意的是確保最終形成的柵格具有最大的覆蓋面積,同時(shí)不會重復(fù)。如圖5所示,左邊的柵格是由直行、左轉(zhuǎn)90°、右轉(zhuǎn)90°這三種行為生成;而如果選擇直行、左轉(zhuǎn)89°、右轉(zhuǎn)89°三種行為,最后就無法生成一個(gè)覆蓋全部區(qū)域的柵格結(jié)構(gòu)。

圖5. 構(gòu)建柵格圖,引用自[2]

在將狀態(tài)空間柵格化之后,我們就可以使用前文已經(jīng)介紹的Dijkstra、A*搜索算法,完成最終的規(guī)劃。然而在實(shí)際復(fù)雜環(huán)境中,柵格數(shù)目眾多,并且環(huán)境隨時(shí)間動態(tài)變化,會導(dǎo)致搜索結(jié)點(diǎn)過多,因此發(fā)展出了多種改進(jìn)算法,用以處理不同的具體場景:

1) Hybrid A* 算法,在A*算法的基礎(chǔ)上考慮了車的最大轉(zhuǎn)向問題,例如限定計(jì)算的路徑上車最大轉(zhuǎn)向不超過5°。該算法目前的應(yīng)用場景有車掉頭(Stanford 參加DARPA 挑戰(zhàn)賽使用的Junior車采用了該算法進(jìn)行uturn),泊車等等對方向盤控制要求較高的場景。

2)D*、D*Lite算法,事先由終點(diǎn)向起點(diǎn)進(jìn)行搜索,使用Dijkstra算法,存儲路網(wǎng)中目標(biāo)點(diǎn)到每個(gè)點(diǎn)的最短路徑長度k, 和該節(jié)點(diǎn)到目標(biāo)點(diǎn)的實(shí)際長度值h,開始情況下 k==h, 并且存儲每個(gè)節(jié)點(diǎn)的上一個(gè)節(jié)點(diǎn),保證能夠沿著鏈接走下去。

計(jì)算結(jié)束后,獲取了一條當(dāng)時(shí)最優(yōu)路徑。當(dāng)車行駛到某個(gè)節(jié)點(diǎn)時(shí),通過傳感器發(fā)現(xiàn)該節(jié)點(diǎn)已經(jīng)無法通行(有障礙物),則對已存儲的路網(wǎng)信息一些相關(guān)點(diǎn)的h值進(jìn)行修改(變大),選擇一個(gè)鄰居點(diǎn)滿足仍然h==k的,即仍然是最優(yōu)路徑上的點(diǎn),作為下一個(gè)點(diǎn)。

然后走到終點(diǎn)。該類算法適用于在未知環(huán)境中的導(dǎo)航以及路徑規(guī)劃,廣泛用于目前各種移動機(jī)器人和自主車輛載具,例如“機(jī)遇號”和“勇氣號”火星車。

2. 基于采樣的規(guī)劃算法

通過對連續(xù)的狀態(tài)空間進(jìn)行采樣,從而將原問題近似成一個(gè)離散序列的優(yōu)化問題,這一思路也是在計(jì)算機(jī)科學(xué)中應(yīng)用最為廣泛的算法。在運(yùn)動規(guī)劃問題中,基于采樣的基本算法包括概率路線圖(PRM)和快速搜索隨機(jī)樹(RRT)算法。

圖6. 利用RRT算法實(shí)現(xiàn)u形彎的軌跡規(guī)劃,引用自[19]

1)基本算法:概率路線圖(PRM)

預(yù)處理階段:對狀態(tài)空間內(nèi)的安全區(qū)域均勻隨機(jī)采樣n個(gè)點(diǎn),每個(gè)采樣點(diǎn)分別與一定距離內(nèi)的鄰近采樣點(diǎn)連接,并丟棄掉與障礙物發(fā)生碰撞的軌跡,最終得到一個(gè)連通圖。

査詢階段:對于給定的一對初始和目標(biāo)狀態(tài),分別將其連接到已經(jīng)構(gòu)建的圖中,再使用搜索算法尋找滿足要求的軌跡。

容易看出,一旦構(gòu)建一個(gè)PRM之后,可以用于解決不同初始、目標(biāo)狀態(tài)的運(yùn)動規(guī)劃問題,但是這個(gè)特性對于自動駕駛運(yùn)動規(guī)劃而言是不必要的。另外PRM要求對狀態(tài)之間作精確連接,這對于存在復(fù)雜微分約束的運(yùn)動規(guī)劃問題是十分困難的。

2)基本算法:快速搜索隨機(jī)樹(RRT)

樹的初始化:初始化樹的結(jié)點(diǎn)集和邊集,結(jié)點(diǎn)集只包含初始狀態(tài),邊集為空。

樹的生長:對狀態(tài)空間隨機(jī)采樣,當(dāng)采樣點(diǎn)落在狀態(tài)空間安全區(qū)域時(shí),選擇當(dāng)前樹中離采樣點(diǎn)最近的結(jié)點(diǎn),將其向采樣點(diǎn)擴(kuò)展(或連接)。若生成的軌跡不與障礙物發(fā)生碰撞,則將該軌跡加入樹的邊集,該軌跡的終點(diǎn)加人到樹的結(jié)點(diǎn)集。

RRT是一種增量式采樣的搜索方法,無須設(shè)置任何分辨率參數(shù)。在極限情況,該搜索樹將稠密的布滿整個(gè)空間,此時(shí)搜索樹由很多較短曲線或路經(jīng)構(gòu)成,以實(shí)現(xiàn)充滿整個(gè)空間的目的。

3)多種改進(jìn)算法

從以上基礎(chǔ)算法的描述我們可以了解到,對狀態(tài)空間進(jìn)行采樣,可以保證得到連接起始點(diǎn)與終點(diǎn)的可行解,但由于采樣過程是對整個(gè)空間進(jìn)行均勻采樣,因此效率很低;在復(fù)雜場景下無法實(shí)現(xiàn)實(shí)時(shí)求解;此外,最終規(guī)劃結(jié)果無法保證得到的可行解是最優(yōu)解。針對這些劣勢,多種改進(jìn)算法被提出并應(yīng)用于自動駕駛問題:

效率改進(jìn)--不均勻采樣

- RRT-Connect:同時(shí)構(gòu)建兩棵分別起始于初始狀態(tài)和目標(biāo)狀態(tài)的樹,當(dāng)兩棵樹生長到一起時(shí)則找到可行解。

- 啟發(fā)式(hRRT):使用啟發(fā)式函數(shù)增加擴(kuò)展代價(jià)低的結(jié)點(diǎn)被采樣的概率。

- 結(jié)合駕駛員模型:結(jié)合駕駛員視覺注意力模型進(jìn)行偏向性采樣,利用視覺特征信息引導(dǎo)運(yùn)動規(guī)劃,使規(guī)劃出的軌跡更符合人類駕駛行為。

- 構(gòu)造新度量RG-RRT(reachability guided RT):常規(guī)類歐式距離的度量并不能真實(shí)反映構(gòu)形或狀態(tài)之間的遠(yuǎn)近,RG-RRT計(jì)算樹中結(jié)點(diǎn)的能達(dá)集,當(dāng)采樣點(diǎn)到結(jié)點(diǎn)的距離大于采樣點(diǎn)到該結(jié)點(diǎn)能達(dá)集的距離時(shí), 該節(jié)點(diǎn)才有可能被選中進(jìn)行擴(kuò)展。

- 加入障礙物懲罰(RC-RRT、EG-RRT、ADD-RRT等):降低靠近障礙物的結(jié)點(diǎn)獲得擴(kuò)展的概率。

實(shí)時(shí)性改進(jìn)

- anytime RRT先快速構(gòu)建一個(gè)RRT,獲得一個(gè)可行解并記錄其代價(jià).之后算法會繼續(xù)采樣,但僅將有利于降低可行解代價(jià)的結(jié)點(diǎn)插入樹中,從而逐漸獲得較優(yōu)的可行解.。

- Replanning將整個(gè)規(guī)劃任務(wù)分解為若干等時(shí)間的子任務(wù)序列,在執(zhí)行當(dāng)前任務(wù)的同時(shí)規(guī)劃下一個(gè)任務(wù)。

最優(yōu)性改進(jìn)

- PRM*、RRG、RRT*:根據(jù)隨機(jī)幾何圖理論(在狀態(tài)空間中隨機(jī)采樣m個(gè)點(diǎn),并將距離小于r(n)的點(diǎn)連起來,就構(gòu)成了隨機(jī)幾何圖)對標(biāo)準(zhǔn)PRM 和RRT做出改進(jìn),得到了具有漸近最優(yōu)性質(zhì)的PRM*、RRG和RRT*算法

3. 直接優(yōu)化方法

在絕大多數(shù)情況下,不考慮高度的變化,自動駕駛的軌跡規(guī)劃問題是一個(gè)三維約束優(yōu)化問題(2D空間+時(shí)間T),因此,我們可以采用解耦的策略,將原始問題分解為幾個(gè)低維問題,從而大大降低求解難度。

1)Frenet坐標(biāo)系

圖7. Frenet坐標(biāo)系

由于真實(shí)世界中的道路都是彎曲的,為了簡化求解優(yōu)化問題的參數(shù)表達(dá),在自動駕駛中通常采用Frenet坐標(biāo)系。

在Frenet坐標(biāo)系中,我們使用道路的中心線作為參考線,使用參考線的切線向量t和法線向量n建立一個(gè)坐標(biāo)系,如右圖所示,它以車輛自身為原點(diǎn),坐標(biāo)軸相互垂直,分為s方向(即沿著參考線的方向,通常被稱為縱向,Longitudinal)和d方向(或L方向,即參考線當(dāng)前的法向,被稱為橫向,Lateral),相比于笛卡爾坐標(biāo)系(左圖),F(xiàn)renet坐標(biāo)系明顯地簡化了問題。

因?yàn)樵诠沸旭傊校覀兛偸悄軌蚝唵蔚恼业降缆返膮⒖季€(即道路的中心線),那么基于參考線的位置的表示就可以簡單的使用縱向距離S(即沿著道路方向的距離)和橫向距離L(即偏離參考線的距離)來描述。

3)路徑-速度解耦法:

在Frenet坐標(biāo)系中,路徑-速度解耦法分別優(yōu)化路徑和速度,路徑優(yōu)化主要考慮靜態(tài)障礙物,通過動態(tài)規(guī)劃生成一條靜態(tài)的參考路徑(SL維度),接著基于生成的路徑,考慮對速度的規(guī)劃(ST維度)。這一過程可以不斷迭代,從而實(shí)現(xiàn)對軌跡的實(shí)時(shí)更新。在百度的開源自動駕駛平臺Apollo中采用的EM planner就是基于類似的解決思路。這一方案具有較強(qiáng)的靈活性,可以普適性的適用于許多場景。

除此之外,也可以選擇不同的解耦方式,例如分別對縱向軌跡(ST維度)和橫向軌跡(LT維度)進(jìn)行規(guī)劃。但需要指出的是,通過解耦的方法得到的解可能不是最優(yōu)的,并且這種算法不具備完備性,在一些復(fù)雜環(huán)境可能找不到可行解。

4. 參數(shù)化曲線構(gòu)造法

圖8. 常見的參數(shù)化曲線構(gòu)造法,引用自[19]

參數(shù)化曲線構(gòu)造法的出發(fā)點(diǎn)是車輛本身的約束,包括運(yùn)動學(xué)與動力學(xué)的約束,因此一般規(guī)劃的路徑需要是曲率連續(xù)的。這類方法根據(jù)起始點(diǎn)和目標(biāo)點(diǎn),考慮障礙物,通過構(gòu)造一族符合車輛約束的曲線給出一條平滑路徑。

如圖8所示,常見的曲線有Dubins曲線(由直線和圓弧構(gòu)成,是一種簡單車輛模型Dubin模型在二維空間中的最短曲線族),回旋曲線,多項(xiàng)式曲線,貝塞爾曲線,樣條曲線等。單純應(yīng)用參數(shù)化曲線構(gòu)造法很難滿足實(shí)際復(fù)雜場景,因此現(xiàn)在越來越多的自動駕駛系統(tǒng)將其與其他方法結(jié)合,用來對已經(jīng)規(guī)劃生成的軌跡做平滑處理,以滿足車輛運(yùn)動學(xué)與動力學(xué)約束。

5. 人工勢場法

人工勢場法是受物理學(xué)中電磁場的啟發(fā),假設(shè)障礙物和目標(biāo)位置分別產(chǎn)生斥力和引力,從而可以沿著勢場的最速梯度下降去規(guī)劃路徑。這類方法的一個(gè)關(guān)鍵問題是如何選擇合適的勢場函數(shù),例如:Stephen Waydo使用流函數(shù)進(jìn)行平滑路徑的規(guī)劃[20],Robert Daily在高速車輛上提出諧波勢場路徑規(guī)劃方法[21]。在簡單場景下,人工勢場法具有較高的求解效率,但其存在的最大問題是可能陷入局部最小值,在這種情況下,所獲得的路徑不是最優(yōu),甚至可能找不到路徑。

5. 算法復(fù)雜度(Complexity)

在規(guī)劃問題中,對于一個(gè)算法的評價(jià)除了要考慮其時(shí)間和空間復(fù)雜度之外,還要考慮其是否具有完備性和最優(yōu)性,退一步的情況下考慮其是否具有概率完備性和漸進(jìn)最優(yōu)性。只要在了解這些性質(zhì)的基礎(chǔ)上,我們才能針對不同的實(shí)際場景設(shè)計(jì)和應(yīng)用不同的算法,從而達(dá)到模型復(fù)雜和效率最優(yōu)的最佳衡點(diǎn)。

1)完備性(Completeness):如果在起始點(diǎn)和目標(biāo)點(diǎn)間有路徑解存在,那么一定可以得到解,如果得不到解那么一定說明沒有解存在;

2)概率完備性(Probabilistically Completeness):如果在起始點(diǎn)和目標(biāo)點(diǎn)間有路徑解存在,只要規(guī)劃或搜索的時(shí)間足夠長,就一定能確保找到一條路徑解;

3)最優(yōu)性(Optimality):規(guī)劃得到的路徑在某個(gè)評價(jià)指標(biāo)上是最優(yōu)的(評價(jià)指標(biāo)一般為路徑的長度)

4)漸進(jìn)最優(yōu)性(Asymptotically optimality):經(jīng)過有限次規(guī)劃迭代后得到的路徑是接近最優(yōu)的次優(yōu)路徑,且每次迭代后都與最優(yōu)路徑更加接近,是一個(gè)逐漸收斂的過程

表1 常見算法比較

6. 未來發(fā)展趨勢

圖9. 自動駕駛發(fā)展時(shí)間線及過程中重要的運(yùn)動規(guī)劃算法,引用自[19]

人類對自動駕駛的興趣最早可以追溯到1925年,近年來對自動駕駛的研究熱潮始于美國國防先進(jìn)研究項(xiàng)目局(Defense Advanced Research Projects Agency, DARPA )在2004-2007年舉辦的3屆自動駕駛挑戰(zhàn)賽[22],如圖9所示。在此之后,上文提到的各類決策規(guī)劃方法的有效性都被實(shí)際驗(yàn)證。同時(shí),將運(yùn)動規(guī)劃方法與控制理論、狀態(tài)參數(shù)估計(jì)、機(jī)器學(xué)習(xí)等多領(lǐng)域方法相結(jié)合的解決方案也不斷出現(xiàn),成為未來的發(fā)展趨勢:

1)與車輛動力學(xué)結(jié)合:將動力學(xué)參數(shù)評價(jià)指標(biāo)和最優(yōu)規(guī)劃等結(jié)合,從最優(yōu)控制角度進(jìn)行規(guī)劃是近年采用較多的方法,在這個(gè)過程中可以充分考慮車輛動力學(xué)因素,規(guī)劃出的軌跡更加合理。例如采用模型預(yù)測控制理論(Model Predictive Control)。其不足在于:對車輛的約束越多,優(yōu)化其軌跡的難度越大,較難實(shí)現(xiàn)在線的實(shí)時(shí)計(jì)算。

2)與狀態(tài)參數(shù)估計(jì)結(jié)合:狀態(tài)參數(shù)估計(jì)可以更加準(zhǔn)確獲得車輛參數(shù),因此可以將狀態(tài)估計(jì)器加入規(guī)劃模塊中,通過在線估計(jì)車輛狀態(tài)并將其反饋給規(guī)劃器,提高軌跡質(zhì)量。例如:不同地面類型會引起車輛滑移特性的變化,進(jìn)而影響車輛狀態(tài),通過結(jié)合估計(jì)參數(shù)實(shí)時(shí)重新規(guī)劃軌跡,閉環(huán)規(guī)劃從而提高軌跡安全性。

3)與機(jī)器學(xué)習(xí)結(jié)合:隨著以神經(jīng)網(wǎng)絡(luò)為代表的人工智能的快速發(fā)展,許多傳統(tǒng)的規(guī)劃問題也帶來了新的解決思路。在自動駕駛領(lǐng)域,其發(fā)展趨勢包括:

自動駕駛車輛在復(fù)雜環(huán)境中作出最優(yōu)決策,這一問題與強(qiáng)化學(xué)習(xí)的定義非常吻合,因此如前文所述,隨著深度強(qiáng)化學(xué)習(xí)技術(shù)的快速發(fā)展,越來越多的研究團(tuán)隊(duì)開始將其應(yīng)用于自動駕駛決策規(guī)劃中,將行為決策與運(yùn)動規(guī)劃模塊相融合,直接學(xué)習(xí)得到行駛軌跡。為了解決環(huán)境獎(jiǎng)勵(lì)函數(shù)不易獲得的問題,人們還提出了首先利用逆強(qiáng)化學(xué)習(xí)(IRL)根據(jù)人類專家演示學(xué)習(xí),然后使用強(qiáng)化學(xué)習(xí)來學(xué)習(xí)最優(yōu)策略。

端到端模型:使用一個(gè)深度神經(jīng)網(wǎng)絡(luò),直接根據(jù)車輛狀態(tài)和外部環(huán)境信息得出車輛的控制信號。盡管目前的端到端模型存在類似“黑箱”的不可解釋性,但相信隨著人類對深度神經(jīng)網(wǎng)絡(luò)理解的不斷加深,這一方法因其突出的簡潔高效優(yōu)勢而具有很強(qiáng)的發(fā)展?jié)摿Α?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98092
  • 自動駕駛
    +關(guān)注

    關(guān)注

    794

    文章

    14890

    瀏覽量

    180015

原文標(biāo)題:自動駕駛中的決策規(guī)劃算法概述

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動駕駛汽車如何完成超車?

    經(jīng)過一套完整的感知、理解、決策規(guī)劃和控制的流程,每一步都要考慮安全和規(guī)范,需要不斷感知周圍環(huán)境,判斷什么時(shí)候超車、怎么超車、是否安全等,然后才可以按照計(jì)劃執(zhí)行操作。 自動駕駛汽車在變道前需要全面看懂如前車
    的頭像 發(fā)表于 02-16 17:37 ?1.7w次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何完成超車?

    自動駕駛汽車如何實(shí)現(xiàn)自動駕駛

    人類駕駛員而言是非常直觀且有效的指令,但對于自動駕駛汽車來說,則意味著需要一套極其復(fù)雜的感知、理解與決策鏈路。 自動駕駛如何看清文字? 自動駕駛
    的頭像 發(fā)表于 02-10 08:50 ?649次閱讀
    <b class='flag-5'>自動駕駛</b>汽車如何實(shí)現(xiàn)<b class='flag-5'>自動駕駛</b>

    規(guī)劃模塊在自動駕駛系統(tǒng)主要干了啥事?

    規(guī)劃模塊在自動駕駛系統(tǒng)主要用來執(zhí)行決定“行駛路徑”與“行駛方式”的任務(wù)。它接收來自定位、感知、地圖、預(yù)測等模塊的信息,進(jìn)行綜合處理后,制定出一條既符合法規(guī)、保障安全,又盡可能舒適高效的行駛路線。
    的頭像 發(fā)表于 12-13 12:07 ?2278次閱讀

    VLA能解決自動駕駛的哪些問題?

    、語言表達(dá)和動作控制這三者整合到一個(gè)統(tǒng)一的模型框架。 與傳統(tǒng)自動駕駛系統(tǒng)將感知、預(yù)測、規(guī)劃、控制拆解為多個(gè)獨(dú)立模塊的做法不同,VLA可以縮短“看見什么”和“如何行動”之間的鴻溝,構(gòu)建一個(gè)能直接將視覺輸入和語言描述映射到具體動作
    的頭像 發(fā)表于 11-25 08:53 ?498次閱讀
    VLA能解決<b class='flag-5'>自動駕駛</b><b class='flag-5'>中</b>的哪些問題?

    語言模型是否是自動駕駛的必選項(xiàng)?

    [首發(fā)于智駕最前沿微信公眾號]自動駕駛的發(fā)展并非一成不變,在傳統(tǒng)自動駕駛系統(tǒng),通常采用分層的體系架構(gòu)。最底層是感知層,負(fù)責(zé)將攝像頭、雷達(dá)、激光雷達(dá)等傳感器數(shù)據(jù)轉(zhuǎn)化為車輛能夠“看到”的環(huán)境信息;其上
    的頭像 發(fā)表于 11-14 16:23 ?3671次閱讀
    語言模型是否是<b class='flag-5'>自動駕駛</b>的必選項(xiàng)?

    什么是自動駕駛決策系統(tǒng)?發(fā)展有何挑戰(zhàn)?

    [首發(fā)于智駕最前沿微信公眾號]把自動駕駛汽車想象成一個(gè)不斷學(xué)習(xí)并做決定的人,車上的“眼睛”負(fù)責(zé)看(感知)、“記憶/推理”負(fù)責(zé)想(預(yù)測與決策)、“手腳”負(fù)責(zé)做(規(guī)劃與控制),決策系統(tǒng)則處
    的頭像 發(fā)表于 10-26 09:55 ?1589次閱讀
    什么是<b class='flag-5'>自動駕駛</b><b class='flag-5'>決策</b>系統(tǒng)?發(fā)展有何挑戰(zhàn)?

    無引導(dǎo)線的左轉(zhuǎn)場景下,自動駕駛如何規(guī)劃軌跡?

    對于很多新手司機(jī)來說,在無引導(dǎo)線左轉(zhuǎn)的場景,開車會非常謹(jǐn)慎,但依舊會很好地處理好這一操作。但對于自動駕駛汽車來說,其行駛需要有較為明顯的參考線,在沒有白色虛線、沒有箭頭感知“我的車道在哪兒”的交通
    的頭像 發(fā)表于 09-18 09:12 ?762次閱讀
    無引導(dǎo)線的左轉(zhuǎn)場景下,<b class='flag-5'>自動駕駛</b>如何<b class='flag-5'>規(guī)劃</b>軌跡?

    邊聊安全 | 高效信息管理模塊:支持自動駕駛安全的數(shù)據(jù)庫解決方案

    的危害事件。ISO21448標(biāo)準(zhǔn)涵蓋了感知、規(guī)劃和控制系統(tǒng)的驗(yàn)證和確認(rèn),確保車輛在安全性和可靠性方面表現(xiàn)優(yōu)異。尤其是規(guī)劃算法的有效性,直接影響自動駕駛
    的頭像 發(fā)表于 09-05 16:19 ?8392次閱讀
    邊聊安全 | 高效信息管理模塊:支持<b class='flag-5'>自動駕駛</b>安全的數(shù)據(jù)庫解決方案

    自動駕駛感知、決策、控制都起到什么作用?

    自動駕駛的感知、決策與控制是一個(gè)高度耦合的系統(tǒng)工程。感知負(fù)責(zé)把復(fù)雜、噪聲且有不確定性的外界信息轉(zhuǎn)換為具有語義和概率描述的內(nèi)部狀態(tài);決策基于這些狀態(tài)做出策略選擇,并生成滿足動力學(xué)和安全約束的軌跡;控制
    的頭像 發(fā)表于 08-31 15:40 ?1782次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中</b>感知、<b class='flag-5'>決策</b>、控制都起到什么作用?

    自動駕駛汽車是如何準(zhǔn)確定位的?

    [首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的快速發(fā)展,車輛的精準(zhǔn)定位成為安全駕駛與路徑規(guī)劃的核心基礎(chǔ)。相比于傳統(tǒng)人類駕駛依賴路標(biāo)和視覺判斷,自動
    的頭像 發(fā)表于 06-28 11:42 ?1280次閱讀
    <b class='flag-5'>自動駕駛</b>汽車是如何準(zhǔn)確定位的?

    AGV小車的動態(tài)路徑規(guī)劃算法揭秘

    在現(xiàn)代倉儲、物流和制造業(yè)自動導(dǎo)引車(AGV)的身影日益普遍。它們?nèi)缤趧诘墓は仯趶?fù)雜的環(huán)境自主穿梭,高效地完成物料搬運(yùn)任務(wù)。而支撐AGV實(shí)現(xiàn)智能導(dǎo)航的核心技術(shù)之一,便是路徑規(guī)劃
    的頭像 發(fā)表于 06-17 15:54 ?1719次閱讀
    AGV小車<b class='flag-5'>中</b>的動態(tài)路徑<b class='flag-5'>規(guī)劃算法</b>揭秘

    新能源車軟件單元測試深度解析:自動駕駛系統(tǒng)視角

    焦點(diǎn)是否落在目標(biāo)物體上。某自動駕駛公司借此發(fā)現(xiàn)模型在夜間過度關(guān)注路燈而非行人。 ? 實(shí)時(shí)性保障: ?時(shí)間感知測試框架(TAF)注入時(shí)間戳探針,監(jiān)控函數(shù)執(zhí)行耗時(shí)。例如,某路徑規(guī)劃算法因內(nèi)存泄漏導(dǎo)致響應(yīng)
    發(fā)表于 05-12 15:59

    感知融合如何讓自動駕駛汽車“看”世界更清晰?

    ”,更是車輛實(shí)現(xiàn)自主決策的基礎(chǔ)。 環(huán)境感知系統(tǒng)需要實(shí)時(shí)采集、處理和分析車輛周圍的動態(tài)和靜態(tài)信息,包括其他車輛、行人、交通標(biāo)志、道路狀況以及天氣條件等。這些信息直接影響到自動駕駛的路徑規(guī)劃與控制
    的頭像 發(fā)表于 04-27 16:24 ?879次閱讀
    感知融合如何讓<b class='flag-5'>自動駕駛</b>汽車“看”世界更清晰?

    自動駕駛中常提的“NOA”是個(gè)啥?

    “Navigate on Autopilot”,即自動導(dǎo)航駕駛,是一種依托高精度定位、多種傳感器數(shù)據(jù)融合以及先進(jìn)人工智能算法和實(shí)時(shí)決策規(guī)劃
    的頭像 發(fā)表于 04-09 09:03 ?3118次閱讀
    <b class='flag-5'>自動駕駛</b>中常提的“NOA”是個(gè)啥?

    具身智能工業(yè)機(jī)器人路徑規(guī)劃算法成為破局關(guān)鍵

    在工業(yè)4.0與智能制造深度融合的今天,傳統(tǒng)路徑規(guī)劃算法已難以滿足動態(tài)生產(chǎn)環(huán)境的需求。面對復(fù)雜場景下的高精度避障、實(shí)時(shí)決策與多任務(wù)協(xié)同挑戰(zhàn),具身智能工業(yè)機(jī)器人路徑規(guī)劃算法成為破局關(guān)鍵。作為具身智能領(lǐng)域
    的頭像 發(fā)表于 03-28 15:01 ?1061次閱讀