[首發于智駕最前沿微信公眾號]把自動駕駛汽車想象成一個不斷學習并做決定的人,車上的“眼睛”負責看(感知)、“記憶/推理”負責想(預測與決策)、“手腳”負責做(規劃與控制),決策系統則處在這個鏈條的中間位置。它把來自感知(相機、雷達、激光雷達、定位、地圖等)的信息和預測模塊(對周圍行人、車輛未來行為的猜測)整合起來,輸出“我下一步要怎么走、以什么速度走、如何避讓”等指令。決策并不是單一的動作,而是一個層級化的流程,先想清楚要干什么(行為層,像是“變道”“左轉”“減速跟車”),再把這個行為轉成一條具體的、安全可執行的軌跡(軌跡層),最后把軌跡交給底層控制器去跟蹤(控制層)。

決策系統要同時滿足安全(永遠優先)、舒適(不要讓乘客暈)、合法(遵守交通規則)、高效(不無謂地慢)以及可解釋(出了問題能查原因)等要求。但這些要求恰恰會產生沖突,最安全的動作可能太保守影響效率,最快的動作可能帶來風險,所以決策系統本質上是在這些要求之間做權衡的過程。

經典與主流的方法:層級、優化與規則
長期以來,自動駕駛的決策與規劃主要沿著“層級化+優化/采樣”的路線發展,系統會先基于地圖和當前交通情形選擇一個合理的策略,例如在交叉口是“先等候再左轉”還是“突出加速通過”,通過這些合理的策略,可以確保自動駕駛汽車安全行駛。
為了能夠生成更安全的軌跡,常用的方法分為兩類,即采樣/搜索類和優化類。采樣類方法通過生成若干候選軌跡(基于軌跡庫或隨機采樣),評估每條軌跡的代價(碰撞風險、舒適性、距離、法規約束等),然后選擇代價最低的那一條。這類方法實現直觀,但當情形復雜時需要大量候選樣本,計算量容易爆炸。

優化類方法把軌跡看成一個連續的函數,用數學優化求最小代價路徑,常見的工具包括基于拉格朗日的優化、迭代線性二次調節(iLQR)、以及模型預測控制(MPC)。MPC特別受歡迎,因為它把動力學約束、狀態與控制約束直接納入優化問題,還能以有限時域滾動優化的方式去應對環境變化,這使得控制既能考慮未來又能實時運行。
除了純數學的優化外,規則/符號化方法也被廣泛用于保證安全行駛。例如Mobileye提出的Responsibility-Sensitive Safety(RSS)提出了一套數學化的“常識駕駛規則”,用來判斷何時應該采取防御性動作,從而為系統提供白盒式的安全保證。RSS強調可驗證性與可解釋性,是工業界推行“可證明安全”思路的代表之一。
在很多商用系統里,還會加一層“安全裁判”或“監護層”(supervisorysafetylayer),它不是去生成軌跡,而是在主規劃動作可能造成危險時進行攔截或修正。近年常把學習型模塊(負責復雜場景下做出靈活行為)與基于物理/規則的安全模塊(保證萬一學習出錯時仍不致于發生危險)結合起來,形成“學習+證據化安全”的混合結構。

近兩年的新技術熱點
現在自動駕駛行業有一個非常明顯的趨勢,第一個是把預測與規劃之間的界限變得模糊,過去感知負責“看”,預測負責“猜未來”,規劃負責“決定”;現在越來越多的工作嘗試把世界建模(worldmodeling)、多主體行為預測與軌跡生成緊耦合,甚至把規劃也放到同一個學習框架里去訓練。
Transformer架構因其優秀的時序與交互建模能力被廣泛采用。像MTR(Motion TRansformer)和Agent Former這樣的工作展示了Transformer在多主體、長時序軌跡預測上的強勁表現;它們能夠用自注意力機制去捕捉不同交通參與者之間的交互,從而生成更合理、具多模態性的未來軌跡預測。

與之相關的第二個趨勢是擴散(diffusion)模型被引入到軌跡預測與采樣生成領域。擴散模型擅長從復雜分布中生成高質量且多樣化的樣本,擴散方法能更好地表達未來的不確定性,生成的軌跡模式通常比傳統高斯混合或簡單回歸更豐富。
第三個大趨勢是BEV(Bird’s Eye View,俯視圖),把原始相機/雷達/激光點云數據先投影或轉換成車輛局部的俯視格網或向量化地圖,再在這個BEV表示上做感知、軌跡預測和規劃。BEV的好處在于它把空間結構顯式化,使得后續的規劃模塊可以直接在統一的空間中做代價評估與軌跡優化。
第四個值得注意的方向是“大模型”與多模態模型的嘗試。一些公司和研究團隊嘗試把大型多模態神經網絡應用到駕駛場景,用更大的模型去整合相機幀、點云、地圖和歷史軌跡,甚至把語言或世界知識納入決策過程。像是Waymo與Google的多模態/大模型合作方向在內部探索將大型多模態模型用于世界建模和軌跡生成的可能性(如EMMA),其目標是用更通用的模型來縮短“模塊間信息斷層”、增強推理能力,但同時也面臨計算與工程化挑戰。
上面這些技術趨勢的共同點是更強調“聯合建模”和“不確定性建模”。傳統系統里每一層獨立優化,信息在層與層之間被“壓縮”傳遞;新趨勢嘗試在更大的端到端或半端到端框架里聯合訓練,以避免信息損失,同時用概率模型或生成模型來保留和利用不確定性(比如何時可能發生緊急剎車、其他車輛可能的多種軌跡等),從而讓規劃在面對多種可能未來時更穩健。

安全、可驗證性與工程化挑戰
技術強并不意味著立刻可以上路,自動駕駛決策系統面臨極高的工程與合規門檻。安全與可驗證性就是其中一個,機器學習模型尤其是端到端、深度網絡通常是“黑盒”,在極端或稀有場景下可能會產生不可預測的行為。為此,在實際應用時一直強調在系統中保留可解釋和可驗證的模塊,或者在學習模塊外加上可證明的安全層,并結合控制屏障函數(Control Barrier Functions,CBF)等技術來保證系統滿足安全約束。近年來有方案把實時MPC與CBF結合,證明在城市場景下能以可計算的代價提供安全保障,這類方法在可證明安全方面是有實際意義的進展。
實時性與算力也是決策系統發展需要考慮的難題,擴散模型、巨型Transformer、以及多模態大模型在訓練與推理上都很吃資源。實際車輛的算力、功耗、散熱和延遲都有硬性限制,任何決策模型必須在嚴格的延遲預算內給出輸出。常見的做法是混合采用,在邊緣用輕量化或確定性模塊做“快尚能”決策(fast-fallback),在云或離線環境中用大模型做策略更新、數據采樣或仿真訓練。
還有一個難題就是對稀有/危險場景的處理,在現實的交通場景中,會出現很多危險但少見的邊緣場景,但正因為它們危險,系統必須在這類場景上能夠靈活處理。其中解決辦法包括大量合成數據、基于仿真的極端場景生成(scenariogeneration)、重要性采樣與對抗式訓練,或者用基于規則的強制安全邊界來覆蓋學習系統的盲點。此外,如何對學習系統做形式化驗證仍然是一個開放問題,這就需要結合可解釋AI、可證實安全理論與充分的實測/仿真驗證框架。
法規與社會信任其實一直是自動駕駛發展最難平衡的問題,決策系統的行為牽涉到責任歸屬和倫理問題。像Mobileye的RSS試圖把“常識駕駛”數學化,雖然這方便證明和溝通,但也引出了責任與法律層面的討論。有很多技術的做法是把透明性與可追溯性做為產品化的基本要求,決策日志、黑匣子式的數據記錄與回放、以及在系統內置的可解釋性接口,都是建立社會信任的必要手段。

最后的話
自動駕駛決策系統既依賴嚴謹的控制理論與優化算法,也依賴對復雜交通場景的統計學習與數據驅動建模,雖然經典的分層優化與規則化方法在安全性與可解釋性上有天然優勢,但Transformer、擴散模型、BEV表示和多模態大模型等新技術更是為系統帶來了更強的建模能力和面對不確定性的柔性。
雖然技術快速進步很吸引人,但真正能在復雜道路場景中穩定、可解釋、可監管地運行,仍然需要時間、系統化的工程實施以及規范化的驗證流程。研究方向上的每一個“新潮詞”都值得關注,但在把它推向道路時要多一分謹慎、多一分驗證。
審核編輯 黃宇
-
自動駕駛
+關注
關注
793文章
14879瀏覽量
179790
發布評論請先 登錄
自動駕駛與具身智能感知系統的設計優先級有何差異?
2026年自動駕駛汽車發展趨勢前瞻
軟錯誤防護:自動駕駛系統邁向高階自動化的必答題?
自動駕駛仿真測試有什么具體要求?
自動駕駛SoC芯片到底有何優勢?
端到端自動駕駛相較傳統自動駕駛到底有何提升?
自動駕駛中感知、決策、控制都起到什么作用?
數據驅動自動駕駛:核心要素與發展全景解析
卡車、礦車的自動駕駛和乘用車的自動駕駛在技術要求上有何不同?
自動駕駛技術測試有哪些?
新能源車軟件單元測試深度解析:自動駕駛系統視角
AI將如何改變自動駕駛?
自動駕駛中基于規則的決策和端到端大模型有何區別?
什么是自動駕駛決策系統?發展有何挑戰?
評論