[首發于智駕最前沿微信公眾號]在談自動駕駛技術的時候,“中間表達”是一個經常出現的詞。相較于熟知的激光雷達、車載攝像頭、毫米波雷達等硬件,亦或是大模型、端到端、算法等軟件層面的概念,“中間表達”這個詞相對比較抽象,那中間表達到底是個啥?它有什么作用?

什么是中間表達?
要理解“中間表達”,我們可以從系統處理的信息特點一步步展開來看。在自動駕駛系統里,傳感器提供的數據形式非常多樣,攝像頭輸出彩色圖像;激光雷達給出三維點云;毫米波雷達提供目標距離和速度信息;GPS和慣性測量裝置給出位置和運動狀態。這些原始數據雖然包含了場景所有的細節,但它們大而雜,難以直接用于決策。因此,系統就必須把這些原始輸入轉化成更便于推理和利用的信息。
為了實現這個目標,車輛要從各種傳感器拿到大量的原始數據,這些數據本身并不能直接用來做決策,它需要經過一系列的處理,才會成為既準確又可用的信息。這些處理之后的、介于原始數據和最終駕駛決策之間的數據或信息,就是我們說的“中間表達”。

圖片源自:網絡
舉個例子,從傳感器圖像和點云里識別出的一條車道線的位置、一輛后面車輛的相對速度和距離、一個紅綠燈當前狀態等都是中間表達。它們比原始像素和點坐標更具意義,但還不是最終的控制指令。它們相當于系統對眼前世界的“理解和總結”。通過把原始數據轉換成這些表達,自動駕駛系統可以把注意力集中在對行駛有實際影響的環境要素上,減少對無關細節的處理和依賴。
中間表達有時也被稱為中間表示,這與計算機科學中編譯器里使用的中間語言概念有相似性,它們都是在原始輸入和最終輸出之間的一種中間層,用來提高整個流程的效率和可分析性。對于自動駕駛來說,一個好的中間表達必須能夠在不丟失關鍵信息的前提下,使得后續模塊可以更容易、更準確地做出預測和規劃。
簡而言之,中間表達在自動駕駛系統里擔負著把原始數據加工成更有意義的信息的職責。它的形式多種多樣,可以是二維場景的語義描述、也可以是三維空間里物體的位置信息、更可以是對未來行為的預測。它既比原始感知數據更精煉,也比最終的控制輸出更接近對環境的理解。

中間表達在不同架構中的角色
自動駕駛系統有不同的實現架構,它們對中間表達的定義和使用也有細微差別。在傳統的模塊化系統中,中間表達會被顯式地定義和傳遞。一個模塊輸出的中間表達會作為下一個模塊的輸入,這樣的信息流是清晰的可觀察的,這種設計也讓自動駕駛系統更容易調試、驗證和優化。
在這種架構里,感知模塊輸出的中間表達既包括靜態特征(如車道線、障礙物位置),也包括動態特征(如物體運動速度、變化趨勢)。這些信息通過標準格式傳遞給預測模塊,由預測模塊根據這些信息判斷未來一段時間內場景的變化。緊接著,規劃模塊會根據預測結果確定車輛下一步安全且合理的軌跡。在模塊化系統里,中間表達是約定好的信息形式,能讓各個模塊獨立開發、獨立測試。由于模塊化設計可以檢查某個環節的中間輸出是不是出了問題,如果感知輸出錯誤,那么預測、規劃自然也會受到影響,因此,這樣的設計也便于定位具體的故障點。

圖片源自:網絡
現階段,端到端的應用非常普遍,這類系統試圖跳過顯式中間模塊,把傳感器輸入直接映射到控制輸出。這種方式在某些場景下可以減少手工設計的復雜性,但它也帶來了可解釋性差的問題。端到端系統的內部處理過程會被隱藏在一個整體的神經網絡模型里,如果沒有明確的中間表達,就很難得知系統是基于什么具體環境特征做出某個決策的。這種黑箱式的決策對安全驗證和調試非常不利。
為了兼顧端到端學習的靈活性和系統的可解釋性,有技術提出了“二段式端到端”的方法。在這種架構里,網絡首先學習把原始輸入轉換成一種對駕駛決策友好的中間表達,然后再用這種中間表達生成控制指令。舉個例子,系統可以先生成一張語義鳥瞰圖和一組預測軌跡點作為中間表達,再用這些信息生成最終的控制輸出。這種方式既保持了端到端學習的優勢,又通過顯式的中間表達提高了模型的可解釋性和系統的可靠性。

中間表達的常見形式及作用
要更好地理解中間表達,可以看看它在系統中有哪些具體形式,以及這些形式為什么對系統有用。不同的中間表達承載的信息側重點并不一樣,但它們共同的目標是把傳感器信息變成對后續任務更有幫助的數據。
一種常見的中間表達是幾何語義類。這種表達描述的是環境的空間結構,像是道路的幾何形狀、車道線的位置、路緣的位置、車輛和行人的邊界框等就屬于這種表達。這些數據本質上回答了“周圍有什么”和“它們在哪里”的問題。對于規劃模塊來說,理解這些幾何信息是決定車輛可通行空間和路徑的基礎。
還有一種中間表達是語義理解類,像是交通標志、紅綠燈狀態、道路類型等信息就屬于語義理解類的中間表達。這樣的表達幫助系統在路徑選擇和行為決策時理解場景語義。如果系統知道前方是紅燈而不是綠燈,它就會停下而不是繼續前進,這種信息是語義性的,而不是純粹的幾何數據。
還有更高級的中間表達會包含動態預測類信息,它不僅描述當前環境,還可預測未來環境可能的變化。如系統會根據當前車速和運動方向來預測前方車輛在未來幾秒內可能的位置。這樣的預測結果會和概率結合在一起,成為規劃模塊做決策的重要參考。如果不對動態信息進行預測,車輛就只能根據當前瞬間狀態做決策,會讓自動駕駛系統失去對未來風險的洞察。
上述這些中間表達的設計和選用,并不是隨意的,而是基于自動駕駛在實際道路上運行所需的核心判斷能力所決定的。好的中間表達能讓系統在復雜、動態變化的道路環境中做出更準確、更安全的決策。

為什么關注中間表達對自動駕駛很重要
理解了中間表達,就有助于深入認識自動駕駛系統的本質。不是簡單把攝像頭或雷達數據扔進一個大模型里,就能自動得出駕駛指令。系統需要把原始數據轉化成能表達環境狀態的信息,再基于這種表達去預測、規劃和控制。中間表達不僅是工程實現的信息橋梁,也是性能和安全保障的基石。
在模塊化設計里,中間表達讓各個階段的功能更清晰、更容易驗證。如果某個表達在某種場景下表現不穩定,就可以針對這一環節進行優化。這種清晰的分層還利于和傳統的控制理論結合,從而提高自動駕駛系統整體的魯棒性和可控性。

圖片源自:網絡
在學習驅動方法中,明確的中間表達可以提供更豐富的監督信號,不僅可以讓模型學會控制,還能讓其正確理解場景。比如在訓練階段,人們可以用帶有標簽的中間表達作為額外約束,避免模型只關注最終控制結果而忽略對場景本身的正確認識。
中間表達的重要性還體現在自動駕駛的安全性評估上。因為自動駕駛系統需要通過大量測試和驗證才能投入實際道路運營,明確的表達能讓測試覆蓋更多的極端情況,并且更容易診斷出系統在某類場景下的弱點。

最終的話
中間表達是自動駕駛系統內部非常核心的一類信息結構,它連接了感知層和決策層,是整個系統能理解環境并做出正確判斷的關鍵。在不同的技術架構里,中間表達的形式和作用略有差異,但它們都承擔著把海量、原始的傳感器數據轉化為對未來行為有意義的信息的任務。理解中間表達,有助于理解自動駕駛技術的設計邏輯、性能邊界以及工程實現方式。隨著自動駕駛技術的不斷發展,中間表達的設計和優化依然是需要持續關注的重要方向。
審核編輯 黃宇
-
自動駕駛
+關注
關注
793文章
14879瀏覽量
179775
發布評論請先 登錄
【話題】特斯拉首起自動駕駛致命車禍,自動駕駛的冬天來了?
自動駕駛真的會來嗎?
自動駕駛的到來
邁向自動駕駛和電動汽車之路研討會
如何讓自動駕駛更加安全?
好的捕獲錯誤機制對debug來說非常重要
為何自動駕駛需要5G?
聯網安全接受度成自動駕駛的關鍵
UWB定位可以用在自動駕駛嗎
自動駕駛技術的實現
自動駕駛的全球大結盟非常重要 對自動駕駛的未來發展影響深遠
為什么仿真對于自動駕駛來說非常重要?
置信度驗證對于自動駕駛來說重要嗎?
為什么“中間表達”對于自動駕駛來說非常重要?
評論