近日,AAAI 2026公布了論文錄用結果,該會議是人工智能領域的國際頂級會議之一。據悉,AAAI 2026共收到23,680份論文投稿,其中4,167篇論文被錄用,錄用率僅為17.6%。
由小鵬汽車和北京大學計算機學院多媒體信息處理全國重點實驗室聯合完成的論文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》成功入選。
這篇論文最大的貢獻在于,提出了一種專門為端到端自動駕駛VLA模型定制的、高效的視覺Token剪枝框架——FastDriveVLA。
隨著AI大模型技術的加速演進,VLA(視覺-語言-動作)模型由于在復雜場景理解與動作推理方面展示出巨大潛力,正在被廣泛地應用于端到端自動駕駛系統中。VLA模型在處理視覺信息時,會將圖像編碼為海量視覺Token(詞元)。
視覺Token是VLA模型“看懂世界”,并“做出決策”的基石,其質量、數量與選擇策略直接決定模型的性能、效率與可信度。然而,直接轉換的處理方式會導致車端計算負荷變大,同時還會影響模型的推理效率和決策執行。
此前,視覺Token剪枝已被證實了是加速VLA模型推理的可行方法之一。但傳統的視覺Token剪枝方法或依賴文本-視覺注意力關聯,或基于Token相似度去重,在駕駛場景中均存在明顯局限。
為了解決這一問題,小鵬汽車聯合北大共同提出了FastDriveVLA——一種專門為自動駕駛設計的、基于重建的視覺Token剪枝框架。
該框架的提出受到了人類駕駛員在駕駛時會專注于相關前景信息(如行人、道路、車輛、交通標志、交通信號燈、交通障礙物)的啟發,引入了一種新穎的對抗性前景-背景重建策略,以增強VLA模型識別有價值Token的能力,從而教會AI“像人一樣開車”,自動過濾無關緊要的視覺信息,只關注有用的核心信息。

FastDriveVLA 框架
在訓練階段,論文中提出了一種新穎的“前景-背景對抗重建”策略,以增強 ReconPruner 對前景視覺 Token 的感知能力;
在推理階段,ReconPruner可直接嵌入自動駕駛VLA模型,用于 Token 剪枝。
FastDriveVLA包含一個即插即用的視覺Token剪枝器ReconPruner。在車端模型的推理階段, ReconPruner可直接嵌入自動駕駛VLA模型用于視覺Token的剪枝,即插即用,無需重新訓練整個模型。為了輔助該剪枝器的訓練,還專門構建了包含來自6個攝像頭視角的24.1萬個圖像-掩碼對的nuScenes-FG數據集。這一大規模的自動駕駛前景分割標注數據集,可廣泛用于未來自動駕駛的研究。

nuScenes-FG。
該數據集為 nuScenes 場景提供了 24.1 萬個前景分割標注。
這種“去繁從簡”只關注核心駕駛信息的思路,讓FastDriveVLA取得了驚艷的效果。最終,nuScenes自動駕駛數據集上的測試顯示,采用這一剪枝框架,在不同剪枝率下均取得當前最優即SOTA效果:
當剪枝比例達25%,駕駛性能幾乎不下降,其L2軌跡誤差與碰撞率指標甚至超越未剪枝的基準模型;
當剪枝比例達50%,在所有指標上表現更平衡;
與此同時,VLA模型的推理效率得到了顯著提升。當視覺Token數量從3249減少到812時,FastDriveVLA 實現了近7.5倍的計算量(FLOPs)減少。在 CUDA (指從GPU啟動一個計算任務到真正拿到該任務的計算結果之間所經歷的時間)延遲方面,FastDriveVLA 將預填充時間(prefill)與解碼時間(decode)分別減少了3.7倍與1.3倍。
小鵬汽車聯合北大提出的FastDriveVLA,建立了自動駕駛VLA模型的高效視覺Token剪枝的新范式,同時樹立了車端大模型高效部署上車的新標桿。
此次論文入選AAAI 2026,是小鵬汽車今年第二次參與人工智能領域的國際頂級會議。早在今年6月,小鵬汽車曾作為CVPR WAD唯一邀請演講中國車企,分享自動駕駛基座模型研發進展。在今年11月的科技日上,小鵬汽車正式推出第二代VLA,創新性地去掉了“語言轉譯”環節,首次實現從視覺信號到動作指令的端到端直接生成,顛覆了行業傳統的「V-L-A」架構,探索全新物理AI模型范式。這些成果都為全球自動駕駛的研究和實踐注入了全新的動力。
這一系列成果也彰顯了小鵬汽車從模型架構設計、模型訓練到模型蒸餾、部署上車的全棧自研能力。未來,小鵬汽車將繼續以L4為目標,在AI大模型領域加大投入,加速物理AI大模型上車,讓更安全、高效、舒適的智駕體驗惠及全球用戶。
-
模型
+關注
關注
1文章
3751瀏覽量
52099 -
自動駕駛
+關注
關注
793文章
14879瀏覽量
179779 -
小鵬汽車
+關注
關注
4文章
644瀏覽量
16780
原文標題:小鵬聯合北大發布論文登國際AI頂會AAAI 2026,樹立車端大模型高效部署上車新標桿?!
文章出處:【微信號:XPENGMOTORS,微信公眾號:小鵬汽車】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
思特威于ISSCC 2026發表論文研究成果
小鵬汽車單筆最大碳中和綠色ABS成功發行
西井科技攜手同濟大學 三篇AI研究成果入選頂會ICLR 2026
后摩智能4篇論文入選人工智能頂會ICLR 2026
Nullmax DiffRefiner軌跡預測框架入選AAAI 2026
北京大學口腔醫學院采購南京大展新品同步熱分析儀
時識科技聯合創新成果SpikeRAM芯片入選ISSCC 2026
地平線五篇論文入選NeurIPS 2025與AAAI 2026
摩爾線程新一代大語言模型對齊框架URPO入選AAAI 2026
Nullmax端到端軌跡規劃論文入選AAAI 2026
突破瓶頸!中國成功研制新型芯片 求解大規模MIMO信號檢測時效能提升超百倍
北京光庭出席汽車產業協同創新峰會
知存科技助力北京大學校友論壇圓滿落幕
香橙派AIpro(20T)走進北京大學、上海交通大學等高校鯤鵬昇騰科教創新卓越中心特訓營
小鵬汽車與北京大學研究論文成功入選AAAI 2026
評論