伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

理想汽車發布下一代自動駕駛基礎模型MindVLA-o1

理想汽車 ? 來源:理想汽車 ? 2026-03-18 11:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2026年3月17日,理想汽車基座模型負責人詹錕出席NVIDIA GTC 2026,發表主題演講《MindVLA-o1:開啟全能范式——下一代統一視覺-語言-動作自動駕駛大模型探索》,發布下一代自動駕駛基礎模型MindVLA-o1。MindVLA-o1通過五大技術創新,構建了面向物理世界智能的自動駕駛基礎模型,讓自動駕駛看得更遠、想得更深、行得更穩、進化更快、部署更高效。

詹錕表示:“當我們把視覺、語言和行動統一到一個模型中時,它已不再只是自動駕駛模型,而是在逐漸演化為面向物理世界的通用智能體。基于同一套VLA模型,不僅可以控制車輛,也能夠擴展到機器人。因此,自動駕駛只是物理AI的起點,未來這類基礎模型將驅動新的具身智能范式。”

01從規則時代到AI時代,理想輔助駕駛持續演進。

自2021年啟動輔助駕駛自研以來,理想輔助駕駛技術架構經歷了多輪關鍵迭代,持續的技術探索與工程實踐,為理想汽車在軟硬件一體化研發領域積累了深厚的基礎研究能力與研發實力。2024年是理想輔助駕駛的重要分水嶺,隨著端到端+VLM(視覺語言模型)雙系統架構量產交付,輔助駕駛首次真正具備了跨場景、跨任務的統一理解能力。2025年,理想汽車進一步將空間理解、語言理解與行動決策統一到同一模型框架,構建了基于VLA、世界模型與強化學習三大技術棧的VLA司機大模型,并于8月隨理想i8交付正式推送,9月向AD Max用戶全量推送。

截至2025年底,VLA司機大模型月使用率達到80%,VLA指令累計使用1225.4萬次;春節期間理想輔助駕駛總里程達2.5億公里,VLA指令使用次數達130.3萬次。規模化的用戶驗證與持續積累的真實場景數據,為理想汽車推進下一代自動駕駛技術演進提供了堅實基礎。

02MindVLA-o1五大技術創新:看得更遠、想得更深、行得更穩、進化更快、部署更高效

理想汽車提出下一代統一架構——MindVLA-o1。該架構以原生多模態MoE Transformer為核心,通過五大技術創新——3D空間理解、多模態思考、統一行為生成、閉環強化學習(Closed-loop RL)和軟硬件協同設計(Hardware–Software Co-Design),構建了面向物理世界智能的自動駕駛基礎模型。

b493b170-21e5-11f1-90a1-92fbcf53809c.png

在感知層面,理想汽車采用以視覺為核心的3D ViT Encoder(3D視覺模型編碼器),并利用激光雷達點云作為三維幾何提示,引導模型理解真實空間結構,使其在單一表示中同時具備語義理解與三維感知能力。同時引入前饋式3DGS表示(Feedforward 3D Representation),將場景拆分為靜態環境與動態物體分別建模,并通過下一幀預測(Next-state prediction)作為自監督信號,使模型同時學習深度信息、語義結構與物體運動,最終形成融合空間結構與時間上下文的高質量3D表示。具備3D空間理解能力,使模型看得更遠。

b4f0b956-21e5-11f1-90a1-92fbcf53809c.png

在思考層面,自動駕駛既要理解當前環境,也要預測未來幾秒的場景演化。在語言模型承擔語義理解、常識知識和交互能力的基礎上,理想汽車還引入了預測式隱世界模型,在隱空間中高效模擬未來。訓練分三階段:第一,用海量視頻數據預訓練Latent World Token(隱世界詞元),構建未來表征;第二,在MindVLA-o1中持續世界模型的推演,形成隱空間的未來推理能力;第三,將世界模型、多模態推理能力及駕駛行為進行聯合訓練與對齊。由此,模型不僅能理解當前場景并進行邏輯判斷,還能在隱空間中提前“想象”未來畫面,將駕駛決策具象化。理想汽車將這種能力定義為多模態思考(Generative Multimodal Thinking)。擁有多模態思考能力,讓模型想得更深。

b54f03ee-21e5-11f1-90a1-92fbcf53809c.png

在行為層面,理想汽車構建了統一行為生成(Unified Action Generation)機制。首先,MindVLA-o1使用VLA-MoE(混合專家模型)架構,并引入專門的Action Expert(動作專家),從3D場景特征、導航目標、駕駛指令等多維輸入中提取信息,并結合多模態思考生成高精度駕駛軌跡。其次,為滿足實時性要求,系統采用并行解碼(Parallel Decoding),同時生成所有軌跡點,大幅提升效率。最后,引入Discrete Diffusion(離散擴散)進行多輪迭代優化,類似逐步去噪,確保軌跡空間連續、時間穩定,并符合車輛動力學約束。形成統一行為生成機制,使模型行得更穩。

b5ab2070-21e5-11f1-90a1-92fbcf53809c.png

在模型迭代層面,理想汽車構建了閉環強化學習框架,讓模型不僅能從真實數據學習,還能在世界模擬器(World Simulator)中持續探索和優化策略。為此,理想汽車將傳統逐步優化式重建升級為Feed-forward(前饋)場景重建,使系統能夠瞬時生成大規模、高保真駕駛場景,支持大規模并行訓練。同時,結合生成式模型(Generative Models),模擬環境可擴展、編輯并生成全新場景。為支持大規模模擬與訓練,理想汽車開發了統一的3D Gaussian Splatting(3D高斯潑濺)渲染引擎和分布式訓練框架,渲染速度提升近2倍,整體訓練成本降低約75%,實現低成本、高效率的強化學習閉環。在閉環強化學習框架下,模型實現更快進化。

b602d0a4-21e5-11f1-90a1-92fbcf53809c.png

為解決傳統端側大模型部署耗時長、調試頻繁的問題,理想汽車提出面向端側大模型的軟硬件協同設計定律,將模型結構與驗證損失建模,并結合Roofline模型刻畫硬件計算能力與內存帶寬限制,在模型性能與硬件約束之間建立統一的分析框架。理想汽車基座模型團隊評估了近2000種模型架構配置,在英偉達Orin與Thor平臺上完成驗證,找到了模型精度與推理延遲之間的Pareto Front(帕累托前沿),將架構探索時間從數月縮短至數天,大幅提升端側VLA模型的設計與部署效率。在軟硬件協同設計定律下,模型部署更高效。

b6613a5e-21e5-11f1-90a1-92fbcf53809c.png

03自動駕駛只是起點,為具身智能構建“數字大腦”。

MindVLA-o1是理想汽車面向物理世界智能核心AI框架的重要組成部分。這套AI框架由四大核心模塊組成:MindData,統一的VLA數據引擎,負責大規模數據的采集、清洗和自動標注;MindVLA-o1,統一的原生多模態VLA模型,可以理解環境、進行推理,并生成駕駛行為;MindSim,可控的多模態世界模型,用于生成復雜駕駛場景并支持大規模閉環訓練;RL Infra(強化學習基礎設施),通過獎勵模型和策略學習,使系統在仿真與真實環境中自我進化。

四部分協同形成完整閉環,使AI能夠感知、理解并在物理世界中自主行動,并持續學習。從結構上看,這套系統如同一個“數字大腦”:感知層對應視覺皮層,推理與規劃如前額葉,場景生成似運動皮層,強化學習則類似多巴胺反饋,實現了感知、理解、行動和持續優化的完整閉環。

該框架不僅服務于汽車,也可擴展至機器人及各種物理系統。對理想汽車而言,車是最大號的機器人,其本質是在構建硅基生命體的軀干與大腦。

b6bef2d4-21e5-11f1-90a1-92fbcf53809c.png

理想汽車在持續推進技術創新的同時,在人工智能領域頂級學術會議和期刊發表了大量研究成果,其中MindVLA-o1相關的多篇論文已在CVPR、ICLR、ICRA、AAAI等國際頂會上發表。未來,理想汽車將繼續以用戶價值為導向,投入前沿研究以及核心技術自研,持續構建面向物理世界智能的完整AI系統,堅定邁向全球領先的具身智能企業。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 自動駕駛
    +關注

    關注

    794

    文章

    14914

    瀏覽量

    180287
  • 理想汽車
    +關注

    關注

    0

    文章

    338

    瀏覽量

    4107
  • 大模型
    +關注

    關注

    2

    文章

    3683

    瀏覽量

    5206

原文標題:理想汽車發布下一代自動駕駛基礎模型MindVLA-o1

文章出處:【微信號:lixiangzhizao,微信公眾號:理想汽車】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    禾賽科技純固態補盲雷達FTX獲得長安汽車下一代平臺車型定點

    今日,全球激光雷達領導者禾賽科技(NASDAQ: HSAI;HKEX: 2525)宣布,其第二純固態補盲雷達 FTX 已成功獲得長安汽車下一代智能化 L3 平臺車型前裝量產定點。此次合作標志著 L3 級自動駕駛核心感知技術正式
    的頭像 發表于 03-13 14:04 ?790次閱讀

    華為在MWC 2026正式發布下一代WAN目標網架構

    在MWC26巴塞羅那期間,華為數據通信產品線總裁王雷在產品與解決方案發布會上正式發布下一代WAN目標網架構。他表示,面向智能體互聯網時代,華為從安全韌性、多維感知、網絡自治三個維度全面升級IP承載網,助力運營商構建自主防御的網
    的頭像 發表于 03-05 11:12 ?441次閱讀

    理想汽車發布端側大模型軟硬協同設計定律

    近日,理想汽車聯合國創決策智能技術研究所正式發布端側大模型“軟硬協同設計定律”,提出面向車載與邊緣場景的大模型軟硬
    的頭像 發表于 03-04 16:00 ?773次閱讀
    <b class='flag-5'>理想</b><b class='flag-5'>汽車</b><b class='flag-5'>發布</b>端側大<b class='flag-5'>模型</b>軟硬協同設計定律

    如何構建適合自動駕駛的世界模型

    提出的。那世界模型自動駕駛落地的正解嗎? 什么是世界模型? 世界模型對于自動駕駛汽車來說,更像
    的頭像 發表于 02-18 08:14 ?1.1w次閱讀
    如何構建適合<b class='flag-5'>自動駕駛</b>的世界<b class='flag-5'>模型</b>?

    自動駕駛汽車如何實現自動駕駛

    人類駕駛員而言是非常直觀且有效的指令,但對于自動駕駛汽車來說,則意味著需要套極其復雜的感知、理解與決策鏈路。 自動駕駛如何看清文字?
    的頭像 發表于 02-10 08:50 ?668次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>如何實現<b class='flag-5'>自動駕駛</b>

    德州儀器TDA5系列SoC助力下一代自動駕駛汽車設計

    在中央計算平臺的幫助下,汽車行業的自動駕駛水平越來越高。TDA5 系列等 SoC 通過集成式 C7 NPU 和芯片就緒型設計提供安全、高效的 AI 性能。這些 SoC 使汽車制造商能夠更輕松地實現 ADAS 功能,為從基礎車型到
    的頭像 發表于 01-12 11:28 ?1969次閱讀
    德州儀器TDA5系列SoC助力<b class='flag-5'>下一代</b><b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>設計

    黃仁勛:未來十年很多汽車自動駕駛 英偉達發布Alpamayo汽車模型平臺

    在當地時間1月5日黃仁勛在CES 2026上發表主題演講,黃仁勛的新年首場演講中重點提及自動駕駛、機器人等。 黃仁勛:未來十年很多汽車自動駕駛 黃仁勛認為AI發展的
    的頭像 發表于 01-06 11:45 ?1167次閱讀

    世界模型是讓自動駕駛汽車理解世界還是預測未來?

    ? [首發于智駕最前沿微信公眾號]世界模型自動駕駛技術中已有廣泛應用。但當談及它對自動駕駛的作用時,難免會出現分歧。它到底是讓自動駕駛汽車
    的頭像 發表于 12-16 09:27 ?907次閱讀
    世界<b class='flag-5'>模型</b>是讓<b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>理解世界還是預測未來?

    模型中常提的快慢思考會對自動駕駛產生什么影響?

    2024年7月,理想汽車發布的基于端到端模型、VLM視覺語言模型和世界模型的全新
    的頭像 發表于 11-22 10:59 ?2543次閱讀
    大<b class='flag-5'>模型</b>中常提的快慢思考會對<b class='flag-5'>自動駕駛</b>產生什么影響?

    不同等級的自動駕駛技術要求上有何不同?

    談到自動駕駛,不可避免地會涉及到自動駕駛分級,美國汽車工程師學會(SAE)根據自動駕駛系統與人類駕駛員參與
    的頭像 發表于 10-18 10:17 ?2749次閱讀

    小鵬汽車在全球AI頂會展示下一代自動駕駛模型

    此前,北京時間6月11-14日,計算機視覺頂會CVPR 2025在美國田納西州納什維爾舉行,小鵬汽車受邀參與自動駕駛研討會CVPR WAD(Workshop on Autonomous
    的頭像 發表于 06-23 09:13 ?1193次閱讀

    SEGGER發布下一代安全實時操作系統embOS-Ultra-MPU

    2025年3月,SEGGER發布滿足周期定時分辨率要求的下一代安全實時操作系統embOS-Ultra-MPU,該系統基于成熟的embOS-Classic-MPU和embOS-Ultra操作系統構建。
    的頭像 發表于 03-31 14:56 ?1391次閱讀

    自動駕駛模型中常提的Token是個啥?對自動駕駛有何影響?

    近年來,人工智能技術迅速發展,大規模深度學習模型(即大模型)在自然語言處理、計算機視覺、語音識別以及自動駕駛等多個領域取得了突破性進展。自動駕駛作為未來智能交通的重要方向,其核心技術之
    的頭像 發表于 03-28 09:16 ?1403次閱讀

    NVIDIA Halos自動駕駛汽車安全系統發布

    NVIDIA 整合了從云端到車端的安全自動駕駛開發技術套件,涵蓋車輛架構到 AI 模型,包括芯片、軟件、工具和服務。 物理 AI 正在為自動駕駛和機器人開發技術的交叉領域釋放新的可能性,尤其是加速了
    的頭像 發表于 03-25 14:51 ?1207次閱讀

    理想汽車推出全新自動駕駛架構

    2025年3月18日,理想汽車自動駕駛技術研發負責人賈鵬在NVIDIA GTC 2025發表主題演講《VLA:邁向自動駕駛物理智能體的關鍵
    的頭像 發表于 03-19 14:12 ?1129次閱讀