伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大曉機器人開源空間智能通用模型ACE-Brain-0

商湯科技SenseTime ? 來源:大曉機器人 ? 2026-03-11 13:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:大曉機器人

近日,大曉機器人聯合上海交通大學、南洋理工大學、香港中文大學、香港大學等研究機構共同推出以空間智能為底層框架、跨不同具身本體的通用基礎模型“ACE-Brain-0”,正式面向全行業開源。

ACE-Brain-0首次打破汽車、機器人、無人機等不同本體壁壘,貫穿空間認知、自動駕駛、低空感知、機器人交互,重新定義了物理世界智能的技術底層邏輯。其性能表現在涵蓋空間認知、自動駕駛、低空感知、具身交互的24 個核心 benchmark 中,19 個取得當前模型中的 SOTA(排名第一) 成績,全面大幅領先市場主流具身模型。ACE-Brain-0主要對標GPT-4o、Gemini 2.5-Pro、Qwen2.5-VL-7B-Inst、RoboBrain2.0-7B、MiMo-Embodied-7B等16個知名模型,將19個Benchmark具身模型最強基線準確率相對提升5%-97.8%。在衡量三維認知的MindCube,以82.1%的成績,較最好的開源模型(InternVL3-8B)提升了97.8%。

目前,上述模型已應用于大曉機器人具身超級大腦模組A1,使搭載具身超級大腦A1的機器狗具備行業首創的端到端自主導航能力,并且基于VLA架構實現云端智能交互,讓機器狗具備理解抽象指令、感知復雜環境、完成復雜任務的端到端閉環能力。

在城市人行道等復雜公共場景中,搭載ACE-Brain 的機器狗展現出卓越的導航與VLA能力。以圖片場景為例,面對“估算行人和摩托車間距、判斷是否有足夠空間導航通過”的需求,ACE-Brain賦能機器狗精準完成三大核心動作:

依托空間認知能力,可精準量化行人和摩托車間距約0.5米,為導航決策提供可靠依據;通過視覺語言理解,清晰解析自然語言指令,實現“看—懂—判”的連貫交互,無需額外定制化指令;在導航決策中,既能判斷空間足夠通過,又主動提出“謹慎前行”的安全建議,兼顧效率與公共安全,適配復雜公共場景的移動需求。

搭載ACE-Brain 的機器狗,可精準識別前方車輛等障礙物,通過空間智能感知道路環境與目標位置,預判通行風險,主動判斷 “應停下并安全繞行”,實現空間識別與目標預測的高效協同,保障復雜路況下的移動安全。

這種能力讓機器狗在擁擠人行道、復雜路況等場景中,運用強大的空間智能技術底座,通過3D 場景建模、幾何關系推理、空間定位等核心能力,既能精準感知環境,又能通過自然語言交互理解任務,實現安全、高效的自主導航,為公共巡檢、應急響應等場景提供可靠支撐。

空間智能成為跨本體的“通用語言”

為了實現多任務,傳統的辦法是把所有任務數據混在一起,然后訓練模型,盼望模型能夠自己悟出來;但是ACE-Brain的思路則更像教育學:先讓它建立“空間感”,學會理解世界中的前后左右、遠近高低、視角變化和位置等空間幾何關系,然后再去學不同任務中的具體技能。簡單來說,就是先學會“怎么看懂世界”,再學會“怎么完成相關的任務動作”。

大曉機器人團隊突破性發現,無論自動駕駛車輛、低空無人機還是機器人,盡管形態差異巨大,但都依賴三大核心空間能力:三維空間結構建模、幾何關系推理、場景演化預測。

基于上述共性,大曉機器人首次提出以空間智能作為跨具身形態的“通用語言”,成為用以連接不同物理域的統一認知支架,為通用具身智能找到統一底座。

c7ecbd68-1b85-11f1-90a1-92fbcf53809c.png

ACE-Brain-0架構

為打造統一的空間智能認知支架,ACE-Brain-0以空間信息為多模態自回歸架構,實現了從單視角圖像到多視角視頻序列的認知統一處理。

在輸入層,兼容單圖、多圖、視頻等多模態視覺數據,搭配自然語言指令作為任務條件,覆蓋所有具身場景的輸入需求;

在表征層,通過通用視覺編碼器提取領域無關的空間特征,經MLP 投影器映射為語言模型可理解的視覺令牌,并按 “通用、空間、駕駛、航空、具身” 分類組織,確??臻g信息的結構化表達;

在推理層,由統一的LLM解碼器實現跨模態融合推理,將空間認知轉化為可遷移的統一表示,使不同具身場景的知識能基于空間邏輯自由流動。

這一設計的核心優勢在于,無需為特定場景定制專用模塊,僅通過空間智能的“通用表征”,就實現了跨域知識的自然遷移,徹底改變了“一個場景一套模型”的傳統具身研發模式。

打造全新范式,解決跨本體訓練困境

傳統跨域訓練面臨兩大困境,一是聯合訓練易引發梯度干擾,導致各領域能力“稀釋”;二是序貫訓練則會出現災難性遺忘,學了新技能丟了舊能力。大曉機器人首創Scaffold-Specialize-Reconcile(SSR)三階段訓練范式,通過“先建共識、再練專長、后融知識”的路徑,完美解決了這一矛盾。

首先,Scaffold(框架構建)筑牢通用空間基礎。ACE-Brain-0利用大規??臻g智能數據集訓練空間專家模型,建立域無關的三維認知先驗。這一步就像為所有具身能力打造“通用地基”,讓后續領域訓練都能基于統一的空間認知框架展開,避免了各領域“從零開始學空間”的重復勞動。

第二步,Specialize(域專精學習)實現隔離優化和強化專長。在空間框架上,ACE-Brain-0分別獨立訓練自動駕駛專家、機器人專家等領域模型。每個領域專家模型僅在自身專屬數據集上微調,避免不同本體數據帶來的梯度沖突,確保每個領域都能獲得充分的專業化能力。

最后一步,Reconcile(跨域知識調和)實現數據無關的參數級融合。ACE-Brain-0通過任務向量空間對齊技術,在無需原始訓練數據的條件下,將各領域專家的參數進行整合,從而同時聯合訓練中的優化干擾和順序訓練導致的災難性遺忘。

四大能力首次統一,打造“一腦多形”樣本

ACE-Brain-0首次在單一模型框架中實現四大核心具身能力的統一:空間認知、自動駕駛、低空感知、機器人交互。這一突破并非簡單的能力“拼接”,而是基于空間智能的深度融合,其技術關鍵在于“共享認知結構”的構建。

通過空間中心化建模,ACE-Brain-0讓不同具身場景的認知邏輯實現統一。自動駕駛中的“車距判斷”與機器人交互中的“抓取距離估算”,共享同一套空間距離推理機制;交通場景的“多視圖融合”與機器人的“多視角物體識別”,依托相同的跨視角空間對齊技術。

這種“共享認知結構” 使得模型能在不同觀察視角、運動尺度與任務語義之間自由切換,實現跨域理解與推理能力的自然遷移。

刷新19個榜單具身模型SOTA

ACE-Brain-0在涵蓋空間認知、自動駕駛、低空感知、具身交互的 24 個核心 benchmark 中,對標GPT-4o、Gemini 2.5-Pro、Qwen2.5-VL-7B-Inst、RoboBrain2.0-7B、MiMo-Embodied-7B等16個知名模型,取得了19個當前具身模型中的SOTA(排名第一) 成績,同時將19個Benchmark具身模型最強基線準確率相對提升5%-97.8%,全面超越市場主流具身模型(如天工、北京智源、小米等)。

空間認知領域:

ACE-Brain-0參與了7項空間認知領域的權威基準評測,在具身智能模型陣營中斬獲5項 SOTA, VSI(視覺空間智能)、MMSI(多模態空間智能)、SITE(空間語言理解)、SAT(空間視角變換)、Mindcube(受限視角三維建模)代表了不同維度的核心空間能力。

其中VSI(視覺空間智能)綜合評估模型對空間布局、物體關系和尺度的理解與推理能力,ACE-Brain-0以63.3%的成績領跑具身模型,驗證了其空間認知的通用性;SAT(空間視角變換)考察從不同視角重構空間布局的能力,ACE-Brain-0以92.0% 的成績,相較當前最好具身模型提升了16.9%,證明其在視角變換下的空間建模能力。

Mindcube(受限視角三維建模)評估有限視角下構建三維心理空間的能力,ACE 82.1%的表現碾壓其他具身模型,較閉源模型 Gemini-2.5-Pro相對提升了42.5%,較最好的開源模型(InternVL3-8B)相對提升了97.8%,突破了遮擋和視角限制。

c8aeaf7c-1b85-11f1-90a1-92fbcf53809c.png

*代表基于上述模型復現/下劃線代表次優表現/黑體代表最優表現

自動駕駛領域:

ACE-Brain-0在5個自動駕駛benchmark 上均取得領先表現,分別是MME-RealWorld(真實駕駛場景理解)、MAPLM(地圖與道路結構理解)、DriveAction(駕駛行為理解)、NuscenesQA(多視圖動態場景理解)、NuPlanQA(規劃與交通規則理解),尤其在真實駕駛場景理解(MME-RealWorld)和規劃推理能力(NuPlanQA) 等關鍵能力上實現顯著提升。

其中MME-RealWorld(真實駕駛場景理解)主要評估模型在真實交通環境中的 多模態駕駛場景理解能力。ACE-Brain-0以71.2%的成績,相比當前最強具身大腦模型相對提升18%。

NuPlanQA(規劃與交通規則理解)重點考察模型在自動駕駛規劃任務中的 交通信號理解與車輛狀態推理能力。ACE-Brain-0取得91.7%的成績,決策正確率超越所有具身模型基線,較Pelican-VL-7B模型相對提升近10%。

c91c0da6-1b85-11f1-90a1-92fbcf53809c.png

*代表基于上述模型復現/下劃線代表次優表現/黑體代表最優表現

低空感知領域:

ACE-Brain-0在5個低空視覺benchmark上均取得顯著領先表現,包括UrbanVideo-Bench(城市級無人機場景理解)AirCopBench(空中交通關系理解和多無人機視角協同理解)、AVI-Math(空中幾何推理與數值計算)、Airspatial-VQA(低空空間視覺問答)、HIRVQA(遙感視覺問答),尤其在城市級無人機場景理解(UrbanVideo-Bench)和空中交通關系推理(AirCopBench) 等關鍵能力上實現大幅提升。

其中UrbanVideo-Bench(城市級無人機場景理解)主要評估模型在城市級無人機視頻中的大尺度場景理解與地標識別能力。ACE-Brain-0以56.9%的成績,相比當前最強具身大腦模型相對提升51.7%。

AirCopBench(空中交通關系理解和多無人機視角協同理解)主要考察模型在復雜城市道路拓撲下的空中交通監控與車輛關系推理能力。ACE-Brain-0以70.3%領跑具身模型,相比當前最強具身大腦模型相對提升35.4%。

AVI-Math(空中幾何推理與數值計算)主要評估模型在無人機視角下進行 幾何計算與結構化數值推理能力。ACE-Brain-0相比當前最強具身大腦模型提升1.3個百分點,達35.0%。

c97a706c-1b85-11f1-90a1-92fbcf53809c.png

*代表基于上述模型復現/下劃線代表次優表現/黑體代表最優表現

具身交互領域:

ACE-Brain-0在4個具身benchmark上均表現出穩定優勢,包括RoboVQA(機器人操作理解)、EmbSpatial(具身空間理解)、EgoPlan-Bench2(具身任務規劃)、EB-Habitat(具身導航理解),尤其在機器人操作理解(RoboVQA)等關鍵能力上實現顯著突破

RoboVQA(機器人操作理解)主要評估模型對機器人操作行為與物體交互過程的理解能力。ACE-Brain-0以64.6%的成績遠超同類模型。

EmbSpatial(具身空間理解)主要評估模型在具身環境中的 空間關系理解與環境結構認知能力。ACE-Brain-0成績達77.3%,相比當前最強具身大腦模型提升1個百分點。

EgoPlan-Bench2(具身任務規劃)主要考察模型在第一視角復雜任務中的長時序任務規劃能力。ACE-Brain-0成績達55.3%,相比當前最強具身大腦模型提升1.9個百分點。

EB-Habitat(具身導航理解)主要考察模型在仿真具身環境中的導航決策與完成完整任務的綜合能力。ACE-Brain-0成績達42.3%,相比當前最強具身大腦模型提升2.3個百分點。

c9dcc316-1b85-11f1-90a1-92fbcf53809c.png

*代表基于上述模型復現/下劃線代表次優表現/黑體代表最優表現

▎共享空間智能成為具身智能新世界觀

一個模型,一套參數同時在這些任務上的卓越表現非常有意義。它說明“空間優先”不是一句漂亮口號,而是會真實改變跨形態學習效果的設計原則。尤其是具身交互那條曲線更耐人尋味:為什么直接學會失敗,而先學空間再學會成功?直觀上看,因為當智能體面對真實世界時,動作策略往往依賴于對環境結構的正確理解。如果連空間關系都沒有穩定學會,那么所謂“具身能力”就很容易變成表面模仿;反過來,如果先掌握了共享的空間骨架,再去學具體動作,就像先學會看地圖再學開車,很多問題會突然迎刃而解。

更重要的是,報告并沒有滿足于“實驗上可行”,還試圖回答:為什么空間真的適合做共同底座? 在附錄理論部分,報告把這個想法形式化為一個“可恢復的空間scaffold”:模型的內部表示中,應該存在一個形態無關的共享幾何變量,它承載三維布局、相對位姿、深度和拓撲等信息。如果訓練后這個共享變量能夠被穩定“解碼”出來,那么它就不再只是一個模糊特征,而會變成跨不同身體都能復用的空間核心。理論中進一步指出,后續不同系統需要學習的,更多會是各自身體特有的感知、動力學和控制部分,而不是反復從零學習幾何世界。

這套理論把一個深奧問題講清楚了:為什么是“空間”,而不是別的? 因為空間不是一個普通任務,它更像是所有物理智能共同依賴的坐標系。無論是車在車道中判斷前后左右,還是無人機從鳥瞰視角推理道路關系,還是機器人在房間里判斷物體位置,它們都必須先擁有一種內部“空間地圖”。ACE-Brain-0就是把這種“內部地圖”從隱含假設提升成了方法設計的起點。

這一技術路徑的領先性,不僅在于解決了當前具身AI 的核心痛點,更在于為未來通用物理世界智能的研發提供了可復用的底層框架。ACE-Brain 真正讓人興奮的地方,不是某一個分數超過了誰,而是它重新定義了“通用具身智能”應該從哪里開始。過去我們常常把“通用”理解為一個模型會做很多任務;而 ACE-Brain 讓人看到另一種可能:真正的“通用”,或許不是任務列表越來越長,而是先找到這些任務背后的共享結構??臻g,就是它給出的答案。ACE-Brain提出了一種新的具身智能世界觀:不同身體不一定要從頭學起,它們可以先共享一個關于世界的空間理解,再在這個基礎上長出各自的能力。未來的具身智能體,無需再為單一形態定制模型,只需基于ACE-Brain的空間智能底座,就能快速適配新的物理本體與應用場景。從自動駕駛到低空經濟,從工業機器人到家庭服務設備,展現出面向真實物理世界多場景的平臺潛力。

該技術成果已上傳:

https://arxiv.org/abs/2603.03198

Project Page:

https://ace-brain-team.github.io/ACE-Brain-0

Code:

https://github.com/ACE-BRAIN-Team/ACE-Brain-0

Hugging Face:

https://huggingface.co/ACE-Brain/ACE-Brain-0-8B

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    31125

    瀏覽量

    222444
  • 開源
    +關注

    關注

    3

    文章

    4224

    瀏覽量

    46207
  • 模型
    +關注

    關注

    1

    文章

    3762

    瀏覽量

    52133

原文標題:全球首創,刷新19個SOTA!大曉機器人開源空間智能通用模型ACE-Brain-0

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    資訊速遞 | 具身智能PMC(籌)發布“零成本”開源鴻蒙智能機器人系統

    面向具身智能機器人系統與應用開發,Ubuntu 等操作系統可以用 ROS2 生態、機器人仿真器、英偉達算力。 然而在國產化方面,開源鴻蒙操作系統缺失 ROS2 支持、缺失與
    的頭像 發表于 01-05 16:24 ?463次閱讀
    資訊速遞 | 具身<b class='flag-5'>智能</b>PMC(籌)發布“零成本”<b class='flag-5'>開源</b>鴻蒙<b class='flag-5'>智能</b><b class='flag-5'>機器人</b>系統

    機器人發布開悟3.0,國產世界模型機器人擁有“超級大腦”

    機器人的使命就是讓每個機器人都擁有一個聰明的大腦,洞察萬物,學會與視覺精準交互。 ? 在此背景下,大機器人憑借其原創的“世界模型”技術體系
    的頭像 發表于 12-25 09:25 ?2552次閱讀
    大<b class='flag-5'>曉</b><b class='flag-5'>機器人</b>發布開悟3.0,國產世界<b class='flag-5'>模型</b>讓<b class='flag-5'>機器人</b>擁有“超級大腦”

    中科曙光與商湯科技、大機器人達成戰略合作

    12月18日,在首屆光合組織人工智能創新大會(HAIC2025)主論壇上,中科曙光與商湯科技、大機器人正式達成戰略合作。
    的頭像 發表于 12-23 15:10 ?426次閱讀

    商湯科技聯合創始剛擔任大機器人董事長

    機器人將于12月18日正式亮相,重磅發布多項全球領先的技術與產品陣列,并將推出首個國內開源且實現商業應用的“開悟”世界模型3.0,與行業伙伴一同構建自主可控、開放共贏的產業體系。商
    的頭像 發表于 12-08 11:31 ?669次閱讀

    探索RISC-V在機器人領域的潛力

    應用,特別是機器人操作系統領域的可行性。MUSE Pi Pro以其強大的K1 AI CPU和官方對主流開源軟件棧的積極適配,成為了一個非常有吸引力的選擇。 二、 硬件初窺:性能小鋼炮 MUSE Pi Pro
    發表于 12-03 14:40

    開源鴻蒙驅動機器人與AI產業生態發展,M-Robots OS正式開源

    7月24日,2025開放原子開源生態大會——開源鴻蒙助力機器人與人工智能產業生態發展論壇在北京順利舉行,本次分論壇聚焦機器人和人工
    的頭像 發表于 07-26 14:20 ?1164次閱讀
    <b class='flag-5'>開源</b>鴻蒙驅動<b class='flag-5'>機器人</b>與AI產業生態發展,M-Robots OS正式<b class='flag-5'>開源</b>

    工業機器人的特點

    的基礎,也是三者的實現終端,智能制造裝備產業包括高檔數控機床、工業機器人、自動化成套生產線、精密儀器儀表、智能傳感器、汽車自動化焊接線、柔性自動化生產線、智能農機、3D 打印機等領域。
    發表于 07-26 11:22

    全國首個開源鴻蒙機器人操作系統 M-Robots OS 正式開源

    機器人操作系統M-RobotsOS,推動機器人行業生態融合、能力復用、智能協同。構建機器人共通語言解決產業協同難題機器人行業正面臨兩大關鍵挑
    的頭像 發表于 07-24 10:56 ?1040次閱讀
    全國首個<b class='flag-5'>開源</b>鴻蒙<b class='flag-5'>機器人</b>操作系統 M-Robots OS 正式<b class='flag-5'>開源</b>

    明遠智睿SSD2351開發板:語音機器人領域的變革力量

    在人工智能快速發展的今天,語音機器人逐漸成為人們生活和工作中的得力助手。明遠智睿SSD2351開發板憑借強大性能與豐富功能,為語音機器人的發展注入新動力,成為該領域的變革力量。 SSD2351開發板
    發表于 05-28 11:36

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    視覺巡線,展示了如何從數據采集、模型訓練到機器人部署的完整流程。 值得注意的是,深度學習模型的實時性對機器人計算資源提出了較高要求,優化模型
    發表于 05-03 19:41

    【「# ROS 2智能機器人開發實踐」閱讀體驗】機器人入門的引路書

    ROS的全稱:Robot Operating System 機器人操作系統 ROS的 目的 :ROS支持通用庫,是通信總線,協調多個傳感器 為了解決機器人里各廠商模塊不通用的問題,讓
    發表于 04-30 01:05

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品

    全球80多個國家和地區。 近日,大象機器人聯合進迭時空推出全球首款RISC-V全棧開源六軸機器臂“myCobot 280 RISC-V”,為開發者打造全新的機器人
    發表于 04-25 17:59

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發
    的頭像 發表于 03-20 16:56 ?1749次閱讀

    NVIDIA發布全球首個開源人形機器人基礎模型Isaac GR00T N1

    NVIDIA 宣布推出一系列全新技術,助力人形機器人開發。其中包括全球首個開源且完全可定制的基礎模型NVIDIA Isaac GR00T N1,該模型可賦能
    的頭像 發表于 03-20 14:34 ?1752次閱讀

    英偉達GROOT N1 全球首個開源人形機器人基礎模型

    英偉達GROOT N1 全球首個開源人形機器人基礎大模型
    的頭像 發表于 03-20 11:05 ?2164次閱讀