在 2025 中國信通院深度觀察報告會上,許志遠副總工程師指出,具身智能正經歷認知與物理智能的“雙螺旋”突破,但模型、數據、形態路線三大爭議未決,大規模落地尚處早期。若想突破現存瓶頸,亟需完成技術架構、數據體系、商業化形態的三重躍升。
技術突破與數據革命
破解落地的核心瓶頸
具身智能落地核心,是模型架構的升級迭代。
許志遠提出 LLM→VLM→VLA 的三階段演進路徑:LLM 賦予模型“思考能力”,VLM 實現視覺-語言跨模態感知,VLA 完成“感知—思考—動作”閉環。

*圖片源于互聯網,供參考
在工業領域,ALVA 純視覺系統基于雙大模型架構,通過“指令輸入→視覺理解→策略生成→群體共享”流程,支持自然語言或動作示范直接訓練機器人,真正做到“具備情境理解與自主規劃能力”的、實現“感知-認知-決策-執行”全棧具身智能。
在 VLA 基礎上引入“世界模型”,是提升環境適應能力的關鍵。許志遠強調,世界模型可理解、預測物理世界,降低真實數據依賴;且“數據革新需推動產業級協作”。
基于生產數據和實時環境數據,ALVA 純視覺系統可在虛擬環境中預先進行模擬決策訓練,豐富的決策經驗和龐大的數據庫,支撐其結合現場環境迅速理解語音指令并執行精準作業,還能不斷吸收人工發出的決策指令的特征,反向優化自身決策水平。
商業化驗證
從“技術秀”到“市場贏”的關鍵路徑抉擇
技術落地的核心爭議是形態路線選擇,當前主要以“人形堅守派”與“折中派”對立。
特斯拉等堅持全人形路線,但受到國情以及經濟發展趨勢影響,國內企業更加強調工業場景可落地性,多采用“輪—臂式復合機器人”—折中路線憑借部署簡單、成本可控的優勢,是現階段平衡技術與商業的最優解,也符合“落地優先于完美”的行業節奏,為技術迭代積累真實數據與反饋。
ALVA 純視覺系統以開創性技術打響國產化替代的“關鍵一槍”。系統融合 AI 大模型與高精度動態視覺感知,核心算法 100% 自主研發。
基于空間計算實時反饋,在機械人執行精密作業時,“手-眼-腦”多位協同實現位姿動態補償優化,可在機械臂高速運動、AMR 自主導航等動態場景中,實現微米級重復定位精度。
ALVA 純視覺系統憑借其百元級的硬件成本,輕量化外觀可靈活適配多種載體,其群體智能進化架構實現經驗共享,更為中小企業構建可成長的智能化產業生態,為具身智能大規模市場化推廣夯實普惠基座。
據 DIC 報告預測,2025 年,全球具身智能機器人用戶支出規模預計超過 14 億美元,2030 年將飆升至 770億 美元,年均復合增長率(CAGR)高達 94%。如此可觀的增量市場,更為行業劃出了未來發展的方向標:全球及中國市場均呈現爆發式增長態勢,仍需技術突破、政策支持、產業鏈完善共同推動行業從“技術展示”向“商業閉環”跨越。
未來展望
人機共生的通用智能時代
據專家預測,具身智能長遠發展將呈現三大趨勢:一是跨具身能力成核心競爭力;二是端到端泛化升級;三是人機共生落地;未來具身智能將按“工業制造—商業服務—家庭服務”順序滲透,逐步“飛入尋常百姓家”。
許志遠強調,具身智能發展的核心矛盾在于,技術突破與落地挑戰的艱難平衡;摩根士丹利的市場預測也印證了行業前景,當技術創新與商業實踐達成平衡,機器人融入生活的科幻場景將從實驗室大步邁向現實。
當智能機體真正融入產業肌理、走進生活日常,技術的微光終將匯聚成照亮未來的星河,讓“機器賦能人類”的初心,在科技與人文的交融中歷久彌新。
關于 ALVA Systems
ALVA Systems 專注增強現實/人工智能等空間智能相關技術的自主創新,成立十余年始終深耕底層算法研發與優化,擁有自研算法引擎并拓展豐富創新產品與應用,是全球空間智能領域的核心供應商。
在工業領域,公司重點致力于基于空間智能技術和制造業的深度結合應用,經過充分實踐,形成了豐富完善的產品線,讓不同行業企業利用既有資源敏捷實現 AI 價值,Anyone can AI ! 開拓了廣域的應用空間,是國際工業物聯網與“數字孿生”解決方案的領跑者。
-
視覺系統
+關注
關注
3文章
378瀏覽量
31828 -
具身智能
+關注
關注
0文章
389瀏覽量
857
原文標題:專家觀點 | 從實驗室到市場大規模落地,具身智能破局之路在何方?
文章出處:【微信號:ALVA Systems,微信公眾號:ALVA Systems】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
具身智能:感知(視覺)→決策(具身智能)→執行(自動化)
2025開放原子開發者大會具身智能分論壇成功舉辦
ALVA亮相2025中國國際數字經濟博覽會
節卡機器人將攜具身智能成果亮相2025世界機器人大會 面向真實場景多點落地
英特爾? 具身智能大小腦融合方案發布:構建具身智能落地新范式
ALVA純視覺系統如何破解具身智能大規模落地的核心瓶頸
評論