近日,國家互聯網信息辦公室公布第十四批深度合成服務算法備案信息,瑞為技術自研的“Reconova QTune瑞為蜻豚視覺大模型算法”成功入選,正式獲得國家級算法備案資質。

蜻豚視覺大模型是以通用視覺語義理解為核心,融合異構傳感器輸入與動態專家路由架構,解決復雜場景下的感知與認知決策問題,目前已成功應用于曉蟻行李轉運機器人、曉瑞旅服機器人等實體場景。
2025年,蜻豚視覺大模型在全球權威評測平臺OpenCompass輕量級模型(參數量<4B)中位列第四,在精度與效率的平衡上達到領先水平。

構建全棧技術閉環,重塑視覺認知邊界
瑞為蜻豚視覺大模型基于“感知-理解-規劃”一體化架構,通過多項關鍵技術實現視覺能力系統升級:
全棧訓練架構
支持預訓練、有監督微調(SFT)到強化學習偏好優化(RLHF/GSPO)的全流程訓練,結合混合精度訓練與參數高效微調技術(LoRA/QLoRA),降低算力需求。
采用Encoder動態平鋪與Token智能壓縮,兼容多源數據與長視頻理解,結合視覺強化微調(RFT)提升模型泛化與跨任務遷移能力,適配多場景部署。
高效推理引擎
基于混合專家(MoE)架構,實現動態專家路由,平衡精度與效率。
通過分層量化與蒸餾技術,將10B級模型壓縮為輕量化版本,并借助匯編級指令優化,支持端側低功耗運行。
集成檢索增強(RAG)技術,接入實時知識圖譜,構建端到端推理閉環,實現從感知到自主任務規劃,推動模型向高效可用化演進,助力交通、商業等場景普惠應用。
深耕場景化落地,驅動產業智能化變革
瑞為蜻豚視覺大模型已在實際業務場景中驗證其價值,包括曉蟻行李轉運機器人通過多模態感知與動態路徑規劃,實現機場行李轉運的全程自動化;曉瑞旅服機器人依托長視頻語義解析與意圖理解能力,為旅客提供精準的導引與問答服務。
這些應用不僅體現了模型在復雜環境中的魯棒性,更彰顯瑞為技術“技術-場景-產業”深度融合的落地策略。
未來,瑞為技術將繼續以“通用視覺語義理解”為核心,聯合產業伙伴共建開放生態,推動視覺大模型在更多垂直領域行業和場景的應用,助力中國人工智能的高質量發展,以人工智能構建更美好社會生活。
-
算法
+關注
關注
23文章
4786瀏覽量
98213 -
瑞為技術
+關注
關注
0文章
26瀏覽量
1593 -
大模型
+關注
關注
2文章
3684瀏覽量
5211
原文標題:喜訊!瑞為技術蜻豚視覺大模型算法通過國家網信辦備案
文章出處:【微信號:reconova,微信公眾號:瑞為技術Reconova】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
洲明科技自研山隱大模型完成雙備案
東風太極大模型通過國家生成式人工智能服務備案
元服務配置備案信息
萬里紅文本生成算法通過國家網信辦備案
思必馳一鳴智能客服大模型通過生成式人工智能服務備案
中車斫輪大模型通過國家生成式人工智能服務備案
華盛昌DeepSense深度感測大模型通過生成式人工智能服務備案
工業制造為什么是 AI 大模型的深水區?
國家級認證!拓維海云天“中文手寫體作文圖像識別評分生成算法”通過國家網信辦備案
國家網信辦約談英偉達
瑞為技術蜻豚視覺大模型算法通過國家網信辦備案
評論