今日,商湯正式開源多模態自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在多模態搜索與推理的核心基準測試中以 69.74 分超越Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。

SenseNova-MARS是首個支持動態視覺推理和圖文搜索深度融合的 Agentic VLM 模型,它能自己規劃步驟、調用工具,輕松搞定各種復雜任務,讓AI真正具備“執行能力”。
在 MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等基準測試中,SenseNova-MARS取得開源模型中的 SOTA 成績,還超越Gemini-3.0-Pro、GPT-5.2等頂級閉源模型,在搜索推理和視覺理解兩大核心領域全面領跑。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
開源
+關注
關注
3文章
4290瀏覽量
46360 -
模型
+關注
關注
1文章
3802瀏覽量
52225 -
商湯
+關注
關注
0文章
94瀏覽量
4412
發布評論請先 登錄
相關推薦
熱點推薦
商湯科技正式開源空間智能模型日日新SenseNova-SI-1.3
商湯科技正式開源空間智能模型日日新SenseNova-SI-1.3,在空間測量、視角轉換、綜合推理等核心任務中展現出顯著提升,另外對比之前的版本增強了回答簡答題的能力。
商湯科技日日新V6.5榮獲2025年多模態大模型全國第一
近日,權威大模型評測基準 SuperCLUE 發布《中文多模態視覺語言模型測評基準12月報告》,商湯日日新V6.5(SenseNova V6.5 Pro)以75.35的總分位列國內第一
1688 多模態搜索從 0 到 1:逆向接口解析與 CLIP 特征匹配實踐
本文分享基于CLIP模型與逆向工程實現1688圖片搜同款的實戰方案。通過抓包分析破解接口簽名,結合CLIP多模態特征提取與Faiss向量檢索,提升搜索準確率至91%,單次響應低于80ms,日均選品效率提升4倍,全程合規可復現。
商湯日日新V6.5多模態大模型登頂全球權威榜單
根據權威評測平臺OpenCompass多模態大模型學術榜單(Multi-modal Academic Leaderboard)最新數據顯示,商湯「日日新 V6.5」(SenseNova
米爾RK3576部署端側多模態多輪對話,6TOPS算力驅動30億參數LLM
首輪推理延遲,適配對響應速度敏感的車載、醫療等場景;
其二,多模態融合再升級—— 在圖文基礎上集成語音、傳感器數據,實現 “看 + 聽 + 感知” 的跨模態對話;
其三,生態適配再拓展
發表于 09-05 17:25
基于米爾瑞芯微RK3576開發板的Qwen2-VL-3B模型NPU多模態部署評測
關鍵詞:瑞芯微 RK3576、NPU(神經網絡處理器)、端側小語言模型(SLM)、多模態 LLM、邊緣 AI 部署、開發板、RKLLM隨著大語言模型(LLM)技術的快速迭代,從云端集中式部署到端側
發表于 08-29 18:08
商湯科技多模態通用智能戰略思考
時間是最好的試金石,AI領域尤其如此。當行業熱議大模型走向時,商湯早已錨定“多模態通用智能”——這是我們以深厚研究積累和實踐反復驗證的可行路徑。
商湯日日新SenseNova融合模態大模型 國內首家獲得最高評級的大模型
近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態大模型首輪評估。 商湯日日新SenseNova融合模態大模型在所有模型中
突破無風扇工控機技術天花板,聚徽廠家這些方案你知道嗎?
,隨著技術的迅猛發展以及應用場景需求的不斷攀升,無風扇工控機在散熱、性能、防護等方面面臨著諸多挑戰,亟待突破技術天花板。接下來,讓我們一同探尋那些能夠突破無風扇工控機技術瓶頸的創新方案。 一、高效散熱方案革新
商湯科技日日新V6大模型斬獲“雙料第一” 一項國內榜首,一個全球第一
衛冕“雙冠”! 通用語言能力并列國內榜首、多模態能力全球最強,商湯「日日新V6」近期斬獲“雙料第一”。 5月28日,權威大模型測評機構SuperCLUE《中文大模型基準測評2025年5月報告》全新
商湯開源SenseNova-MARS:突破多模態搜索推理天花板
評論