国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

商湯科技正式開源多模態自主推理模型SenseNova-MARS

商湯科技SenseTime ? 來源:商湯科技SenseTime ? 2026-01-30 10:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今日,商湯正式開源多模態自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在多模態搜索與推理的核心基準測試中以 69.74 分超越Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。

SenseNova-MARS是首個支持動態視覺推理和圖文搜索深度融合的 Agentic VLM 模型,它能自己規劃步驟、調用工具,輕松搞定各種復雜任務,讓AI真正具備“執行能力”。

在 MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等基準測試中,SenseNova-MARS取得開源模型中的SOTA 成績,還超越Gemini-3.0-Pro、GPT-5.2等頂級閉源模型,在搜索推理和視覺理解兩大核心領域全面領跑。更多細節請參見技術報告(https://arxiv.org/abs/2512.24330),歡迎開發者、各行業用戶測試與體驗。

全能冠軍,自主解決復雜問題

SenseNova-MARS在多項多模態搜索評測中展現出明顯的領先優勢,平均得分達到 69.74 分,成功超過了 Gemini-3-Pro 的 69.06 分與 GPT-5.2 的 67.64 分。

0d8ae30c-fd24-11f0-92de-92fbcf53809c.png

在MMSearch 榜單(圖文搜索核心評測)中,模型以 74.27 分登頂,超越GPT-5.2(66.08 分);HR-MMSearch(高清細節搜索評測)中 54.43 分領先,顯著拉開與閉源模型的差距。

0df07820-fd24-11f0-92de-92fbcf53809c.png

HR-MMSearch的測試題目堪稱“AI界的奧林匹克”:采用305張2025年最新的4K超高清圖片,確保AI無法依賴舊知識“作弊”;所有問題都針對圖片中占比不到5%的細節,比如小標志、小字、微小物體,必須用圖像裁剪工具才能看清;覆蓋體育、娛樂文化、科學技術、商業金融、游戲、學術研究、地理旅行等八大領域,60%的問題都需要至少使用三種工具才能解答。

簡單說,無論是需要“查遍全網”的知識密集型任務,還是需要“火眼金睛”的細粒度視覺分析,它都是當前的“全能冠軍”。

用組合拳,解決真實場景問題

SenseNova-MARS還能實實在在落地到我們生活和工作的場景,解決需要“多步驟推理+多工具協作”的問題。

普通AI的工具調用,要么只能搜文字,要么只能看圖片,遇到需要“先放大細節、再識別物體、最后查背景”的復雜任務就束手無策。

面對識別賽車服微小logo +查詢公司成立年份+匹配車手出生年月+計算差值’的復雜任務,SenseNova-MARS可自主調用圖像裁剪、文本/圖像搜索工具,無需人工干預完成閉環解答。

SenseNova-MARS能從產品和行業峰會的照片中,識別企業的標志,快速搜集產品、企業的信息,以及時間、數量、參數等細節要素,輔助分析行業情況和格局。

SenseNova-MARS能從賽事照片中識別畫面中的logo、人物等信息,追溯比賽或人員背景信息,幫助快速補充重要細節。

SenseNova-MARS甚至能夠輕松處理,這類超長步驟的多模態推理,和超過三種工具調用,自動裁剪分析細節、搜索相關研究數據,快速驗證假設,得出關鍵判斷。

擁有這種“自主思考+多工具協作”的能力,SenseNova-MARS能夠自動解決“細節識別 + 信息檢索 + 邏輯推理”復雜任務,幫助實現工作效率提升。

圖像裁剪:能精準聚焦圖片上的微小細節,哪怕是占比不到5%的細節——比如賽車手衣服上的微小logo、賽事照片里觀眾席的標語,都可通過裁剪放大清晰分析。

圖像搜索:能在看到物體、人物或場景,的瞬間自動匹配相關信息——比如識別出賽車手的身份,或是某款冷門設備的型號。

文本搜索:能快速抓取精準信息——無論是公司成立年份、人物出生年月,還是最新的行業數據,都能秒級獲取。

從練中學,形成“經驗”和“直覺”

SenseNova-MARS采用了“因材施教”的訓練方法。

第一階段:打基礎。針對跨模態多跳搜索推理訓練數據稀缺的痛點,創新性的提出了基于多模智能體的自動化數據合成引擎,采用細粒度視覺錨點+ 多跳深度關聯檢索的機制,動態挖掘并關聯跨網頁實體的邏輯,自動化構建高復雜度的多跳推理鏈路,同時引入閉環自洽性校驗來去除幻覺數據,構造出具備嚴密邏輯鏈條與高知識密度的多跳搜索問答數據。用精心篩選的“高難度案例”做教材,每個案例都標注了“該用什么工具、步驟是什么”,讓AI先學會基本的“破案邏輯”。這些案例都是從海量數據中挑出的“硬骨頭”,確保AI一開始就接觸真實復雜場景。

第二階段:練實戰。采用“強化學習”——就像偵探在一次次破案中積累經驗,AI每做對一次決策(比如選對工具、步驟合理)就會獲得獎勵,做錯了就調整策略。為了避免AI“學偏”,研究團隊還加了個“穩定器”——BN-GSPO算法,讓它在處理簡單題和復雜題時都能保持穩定進步,不會出現“偏科”。 這種基于雙階段歸一化的優雅機制有效平滑了動態工具調用返回分布多樣性帶來的優化波動并確保了學習信號分布的一致性,從而成功解決了跨模態多步多工具智能體訓練過程中的收斂性難題。

經過這樣的訓練,AI不僅學會了用工具,更培養"工具使用直覺"——知道在什么情況下應該使用哪些工具,以及如何將不同工具的結果有機結合起來。

模型、代碼、數據全開源

商湯日日新SenseNova-MARS模型、代碼、數據集全開源,支持 Hugging Face 直接下載。

Github 倉庫:

https://github.com/OpenSenseNova/SenseNova-MARS

模型倉庫:

32B:

https://huggingface.co/sensenova/SenseNova-MARS-32B

8B:

https://huggingface.co/sensenova/SenseNova-MARS-8B

技術報告點擊“閱讀原文”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    4203

    瀏覽量

    46128
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52099
  • 商湯科技
    +關注

    關注

    8

    文章

    609

    瀏覽量

    37555

原文標題:商湯開源SenseNova-MARS:突破多模態搜索推理天花板

文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    商湯技正開源空間智能模型日日新SenseNova-SI-1.3

    商湯技正開源空間智能模型日日新SenseNova-SI-1.3,在空間測量、視角轉換、綜合推理
    的頭像 發表于 02-10 14:12 ?333次閱讀
    <b class='flag-5'>商湯</b>科<b class='flag-5'>技正</b>式<b class='flag-5'>開源</b>空間智能<b class='flag-5'>模型</b>日日新<b class='flag-5'>SenseNova</b>-SI-1.3

    商湯開源SenseNova-MARS:突破模態搜索推理天花板

    今日,商湯正式開源模態自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在
    的頭像 發表于 01-29 23:53 ?151次閱讀
    <b class='flag-5'>商湯</b><b class='flag-5'>開源</b><b class='flag-5'>SenseNova-MARS</b>:突破<b class='flag-5'>多</b><b class='flag-5'>模態</b>搜索<b class='flag-5'>推理</b>天花板

    阿里巴巴發布通義千問旗艦推理模型Qwen3-Max-Thinking

    今天,我們正式發布千問旗艦推理模型Qwen3-Max-Thinking,創下數項權威評測全球新紀錄。
    的頭像 發表于 01-27 15:47 ?374次閱讀
    阿里巴巴發布通義千問旗艦<b class='flag-5'>推理模型</b>Qwen3-Max-Thinking

    LLM推理模型是如何推理的?

    這篇文章《(How)DoReasoningModelsReason?》對當前大型推理模型(LRM)進行了深刻的剖析,超越了表面的性能宣傳,直指其技術本質和核心局限。以下是基于原文的詳細技術原理、關鍵
    的頭像 發表于 01-19 15:33 ?480次閱讀
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    商湯科技日日新V6.5榮獲2025年模態模型全國第一

    近日,權威大模型評測基準 SuperCLUE 發布《中文模態視覺語言模型測評基準12月報告》,商湯日日新V6.5(
    的頭像 發表于 01-06 14:44 ?615次閱讀
    <b class='flag-5'>商湯</b>科技日日新V6.5榮獲2025年<b class='flag-5'>多</b><b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>全國第一

    模態感知大模型驅動的密閉空間自主勘探系統的應用與未來發展

    ? ? 模態感知大模型驅動的密閉空間自主勘探系統 ? ?北京華盛恒輝模態感知大
    的頭像 發表于 12-29 11:27 ?296次閱讀

    商湯技正式發布并開源全新模態模型架構NEO

    商湯技正式發布并開源了與南洋理工大學S-Lab合作研發的全新模態模型架構 —— NEO,為日
    的頭像 發表于 12-08 11:19 ?1014次閱讀
    <b class='flag-5'>商湯</b>科<b class='flag-5'>技正</b>式發布并<b class='flag-5'>開源</b>全新<b class='flag-5'>多</b><b class='flag-5'>模態</b><b class='flag-5'>模型</b>架構NEO

    商湯日日新V6.5模態模型登頂全球權威榜單

    根據權威評測平臺OpenCompass模態模型學術榜單(Multi-modal Academic Leaderboard)最新數據顯示,商湯「日日新 V6.5」(
    的頭像 發表于 09-10 09:55 ?790次閱讀

    NVIDIA Nemotron Nano 2推理模型發布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發表于 08-27 12:45 ?1778次閱讀
    NVIDIA Nemotron Nano 2<b class='flag-5'>推理模型</b>發布

    澎峰科技完成OpenAI最新開源推理模型適配

    澎峰科技現已完成 OpenAI 最新開源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機上的原生適配與優化,用戶可一鍵啟用這顆“小而強悍”的新引擎,在本地享受企業級 AI 生產力!
    的頭像 發表于 08-14 11:34 ?1402次閱讀

    商湯科技模態通用智能戰略思考

    時間是最好的試金石,AI領域尤其如此。當行業熱議大模型走向時,商湯早已錨定“模態通用智能”——這是我們以深厚研究積累和實踐反復驗證的可行路徑。
    的頭像 發表于 08-14 09:33 ?1183次閱讀

    利用NVIDIA推理模型構建AI智能體

    開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務、網絡安全、制造、物流和機器人等領域的 AI 智能體生成更明智的結果。
    的頭像 發表于 08-13 14:32 ?1585次閱讀
    利用NVIDIA<b class='flag-5'>推理模型</b>構建AI智能體

    商湯日日新SenseNova融合模態模型 國內首家獲得最高評級的大模型

    近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI模態模型首輪評估。 商湯日日新SenseNova融合
    的頭像 發表于 06-11 11:57 ?1416次閱讀

    商湯科技日日新大模型SenseNova上線聲網云市場

    日前,商湯科技日日新大模型SenseNova即將正式上線聲網云市場,開發者和企業用戶可通過聲網的實時互動云服務進行調用,將商湯領先的模型能力
    的頭像 發表于 04-08 17:24 ?1488次閱讀

    詳解 LLM 推理模型的現狀

    領域的最新研究進展,特別是自DeepSeekR1發布后興起的推理時間計算擴展相關內容。在LLM中實施和改進推理簡單來說,基于LLM的推理模型是一種旨在通過生成中間
    的頭像 發表于 04-03 12:09 ?1611次閱讀
    詳解 LLM <b class='flag-5'>推理模型</b>的現狀