衛冕“雙冠”! 通用語言能力并列國內榜首、多模態能力全球最強,商湯「日日新V6」近期斬獲“雙料第一”。
5月28日,權威大模型測評機構SuperCLUE《中文大模型基準測評2025年5月報告》全新出爐!商湯「日日新 V6」(SenseNova-V6 Reasoner)憑借出色的綜合能力表現,以62.96分的優異成績,與Doubao-1.5-thinking-pro并列國內第一,摘得金牌,并在智能體Agent測試任務中獲得國內最高分。

同時,根據Hugging Face——全球最大的AI開源社區上的數據,在Open Compass本月的多模態大模型評測榜單中,商湯「日日新 V6」(SenseNova-V6 Pro)曾以80.4的總分,超越Gemini 2.5 Pro,位居第一,成為全球最強多模態大模型。

這是商湯日日新大模型半年內第二次斬獲“雙冠”! 今年年初,商湯日日新就用同一個模型,在SuperCLUE《中文大模型基準測評2024年度報告》評測和OpenCompass多模態多模態評測中,獲得雙第一,不但引發強烈關注,還引領了業界大語言模型和多模態大模型的一統化大潮。 此次成功衛冕“雙冠”——同時在通用語言和多模態兩大權威榜單中奪冠,意味著商湯「日日新V6」已成為全球最領先的大模型之一,持續引領多模態大模型突破AI能力邊界。
憑借多模態長思維鏈訓練、全局記憶、強化學習等技術創新,商湯「日日新V6」以單一模型即可完成文本、多模態等多種任務,在推理、數理、代碼等方面擁有顯著優勢,能夠深度理解人類意圖,處理各類復雜信息和復雜問題,為真實的業務應用提供強大助力。同時,商湯「日日新 V6」的多模態訓練整體效率對齊語言訓練,實現業內最優水平,推理成本亦實現業界最低。
得益于高效能與低成本的完美結合,商湯「日日新V6」自今年4月發布以來,獲得了行業各界的廣泛支持,已在具身智能、智慧教育、智慧文旅等領域攜手多家合作伙伴,將共同推動多行業、多場景落地。
秉承“大裝置-大模型-應用”三位一體的發展戰略,商湯科技通過AI基礎設施系統與模型算法的聯合優化,使模型的多模態和深度思考能力不斷提升,訓練與推理成本持續降低,推動生成式AI飛速發展,快速融入“百姓之日用”。
-
商湯科技
+關注
關注
8文章
613瀏覽量
37582 -
大模型
+關注
關注
2文章
3683瀏覽量
5206
原文標題:一項國內榜首,一個全球第一
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
商湯科技正式開源空間智能模型日日新SenseNova-SI-1.3
避繁就簡!商湯日日新大模型靈性巧解數學難題,獲贊“機器的審美”
商湯科技日日新Seko系列模型與寒武紀成功適配
百度文心大模型5.0-Preview文本能力國內第一
商湯日日新V6.5多模態大模型登頂全球權威榜單
小米AI眼鏡×商湯日日新 商湯“日日新”大模型交互平臺「商量」已探索性接入小米AI眼鏡
商湯科技日日新V6大模型斬獲“雙料第一” 一項國內榜首,一個全球第一
評論