12月16日,中文醫療大模型權威評測平臺MedBench4.0發布最新評測結果。云知聲自主研發的“山海醫療大模型(UniGPT?Med)”展現出全面領先的技術實力,一舉斬獲醫療智能體、醫療大語言模型、醫療多模態大模型三項技術范式,成為本次評測中表現最為突出的“三冠王”。

其中,UniGPT?Med?U1在醫療大語言模型評測中以綜合得分65.7分登頂,力壓Grok-4(58.4)Claude-Sonnet-4.5、Gemini-2.5-Pro、GPT-5等一眾國際頂尖模型。同時,在醫療智能體評測中以綜合得分94.6分的優異成績,大幅領先第二名Claude-Sonnet-4.5(88.8)近6分;

MedBench4.0-醫療大語言模型評測榜單

MedBench4.0-醫療智能體評測榜單
UniGPT?Med?VL則在醫療多模態大模型評測中以綜合得分59.6分摘得桂冠,領先第二名GPT-5(53.7分)近6分,展現出絕對技術優勢。

MedBench4.0-醫療多模態大模型評測榜單
MedBench評測平臺由上海人工智能實驗室、上海市數字醫學創新中心聯合多家權威機構共同打造,以其科學、公平、嚴謹的評測體系著稱。2025年11月20日,該平臺全面迭代更新至4.0版本,成為全國首個且唯一面向垂直模型、專用模型及各應用場景的醫療大模型評測與驗證體系。本次升級聚焦實戰化評測突破與生態化開放共建兩大核心,全面覆蓋醫療大語言模型、醫療多模態大模型及醫療智能體三大技術范式,并深度對齊國家《衛生健康行業人工智能應用場景參考指引》,旨在為醫療AI從技術可行走向臨床可用搭建關鍵的驗證橋梁。
基于嚴格的醫學標準,平臺構建了高質量、多維度、覆蓋廣泛的評測集。其中,醫療大語言模型評測涵蓋5大能力維度、36個專業子集,約70萬條數據;醫療多模態大模型評測聚焦3大核心能力、10個專業子集;醫療智能體評測則圍繞6大行動維度設置了14個復雜任務集。在此嚴苛且全面的評估框架下,山海大模型能夠一舉奪得三項冠軍,充分彰顯了其極高的技術含金量與實用價值。
此次評測的卓越表現,得益于山海醫療大模型最新版本完成的系統性核心升級。新版本致力于構建業界能力維度最豐富的醫療AI技術支撐體系,其核心亮點在于實現了“醫學文本大模型”與“醫學多模態大模型”雙核心產品體系的深度融合,全面覆蓋從文本處理、智能體協同到影像解析的多元功能,形成了當前能力維度最豐富的醫療AI技術架構。
通過深度融合模擬臨床思維的復雜推理能力,模型實現了精準的鑒別診斷與循證決策支持;同時,原生內化的任務規劃、工具調用與多智能體協作等核心能力,推動其完成了從“醫學認知大腦”向“自主醫療行動者”的關鍵進階,能夠高效適配并執行復雜的真實醫療任務流程。
在多模態能力方面,新版本展現出對臨床場景的深度賦能。它不僅能夠精準識別X光、CT、MRI等多種醫學影像中的病灶與解剖結構,高效提取醫療文檔關鍵文本信息,更支持跨模態語義對齊與聯合推理,能夠融合影像特征與臨床描述進行綜合判斷,為臨床決策提供多源數據支撐的精準建議。
權威榜單的成績是技術實力的顯性證明,而真正的價值在于臨床實踐的檢驗與認可。依托該模型,云知聲推出了覆蓋診療全流程的“智慧醫療產品矩陣”,涵蓋智能病歷生成與質控、臨床輔助決策、醫療質量監管、醫保支付智能審核以及智慧患者服務等核心產品。這些產品已深入醫政管理、臨床診療、運營管理和患者服務等關鍵環節,并在全國部署近400家醫院,700余家醫院進入測試階段。其中覆蓋北京協和醫院、北京友誼醫院、東南大學附屬中大醫院、青島大學附屬醫院等數百家國內頂級三甲醫院。
在提升診療效率與質量方面,落地案例成效顯著。例如,門診病歷生成系統能夠實時捕捉醫患之間的對話內容,智能提取關鍵問診信息,并自動生成結構化病歷。醫生僅需進行簡單審核,即可完成病歷書寫工作。目前該系統已在北京友誼醫院順義院區廣泛應用,單份病歷直接引用率接近90%,大幅降低了醫生文書負擔;智能病歷質控系統能夠精準理解病歷內容,并智能識別其中的書寫錯誤與缺陷。系統對影像描述、專業術語進行細致分析,并對檢查結果、檢查結論以及檢查依據進行深度解讀,從而實現高效、精準的病歷質控;DRG/DIP醫保支付管理系統以智能提醒和數據分析兩種方式,從診療過程中、醫保結算前到醫保結算后,為醫生、質控員、編碼員和醫保處提供全流程、全方位的醫保支付管理服務。該系統成功助力中國人保財險完成核賠風控AI醫療審核系統的全國性部署。
作為AGI技術的先行者,云知聲始終致力于以專業大模型和全棧自研AI技術解決產業核心問題。山海醫療大模型在三大核心評測維度的全能奪冠,標志著其技術體系實現了從底層認知、多模態理解到上層智能體執行的全棧式、一體化突破,為醫療AI的深度臨床應用樹立了新的標桿。
未來,云知聲將繼續深耕醫療AI領域,持續推動更加安全、可靠、智慧的醫療AI解決方案在廣泛場景中落地應用,賦能醫療服務體系的質量與效率升級,為助力健康中國建設貢獻堅實的科技力量。
-
醫療
+關注
關注
8文章
2000瀏覽量
61589 -
云知聲
+關注
關注
0文章
315瀏覽量
9361 -
大模型
+關注
關注
2文章
3648瀏覽量
5179
原文標題:云知聲山海醫療大模型問鼎MedBench4.0三項榜首,以“三冠王”戰績樹立醫療AI新標桿
文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
云知聲正式推出Unisound U1-OCR文檔智能基礎大模型
云知聲發布“山海·知音”大模型2.0,醫療AI加速落地驅動業績高增長
云知聲山海醫療大模型問鼎MedBench4.0三項榜首
評論