生成式AI正為醫療大模型迭代按下加速鍵。
近日,商湯科技聯合行業合作伙伴,結合生成式人工智能和醫療圖像數據的多中心聯邦學習發表的最新研究成果《通過分布式合成學習挖掘多中心異構醫療數據》(MiningMulti-Center Heterogeneous Medical Data with Distributed Synthetic Learning),登上國際頂級學術期刊Nature子刊《自然-通訊》(NatureCommunications)。
研究成果提出一個基于分布式合成對抗網絡的聯邦學習框架DSL(DistributedSynthetic Learning),可利用多中心的多樣性醫療圖像數據來聯合學習圖像數據的生成。
?DSL框架包含一個中央生成器和多個分布式鑒別器,每個鑒別器位于一個醫療實體中。經過訓練的生成器可以作為“數據生產工廠”,為下游具體任務的學習構建數據庫
?不同應用中生成數據示例:(a) 心臟CTA,(b) 大腦多模態MRI,(c) 病理圖像;生成的數據構成大數據庫可用于下游具體任務模型的學習,例如:(d) 全心分割,(e) 腦腫瘤分割,(f) 細胞核分割
?WAIC期間商湯科技展示大模型在醫療領域的多個落地應用案例
《自然-通訊》主要發表自然科學各個領域的高質量研究成果,影響因子16.6。
研究成果提出一個基于分布式合成對抗網絡的聯邦學習框架DSL(DistributedSynthetic Learning),可利用多中心的多樣性醫療圖像數據來聯合學習圖像數據的生成。
該分布式框架通過學習得到一個圖像數據生成器,可以更靈活地生成數據,進而可替代多中心的真實數據,用于下游具體機器學習任務的訓練,并具備較強可擴展性。
伴隨大模型快速發展,Model as a Service(MaaS,模型即服務)正成為一大趨勢。MaaS的大模型需要從海量的、多類型的數據中學習通用特征和規則,從而具備較強的泛化能力。
DSL框架能在保護數據隱私的同時,巧妙解決醫療大模型訓練中常見的數據量不足的瓶頸,有效賦能MaaS的大模型訓練。
在這一技術支撐下,商湯“醫療大模型工廠”能夠幫助醫療機構更高效、高質量地訓練針對不同臨床問題的醫療大模型,使大模型在醫療領域的應用半徑得以延伸。
兼顧隱私保護和數據共享
創新聯邦學習模式打造
“數據生產工廠”
深度學習模型需要大量且多樣性的數據“喂養”。
醫療領域對用戶隱私保護有著極高要求,使得模型訓練的醫療數據在多樣性和標注質量上都受到限制,也使多中心的醫療數據收集和醫療AI模型的開發迭代面臨較大挑戰。
如何調和隱私保護和數據共享協作的矛盾?
“聯邦學習提供了全新的解題思路。聯邦學習是一種分布式機器學習方法, 可以在不共享數據的情況下對多中心的數據進行聯合建模,聯合學習某一特定應用模型。”
與主流的聯邦學習模式不同,DSL框架的學習目標是數據生成器,而非具體應用的任務模型。
該分布式架構由一個位于中央服務器的數據生成器和多個位于不同數據中心的數據鑒別器組成。
在學習過程中,中央生成器負責生成“假”的圖像數據,并發送給各個數據中心,各個數據中心用本地的真實數據和“假”數據進行對比后將結果回傳給中央服務器,并基于反饋結果訓練中央生成器生成更仿真的圖像數據。
分布式的合成學習結束后,中央生成器可作為“數據生產工廠”,根據給定的約束條件(標注)生成高質量仿真圖像數據,從而得到一個由生成數據組成的數據庫。
該數據庫可替代真實數據,用于下游具體任務的學習,使下游模型的更新迭代不再受到真實數據可訪問性制約。同時,該方法通過分布式架構和聯邦學習方式保證中央服務器無需接觸數據中心真實數據,也不需要同步各中心的鑒別器模型,有效保障了數據安全和隱私保護。
?DSL框架包含一個中央生成器和多個分布式鑒別器,每個鑒別器位于一個醫療實體中。經過訓練的生成器可以作為“數據生產工廠”,為下游具體任務的學習構建數據庫
賦能MaaS新生態
為醫療大模型開發迭代
按下加速鍵
DSL框架已通過多個具體應用的驗證。
包括:大腦多序列MRI圖像生成及下游的大腦腫瘤分割任務,心臟CTA圖像生成及下游的全心臟結構分割任務,多種器官的病理圖像生成及細胞核實例分割任務等。
在可擴展性方面,該方法還可支持多模態數據中缺失模態數據的生成、持續學習等不同場景。
?不同應用中生成數據示例:(a) 心臟CTA,(b) 大腦多模態MRI,(c) 病理圖像;生成的數據構成大數據庫可用于下游具體任務模型的學習,例如:(d) 全心分割,(e) 腦腫瘤分割,(f) 細胞核分割DSL框架的構建,也有利于推動MaaS服務模式發展。
MaaS的醫療大模型在數據學習過程中,同樣會遇到醫療數據隱私安全保護問題。基于DSL框架,可以有效地從多中心多樣性數據中建立數據集倉庫,通過生成數據,為大模型的開發迭代提供創新思路。
細化到具體應用場景,DSL框架可助力醫療機構高效開展跨中心、跨地域模型訓練工作。
不同區域醫療機構在疾病數據多樣性方面存在明顯地域性差異,過去受限于數據安全和隱私保護要求,使用跨中心醫療數據聯合訓練醫療模型難度大。而借助DSL框架,有望幫助醫療機構更加高效便捷地開展跨中心醫療模型訓練。
在2023 WAIC世界人工智能大會上,商湯科技與行業伙伴合作推出醫療大語言模型、醫療影像大模型、生信大模型等多種垂類基礎模型群,覆蓋CT、MRI、超聲、內鏡、病理、醫學文本、生信數據等不同醫療數據模態。并展示了融入醫療大模型的升級版“SenseCare智慧醫院”綜合解決方案,以及多個醫療大模型落地案例。
借助商湯大裝置的超大算力和醫療基礎模型群的堅實基礎,商湯得以成為“醫療大模型工廠”,幫助醫療機構針對不同臨床問題高效訓練模型,甚至輔助機構實現模型自主訓練。
?WAIC期間商湯科技展示大模型在醫療領域的多個落地應用案例
隨著DSL框架的推出,醫療大模型訓練將有望突破“數據孤島”的桎梏,一定程度上降低醫療大模型的訓練門檻,有助于加速模型開發迭代,使醫療大模型的應用范圍得以覆蓋更多臨床醫療問題。
商湯科技將持續聚焦醫療機構的多樣化需求,推動醫療大模型在更多醫療場景落地。 點擊“閱讀原文“查看論文詳情

相關閱讀,戳這里
《多場景落地!商湯打造“醫療大模型工廠”引領智慧醫療持續創新》
《嘉會醫療與商湯科技達成戰略合作》

原文標題:解決醫療大模型訓練數據難題,商湯最新研究成果登「Nature」子刊
文章出處:【微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
商湯科技
+關注
關注
8文章
609瀏覽量
37555
原文標題:解決醫療大模型訓練數據難題,商湯最新研究成果登「Nature」子刊
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
熱點推薦
避繁就簡!商湯日日新大模型靈性巧解數學難題,獲贊“機器的審美”
、字節跳動,讓數學與AI同臺碰撞,開展了一場真刀真槍的“圖靈測試”。 現場,面對數學家拋出的難題,商湯科技“日日新”大模型在解答復分析計算積分、微分幾何證明等問題中,展示了驚人的進化力。 在計算一個復雜的廣義積分
商湯醫療以世界模型重塑智慧醫療未來圖景
近日,一場以“智啟新生,醫領未來”為主題的啟航盛典正式拉開帷幕。這不僅是商湯醫療完成新一輪融資后的首次公開亮相,更是一次對智慧醫療未來圖景的深度詮釋與前瞻展望。
Nature傳感器新子刊第一篇論文出爐,中國青年學者聯手撰寫
? ? 近期,知名學術期刊《Nature》(《自然》)旗下專注于傳感器研究領域的子刊《Nature Sensors》,刊發了創刊以來的第一篇
中國科研團隊發布稀土材料最新成果
據央視新聞報道中國科研團隊發布稀土材料最新成果;日前又黑龍江大學、清華大學和新加坡國立大學合作完成的稀土材料突破性研究成果在《Nature》正式發表,標志著科研團隊成功攻克絕緣性稀土納米晶的高效
奧比中光3D視覺技術賦能IROS 2025研究成果
全球機器人領域最具影響力的學術會議IROS 2025于10月19日至25日在杭州國際博覽中心舉行。大會收錄的多篇論文的研究成果采用了奧比中光的3D視覺技術,涵蓋自動化掃描、空間建模、人機交互等前沿方向,彰顯了奧比中光在全球機器人與AI視覺研究領域的底層支撐地位。
模板驅動 無需訓練數據 SmartDP解決小樣本AI算法模型開發難題
算法作為軟實力,其水平直接影響著目標檢測識別的能力。兩年前,慧視光電推出了零基礎的基于yolo系列算法架構的AI算法開發平臺SpeedDP,此平臺能夠通過數據驅動模型訓練,實現算法從0到1的開發
商湯大裝置重磅發布多項標志性成果
在2025世界人工智能大會(WAIC 2025)期間,作為“最懂大模型的AI基礎設施”,商湯大裝置重磅發布多項標志性成果,持續打造AI基礎設施發展新范式,力推動產業生態與應用場景的系統化落地。
NVIDIA展示機器人領域的研究成果
在今年的機器人科學與系統會議 (RSS) 上,NVIDIA 研究中心展示了一系列推動機器人學習的研究成果,展示了在仿真、現實世界遷移和決策制定領域的突破。
Nullmax端到端自動駕駛最新研究成果入選ICCV 2025
近日,國際計算機視覺大會 ICCV 2025 正式公布論文錄用結果,Nullmax 感知團隊在端到端自動駕駛方向的最新研究成果《HiP-AD: Hierarchical
后摩智能與高校合作研究成果榮獲ISCA 2025最佳論文獎
近日,北京后摩智能科技有限公司與北京大學集成電路學院孫廣宇長聘副教授團隊、上海交通大學張宸助理教授團隊、香港科技大學謝源講席教授團隊、東南大學司鑫副教授團隊及阿里巴巴達摩院合作的研究成果
NVIDIA在ICRA 2025展示多項最新研究成果
在亞特蘭大舉行的國際機器人與自動化大會 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領域的多項研究成果。
解決醫療大模型訓練數據難題,商湯最新研究成果登「Nature」子刊
評論