對乳腺癌的早期篩查一直是機器學習的一個熱門研究方向,可是已有的篩查模型大多數(shù)依賴于白人女性樣本,因此對于非白人女性的篩查準確率令人堪憂。
最近麻省理工開發(fā)的新模型不僅很好地解決了這個問題,而且還能夠提前五年篩查出乳腺癌病患!
這一項突破性研究,標志著深度學習技術推動下的醫(yī)學進步,可以提前了解病情,做針對性治療,這對于病患來說,是一大福祉。
Regina Barzilay和Lehman與CSAIL博士生的主要作者Adam Yala共同撰寫了這篇論文。
已有的篩查模型
之前的疾病篩查模型大多是CNN(卷積神經(jīng)網(wǎng)絡)的改良版本,CNN是前饋神經(jīng)網(wǎng)絡,模擬人的視覺對于圖像的理解。網(wǎng)絡結構中的卷積核提取圖像的邊緣、輪廓等信息,Relu等激活函數(shù)模擬大腦對于外界信號刺激的應答,對提取到的圖像信息做整合,淺層卷積層提取到局部的圖像信息,層數(shù)越深的卷積層能提取到全局的圖像信息,在CV(Computer Version)領域也稱為感受野(Receptive Field),CNN網(wǎng)絡模型對于圖像的分類任務處理十分友好,下圖很好地展示了CNN網(wǎng)絡的結構和原理:

CNN圖像理解示意圖
疾病篩查任務也就是二分類任務,對于輸入的圖像,需要得到是否患病的判斷。給醫(yī)學圖片做標簽(在計算機科學中標記為0或1,0表示沒有患病,1表示患病),在模型中,通過Label(標記)好圖片的訓練和反向傳播的參數(shù)調(diào)整,使得模型具備一定的學習能力,最終能夠?qū)ξ礃擞浀尼t(yī)學圖片做疾病篩查。但是訓練的結果依靠數(shù)據(jù)集的好壞,已有的很多乳腺癌預測數(shù)據(jù)集都偏向于白人女性的研究,鮮少考慮到其他族裔。麻神理工大學研究人員開發(fā)的診斷模型考慮到了這一點。
將研究擴展到少數(shù)族裔
麻省理工的研究人員在一篇博客中指出,事實上這個看起來不起眼的一個細節(jié)是乳腺癌預測的關鍵:因為黑人女性死于乳腺癌的概率比白人女性高 42%。而正是目前的乳腺癌早期診斷技術中對黑人女性的診斷模型缺失造成了這一巨大差異,因為包括黑人女性在內(nèi)的少數(shù)族裔樣本在已有的深度學習模型開發(fā)中通常鮮有被考慮進去。
而麻省理工的研究人員表示,他們對乳腺癌預測模型的研究正是為了彌補這一缺陷,他們希望通過這一研究提高對少數(shù)族裔健康評估的準確性。針對同一個問題的研究同時也是近期很多業(yè)界公司研究和產(chǎn)品開發(fā)的重心。
模型結果表明,對于黑人和白人女性的預測效果都相當好。
之所以強調(diào)對黑人與白人女性的效果一樣好,是因為研究人員在開發(fā)過程中發(fā)現(xiàn)同類的人工智能模型存在大量偏差——因為它們對樣本的采集嚴重地傾向白人女性,黑人女性則很少。因此來自麻省理工的研究團隊仔細地設計了他們的模型,使得它對于兩種族裔的女性都能夠很好地作出預測。
基于風險評估的提前預測
麻省理工學院教授Regina Barzilay本人是一名乳腺癌幸存者,她表示希望這樣的系統(tǒng)能讓醫(yī)生在個人層面定制篩查和預防計劃,使得晚期診斷成為歷史。
所有性別都有患乳腺癌的風險,而大部分人通常認為只影響女性。自1989年第一個乳腺癌風險模型以來,研究者發(fā)展患乳腺癌的風險在很大程度上取決于人類的知識和對主要危險因素的直覺,如年齡、乳腺癌和卵巢癌的家族史、激素和生殖因素以及乳房密度。
然而,這些標志物中的大多數(shù)僅與乳腺癌微弱相關。因此,這些模型在個人層面上仍然不是很準確,并且鑒于這些限制,許多組織仍然認為基于風險的篩查計劃是不可能的。
另一方面,“自20世紀60年代以來,放射科醫(yī)生已經(jīng)注意到女性在乳房X線照片上可以看到獨特且變化很大的乳房組織模式,”Lehma說。“這些模式可以代表遺傳,激素,懷孕,哺乳,飲食,體重減輕和體重增加的影響。我們現(xiàn)在可以在個人層面的風險評估中更準確地利用這些詳細信息。”
不同于已有的預測模型,麻省理工計算機與人工智能實驗室開發(fā)出的模型準確地將31%的癌癥患者置于風險最高的類別,而傳統(tǒng)模型僅為18%,可以至多提前五年預測乳腺癌細胞發(fā)展。
數(shù)據(jù)集來源
MIT / MGH團隊不是手動識別乳房X線照片中驅(qū)動未來癌癥的模式,而是訓練深度學習模型直接從數(shù)據(jù)中誘導模式。麻省理工開發(fā)的這一預測模型的開發(fā)基于超過六萬名來自麻省總醫(yī)院(Massachusetts General Hospital)的病人樣本,其中包括超過九萬份乳房X光檢查報告和病人們病情發(fā)展情況。
這一模型從這些數(shù)據(jù)出發(fā),通過深度學習甚至能夠辨識出一些人類醫(yī)生都無法辨認出的病情。因為已有的關于乳腺癌的假設和風險因素都充其量是一個指導性的判斷框架,而麻省理工的這個模型并不是基于類似的框架,因此模型的準確性在預測性診斷和預篩查方面會更加準確。
總結與展望
總的來說,麻省理工計算機與人工智能實驗室的這一項目旨在協(xié)助醫(yī)生們?yōu)椴∪吮M早選擇正確的治療方案,而不是像現(xiàn)在的大多數(shù)情況下一樣,在病人們的病情惡化甚至發(fā)展到晚期時才告訴他們這一殘酷的事實。
同時,最近在nature中也有報道,對于BRCA1和BRCA2基因的突變檢測也能更有效地開展乳腺癌的治療。
展望未來,來自麻省理工的團隊希望能夠用這一技術來提高其他類似疾病的預測準確性,如通過掃描腦部結構,可以對阿爾茨海默病和多發(fā)性硬化癥做預測,同理也可以對心血管疾病做預測。只要針對某種疾病的研究已經(jīng)有成型的風險模型,這一技術就有可能大大提高對它預診斷的準確性。
-
麻省理工
+關注
關注
0文章
40瀏覽量
12520 -
人工智能
+關注
關注
1817文章
50105瀏覽量
265533
原文標題:乳腺癌預測模型只有白人女性數(shù)據(jù),MIT剛剛把它擴展到了所有族裔
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
UPS電池總“罷工”?在線監(jiān)測讓隱患無所遁形!
能耗管理系統(tǒng)的實時監(jiān)控功能:讓能源浪費無所遁形
MedCognetics利用AMD平臺優(yōu)化乳腺癌檢測
廣州郵科光纜檢測系統(tǒng):讓光纖故障“無所遁形”的智能守護者
利用麥科信示波器的分段存儲功能捕捉單次異常信號
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
博世持續(xù)引領人工智能的應用與開發(fā)
云翎智能礦用本安型防爆巡檢記錄儀,讓隱患無所遁形的電子礦工
當智能 “眼睛” 遇見制造業(yè),質(zhì)檢迎來新革命
開售RK3576 高性能人工智能主板
基于C2000實時MCU,這款AI 拉弧檢測方案讓噪聲無所遁形
電力健康的‘聽診器’——電能質(zhì)量分析儀,讓隱患無所遁形
智能識別外破隱患 輸電線路可視化監(jiān)拍裝置讓風險無所遁形
人工智能提前五年預測乳腺癌,讓疾病無所遁形!
評論