强奸乱伦精品一区,久久久精品一级毛片外国,国产精品一区二区免费

近年來，基于大數(shù)據(jù)預(yù)訓(xùn)練的多模態(tài)基礎(chǔ)模型 (Foundation Model) 在自然語言理解和視覺感知方面展現(xiàn)出了前所未有的進展，在各領(lǐng)域中受到了廣泛關(guān)注。在醫(yī)療領(lǐng)域中，由于其任務(wù)對領(lǐng)域?qū)I(yè)知識的高度依賴和其本身細(xì)粒度的特征，通用基礎(chǔ)模型在醫(yī)療領(lǐng)域的應(yīng)用十分有限。因此，如何將醫(yī)療知識注入模型，提高基礎(chǔ)模型在具體診療任務(wù)上的準(zhǔn)確度與可靠性，是當(dāng)前醫(yī)學(xué)人工智能研究領(lǐng)域的熱點。在此背景之下，上海交通大學(xué)與上海人工智能實驗室聯(lián)合團隊探索了基于醫(yī)學(xué)知識增強的基礎(chǔ)模型預(yù)訓(xùn)練方法，發(fā)布了首個胸部 X-ray 的基礎(chǔ)模型，即 KAD（Knowledge-enhanced Auto Diagnosis Model）。該模型通過在大規(guī)模醫(yī)學(xué)影像與放射報告數(shù)據(jù)進行預(yù)訓(xùn)練，通過文本編碼器對高質(zhì)量醫(yī)療知識圖譜進行隱空間嵌入，利用視覺 - 語言模型聯(lián)合訓(xùn)練實現(xiàn)了知識增強的表征學(xué)習(xí)。在不需要任何額外標(biāo)注情況下，KAD 模型即可直接應(yīng)用于任意胸片相關(guān)疾病的診斷，為開發(fā)人工智能輔助診斷的基礎(chǔ)模型提供了一條切實可行的技術(shù)路線。

KAD 具有零樣本（zero-shot）診斷能力，無需下游任務(wù)微調(diào)，展現(xiàn)出與專業(yè)醫(yī)生相當(dāng)?shù)木龋?/p>

KAD 具有開放疾病診斷（open-set diagosis）能力，可應(yīng)用于胸片相關(guān)的任意疾病診斷；

KAD 具有疾病定位能力，為模型預(yù)測提供可解釋性。

研究論文《Knowledge-enhanced Visual-Language Pre-training on Chest Radiology Images》已被知名國際期刊《自然 - 通訊》（Nature Communications）接收。論文作者為張小嫚、吳超逸、張婭教授，謝偉迪教授（通訊），王延峰教授（通訊）。

論文鏈接：https://arxiv.org/pdf/2302.14042.pdf

代碼模型鏈接：https://github.com/xiaoman-zhang/KAD

模型介紹 KAD 模型的核心是利用醫(yī)學(xué)先驗知識引導(dǎo)基礎(chǔ)模型預(yù)訓(xùn)練，第一階段，該研究利用醫(yī)學(xué)知識圖譜訓(xùn)練一個文本知識編碼器，對醫(yī)學(xué)知識庫在隱空間進行建模；第二階段，該研究提出放射報告中提取醫(yī)學(xué)實體和實體間關(guān)系，借助已訓(xùn)練的知識編碼器來指導(dǎo)圖像與文本對的視覺表征學(xué)習(xí)，最終實現(xiàn)了知識增強的模型預(yù)訓(xùn)練。具體流程如圖 1 所示。

圖 1:KAD 的模型架構(gòu) 知識編碼器 知識編碼器的核心是在特征空間隱式地建立醫(yī)學(xué)實體之間的關(guān)系。具體來說，該研究將統(tǒng)一醫(yī)學(xué)語言系統(tǒng) (Unified Medical Language System，UMLS) 作為醫(yī)學(xué)知識庫，如圖 1a 所示；通過對比學(xué)習(xí)訓(xùn)練文本編碼器，將醫(yī)學(xué)知識注入模型，如圖 1b 所示。 知識引導(dǎo)的視覺表征學(xué)習(xí) 知識編碼器訓(xùn)練完成后，模型在文本特征空間已經(jīng)建立了醫(yī)學(xué)實體之間的關(guān)系，即可用于引導(dǎo)視覺表征學(xué)習(xí)。具體來說，如圖 1c 所示，基于胸片 - 報告對的數(shù)據(jù)，首先進行實體提取，得到常見疾病的集合及其標(biāo)簽，該研究嘗試了三種方法：基于 UMLS 啟發(fā)式規(guī)則的實體提取、基于報告結(jié)構(gòu)化工具 RadGraph 的實體提取以及基于 ChatGPT 的實體提取；在模型層面，該研究提出了基于 Transformer 架構(gòu)的疾病查詢網(wǎng)絡(luò)（Disease Query Networks），以疾病名稱作為查詢 (query) 輸入，關(guān)注 (attend) 視覺特征以獲得模型預(yù)測結(jié)果；在模型訓(xùn)練過程中，該研究聯(lián)合優(yōu)化圖像 - 文本對比學(xué)習(xí)和疾病查詢網(wǎng)絡(luò)預(yù)測的多標(biāo)簽分類損失。經(jīng)過上述兩階段的訓(xùn)練，在模型使用階段，如圖 1d 所示，給定一張圖像以及查詢的疾病名稱，分別輸入圖像編碼器和知識編碼器，經(jīng)過疾病查詢網(wǎng)絡(luò)，即可得到查詢疾病的預(yù)測。同時可以通過疾病查詢網(wǎng)絡(luò)得到注意力圖對病灶進行定位，增強模型的可解釋性。 實驗結(jié)果 研究團隊將僅在 MIMIC-CXR [1] 上使用圖像和報告預(yù)訓(xùn)練的 KAD 模型，在多個具有不同數(shù)據(jù)分布的公開數(shù)據(jù)集上進行了系統(tǒng)性評測，包括 CheXpert [2], PadChest [3], NIH ChestX-ray [4] 和 CheXDet10 [5]。MIMIC-CXR 數(shù)據(jù)收集于貝斯以色列女執(zhí)事醫(yī)療中心（Beth Israel Deaconess Medical Center,BIDMC）是，CheXpert 數(shù)據(jù)收集于美國斯坦福醫(yī)院（Stanford Hospital），PadChest 數(shù)據(jù)收集于西班牙圣胡醫(yī)院（San Juan Hospital），NIH ChestX-ray 和 CheXDet10 數(shù)據(jù)來自于美國國立衛(wèi)生研究院（National Institutes of Health）臨床 PACS 數(shù)據(jù)庫。 (1) KAD 零樣本診斷能力與專業(yè)放射科醫(yī)生精度相當(dāng) 如圖 2 所示，該研究將預(yù)訓(xùn)練的 KAD 模型在 CheXpert 數(shù)據(jù)上進行評測，在其中的五類疾病診斷任務(wù)與放射科醫(yī)生進行了比較，圖中 Radiologists 表示三名放射科醫(yī)生的平均結(jié)果。KAD 在五類疾病診斷任務(wù)上的平均 MCC 超過了 Radiologists，且在其中三類疾病的診斷結(jié)果顯著優(yōu)于放射科醫(yī)生，肺不張 atelectasis (KAD 0.613 (95% CI 0.567, 0.659) vs. Radiologists 0.548)；肺水腫 edema (KAD 0.666 (95% CI 0.608, 0.724) vs. Radiologists 0.507)；胸腔積液 pleural effusion (KAD 0.702 (95% CI 0.653, 0.751) vs. Radiologists 0.548)。該結(jié)果證實了基于知識增強的模型預(yù)訓(xùn)練的有效性。

圖 2：KAD 在 CheXpert 數(shù)據(jù)集上與基線模型以及放射科醫(yī)生的比較 (2) KAD 零樣本診斷能力與全監(jiān)督模型相當(dāng)，支持開放集疾病診斷 如圖 3a 所示，在 PadChest 上的零樣本診斷性能大幅度超越此前所有多模態(tài)預(yù)訓(xùn)練模型（例如 Microsoft 發(fā)布的 BioVIL [6]，Stanford 發(fā)布的 CheXzero [7]），與全監(jiān)督模型 (CheXNet [8]) 相當(dāng)。此外，全監(jiān)督的模型的應(yīng)用范圍受限于封閉的訓(xùn)練類別集合，而 KAD 可以支持任意的疾病輸入，在 PadChest 的 177 個未見類別的測試中，有 31 類 AUC 達(dá)到 0.900 以上，111 類 AUC 達(dá)到 0.700 以上，如圖 3b 所示。

圖 3：KAD 在 PadChest 數(shù)據(jù)集上與基線模型的比較 (3) KAD 具有疾病定位能力，為模型預(yù)測提供可解釋性 除了自動診斷能力，可解釋性在人工智能輔助醫(yī)療的作用同樣關(guān)鍵，能夠有效幫助臨床醫(yī)生理解人工智能算法的判斷依據(jù)。在 ChestXDet10 數(shù)據(jù)集上對 KAD 的定位能力進行了定量分析與定性分析。如圖 4 所示，KAD 的定位能力顯著優(yōu)于基線模型。圖 5 中，紅色方框為放射科醫(yī)生提供的標(biāo)注，高亮區(qū)域為模型的熱力圖，從中可以看出模型所關(guān)注的區(qū)域往往能與醫(yī)生標(biāo)注區(qū)域?qū)?yīng)上，隨著輸入圖像的分辨率增加，模型的定位能力也顯著增強。需要強調(diào) 這是模型設(shè)計的優(yōu)勢，是在無需人工病灶區(qū)域標(biāo)注情況下獲得的副產(chǎn)品。

圖 4: KAD 在 ChestXDet10 數(shù)據(jù)集上與基線模型的比較

圖 5：KAD 的定位結(jié)果可視化 總結(jié) 醫(yī)療領(lǐng)域的專業(yè)性，導(dǎo)致通用基礎(chǔ)模型在真實臨床診療場景下的應(yīng)用十分受限。KAD 模型的提出為基于知識增強的基礎(chǔ)模型預(yù)訓(xùn)練提供了切實可行的解決方案。KAD 的訓(xùn)練框架只需要影像 - 報告數(shù)據(jù)，不依賴于人工注釋，在下游胸部 X-ray 診斷任務(wù)上，無需任何監(jiān)督微調(diào)，即達(dá)到與專業(yè)放射科醫(yī)生相當(dāng)?shù)木龋恢С珠_放集疾病診斷任務(wù)，同時以注意力圖形式提供對病灶的位置定位，增強模型的可解釋性。值得注意的是，該研究提出的基于知識增強的表征學(xué)習(xí)方法不局限于胸部 X-ray，期待其能夠進一步遷移到醫(yī)療中不同的器官、模態(tài)上，促進醫(yī)療基礎(chǔ)模型在臨床的應(yīng)用和落地。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴