
圖1. 數據集A(a-c)和數據集B(d-f)的視網膜OCT圖像及標注說明
近期,中國科學院上海光學精密機械研究所高端光電裝備部研究團隊在醫學圖像處理領域取得重要突破。相關研究成果以“TranSegNet: Hybrid CNN-Vision Transformers Encoder for Retina Segmentation of Optical Coherence Tomography”為題發表于LIFE-BASEL。
OCT技術憑借非侵入、高分辨的優勢,成為眼科疾病檢測的“金標準”。然而,視網膜層及病灶的精準分割面臨巨大挑戰:圖像噪點、血管陰影、病理結構形態差異等均可能影響傳統算法性能。手動標注依賴專家經驗,耗時長且主觀性強。既往基于卷積神經網絡(CNN)的模型雖取得進展,但局部感受野限制導致全局特征建模不足。
TranSegNet通過深度融合卷積神經網絡(CNN)與Vision Transformer(ViT)的優勢,構建了獨特的混合編碼架構。以輕量化的改進型U-Net骨干網絡為基礎,其通過多尺度分層卷積精準捕獲局部視網膜紋理特征,同時引入全局注意力機制,利用輕量化ViT模塊中的多頭卷積注意力層,突破傳統CNN的局部感受野限制,有效建模視網膜層間復雜的長程空間依賴關系。通過端到端輕量化設計,模型在不依賴預訓練的前提下,以56%的參數量縮減與每秒15幀的實時處理速度(NVIDIA RTX3070),實現視網膜層邊界分割誤差降低至5.29微米,并在黃斑積液等不規則病灶識別中表現出超越主流模型的魯棒性,為臨床高精度自動診斷提供了高效、可靠的解決方案。

圖2.(a)TranSegNet整體網絡結構 (b)Transformer層結構設計
該模型已成功應用于實驗室自建SD-OCT系統及美國杜克大學公開數據集,可精準分割視網膜8層結構及積液區域,生成定量化厚度圖譜,為早期青光眼、糖尿病視網膜病變的篩查提供自動化工具。研究團隊表示,TranSegNet的輕量化特性適配邊緣計算設備,未來將結合移動OCT設備實現基層醫療場景的快速診斷。
審核編輯 黃宇
-
數據集
+關注
關注
4文章
1236瀏覽量
26193 -
cnn
+關注
關注
3文章
355瀏覽量
23420
發布評論請先 登錄
上海光機所在高分辨率激光脈沖時域整形技術研究方面取得新進展
西安光機所在太赫茲超表面逆向設計領域取得新進展
上海光機所在光學相干斷層掃描技術研究上取得進展
評論