大部分新冠重癥患者在六個月后依然會有較為嚴重的呼吸系統后遺癥,比如肺活量下降等。其它肺炎的呼吸系統后遺癥通常由肺部損傷導致,然而多項研究表明,新冠重癥患者出院6個月后的胸部CT和正常人區別不大: 大約一半的重癥出院患者CT無法找到任何異常,另外一半僅可見極少量的纖維化區域。因此,新冠呼吸系統后遺癥是否源于肺部損傷,需要進一步研究。
近期,黑龍江拓盟科技有限公司邱兆文博士科研課題小組與哈爾濱醫科大學附屬第一醫院、東北林業大學、沙特阿卜杜拉國王科技大學合作在Nature Machine Intelligence 發表《An interpretable deep learning workflow for discovering subvisual abnormalities in CT scans of COVID-19 inpatients and survivors》,用機器學習發現并量化了新冠重癥出院患者胸部CT中肉眼不可見的異常,并進一步證明了這些異常與新冠呼吸后遺癥有極強的相關性。
量化肉眼不可見的肺損傷分為兩大步驟。第一步是把這些肉眼不可見的損傷用可解釋的方式展現給醫療專家,第二步是讓醫療專家標注出哪些地方是損傷,并訓練模型去自動量化這些肺損傷。下圖展示了第一步,圖中的CT來自于一個有嚴重呼吸后遺癥的新冠重癥出院患者:左邊是原始的CT,肉眼看和正常人無異,右邊是用機器學習模型增強后的,能看到大范圍的纖維化病變。原始CT看不到這些肺損傷,是因為CT信號取值范圍極寬(-1000到3000),而這些肺損傷的CT信號和健康肺組織差異很?。ㄆ骄s25);另外肺部的氣管、血管等組織因為很強的CT信號值也會較大程度上干擾對肺損傷的觀察。因此,為了能讓醫學專家看清這些肺損傷,邱兆文博士科研課題組首先訓練了各種肺組織分割模型,去除了血管,氣管等無關組織,然后統計肺內CT值為每個病人自動地計算了觀察肺損傷最優的信號區間:例如患者A最佳的觀察范圍是CT信號 -720 到 -800,患者B最佳觀察范圍是CT信號 -650 到 -740。這樣肺損傷就清晰了十幾倍,得到了下圖右邊的樣子。第二步,醫學專家給肺損傷進行標注,作者們利用標注實現了對這些肺損傷的自動分割和量化,量化得到了6個肺損傷指標。作者將這一套流程簡稱為DLPE。
DLPE模型的成功不僅在于它流程的新穎性,更在于它實現了最優秀的血管分割和氣管分割。氣管和血管具有自相似性,作者證明了小血管、小氣管的體積是極小的:占據總長度50%的最細的氣管(血管)僅僅占據總體積的6.60%和6.11%。因此,用傳統的損失函數,比如dice loss,cross-entropy loss等,模型無需分割小血管、小氣管,就已經收斂了。為了解決這個問題,作者提出了feature-enhanced loss,其核心思想是讓每一級血管(氣管)得到相同的“關注”:每一級血管(氣管)總和的loss weight是相同的。這樣,DLPE實現了對小氣管、小血管的精確分割。為了解決DLPE的泛化能力,作者提出了two-stage segmentation protocol:第一個階段確定氣管和血管的大體位置,將搜索空間縮小了上千倍;第二個階段得到最后的血管和氣管分割。這樣,DLPE可以在各種不同的數據上進行穩定的預測。
DLPE有著可解釋的流程。其中的分割模型是基于2.5D模型:訓練的時候刻意隱藏了3D長程結構特征,預測時通過長程結構的重構來檢驗預測結果是否正確。對于肺損傷的增強、radiomics的量化,則是用傳統算法(非深度學習)。
總結:
這是一篇很有特色的醫學影像論文。文章從尚未解決的醫學問題入手,和醫學專家一起,開發了DLPE算法,發現了新冠呼吸系統后遺癥與長期肺損傷有很強的關聯,是計算機專家和醫學專家合作的好例子。DLPE算法也可用于其它肺部CT的分析,比如去掉scan-level bias來增強其它模型的性能等等。