BMC Med | 血清紅外光譜分析對肺癌進展和生存期的評估
作為第一步,作者在沒有 IMF 參與的情況下定量調查了作者隊列的存活率。為此,應用了已建立的 Kaplan-Maier (KM) 估計器,這是用于模擬生存分布的最廣泛使用的非參數(shù)技術之一。圖 2 顯示了與不同級別的名義和有序協(xié)變量相關的生存概率隨時間的變化。為了提供研究的一般概述,作者將生存函數(shù)應用于所有涉及的研究患者,并進一步提供依賴于性別狀況的生存率(圖 2a)。在這種情況下,兩條性別特異性曲線僅略微偏離基線(拉動分析)。基于對數(shù)秩檢驗(參見方法部分)的兩條性別特異性曲線之間的統(tǒng)計比較產生了較大的 p 值p=0.41。將作者隊列的性別特異性生存曲線與羅伯特·科赫研究所 [ 43] 提供的整個德國的生存率進行比較,這些結果反映了類似的趨勢。女性的總生存率仍然略高于男性,與初次診斷時的 UICC 分期無關。然而,眾所周知,特定性別的存活率正朝著相反的方向發(fā)展:幾十年來,女性的存活率一直在下降,而男性的存活率在同一時期持續(xù)上升,現(xiàn)在已經接近女性的存活率。這種不同的發(fā)展可歸因于自 1990 年代末以來吸煙習慣的變化,并且可能會繼續(xù)下去。作者進一步研究了個體的生存功能是否揭示了可手術腫瘤與不可手術腫瘤患者的任何差異(見圖 2b)。正如預期的那樣,作者發(fā)現(xiàn)差異很大。執(zhí)行統(tǒng)計顯著性檢驗得到的 p 值為p<0.005。這意味著可手術腫瘤患者的生存機會明顯更高。在調查 TNM 分期是否與生存率相關時,作者預期地發(fā)現(xiàn),初步診斷為 TNM 分期較低的個體比初次診斷時 TNM 分期較高的個體存活時間更長(見圖 2c)。本例中的顯著性比較顯示 IV 期與其他階段之間存在顯著差異。對現(xiàn)有隊列的觀察結果反映了德國的趨勢,德國的生存曲線也隨著 UICC 分期的晚期而急劇下降:UICC I 期患者的 5 年相對生存率為女性 73%,男性為 63%,而只有 7% 的女性和 4% 的男性在被診斷為轉移性 IV 期肺癌后存活時間超過 5 年 [ 43]。作者之前表明,肺癌患者主要腫瘤直徑的大小與 IMF 偏差相關 [ 12]。在目前的研究中,作者著手專門調查 IMF 的偏差是否與所調查人群診斷時的 TNM 階段相關。圖 3 顯示了 IMF 與肺癌進展之間的密切關系。具體來說,在圖 3a 中,作者繪制了不同匹配的肺癌病例對照組(對照組是無癥狀的健康志愿者)的差異指紋,根據 TNM 分期分層。作者觀察到,與疾病相關的模式跨越了很寬的光譜范圍。特別是,1000 cm ?1 到 1700 cm ?1 之間的范圍包含與許多潛在生物分子相關的信息模式。該區(qū)域通常與蛋白質和碳水化合物(包括糖基化蛋白)的吸光度相關。因此,該區(qū)域的變化可能是由于它們的濃度、結構或糖基化模式的改變。最重要的是,作者的結果表明,通過血清 IMF 測量的血清中肺癌模式的強度與整個觀察到的波數(shù)范圍內的腫瘤分期相關。這在鑒別指紋中很明顯,其中觀察到的模式的振幅隨著疾病進展而持續(xù)增加,而整體模式保持不變。為了進一步研究這種關系,使用創(chuàng)建的分層匹配隊列,作者構建了分類模型,以評估每個腫瘤 TNM 分期分別區(qū)分肺癌病例和對照個體的能力。圖 3b 顯示了每個階段的結果經驗 ROC 曲線。觀察到的差異指紋強度與疾病進展之間的關系傳播到預測模型。盡管 II 期肺癌患者的 AUC 為 ROC 高于 0.70,但作者觀察到候選醫(yī)學測試檢測更高階段肺癌的能力進一步增加。然而,從這項分析中,無法確定檢測性能的增加是由疾病進展還是由 III 期和 IV 期可用樣本數(shù)量的增加引起的。為了進一步解決和研究這個問題,作者繼續(xù)對階段對 ROC 曲線的影響進行嚴格的建模。具體來說,作者利用了 ROC 曲線的所謂雙正態(tài)模型 [ 41]。該模型允許通過廣義線性回歸模型 (GLM) 對協(xié)變量效應(在本例中為 TNM 階段)進行嚴格研究。圖 3c 中顯示的次態(tài) ROC 曲線顯示了與實證結果完全一致的趨勢。此外,作者計算了假設的 p 值β,即捕捉肺癌分期對雙正常 ROC 曲線的影響的系數(shù) (參見方法部分)為零。由于這個 p 值遠低于 0.05,作者可以拒絕該假設并得出結論,肺癌分期對 ROC 曲線的影響是顯著的。因此,作者發(fā)現(xiàn)了一種可能的基于 IMF 的肺癌檢測診斷測試的系統(tǒng)性增加,以便在已經進展到后期時以更高的效率檢測肺腫瘤。作者的結果為先前發(fā)表的關于將腫瘤大小與紅外指紋畸變程度相關聯(lián)的研究提供了相關擴展和部分獨立確認 [ 12] – IMF 捕獲了血清中的腫瘤特異性模式。隨著訓練數(shù)據大小的增加,機器學習模型往往表現(xiàn)出更高的穩(wěn)健性。因此,可以預期每個特定疾病階段的 AUC 都會增加。在圖3d 中,作者試圖通過采用擬合飽和度函數(shù)的學習曲線來說明這種現(xiàn)象,如之前發(fā)表的工作 [ 42] 中所述。作者觀察到,隨著訓練數(shù)據量的增加,非轉移性和 IV 期(轉移性)病例的檢測性能在 AUC=0.9 以上飽和。盡管如此,轉移性組和非轉移性組之間最終 AUC 的差異似乎趨于穩(wěn)定,表明在大樣本量的限制下存在有限差異。除了通過 AUC 評估分類性能外,還可以衡量 IMF 捕獲的整體疾病特異性模式。這可以通過計算平均效應大小來實現(xiàn),該效應大小對應于所有波數(shù)上兩組之間的吸光度差異。在圖3e 中,顯示了每個階段的平均效應量的表示。出現(xiàn)一種明顯的模式,表明隨著疾病進展,差異指紋量級持續(xù)且顯著增加。在證明了 IMF 偏差幅度與肺癌進展之間的關系后,作者繼續(xù)研究 IMF 是否可以根據初步診斷時的 IMF 分析預測肺癌患者的未來生存率。為此,作者根據 IMF 數(shù)據使用 Cox 比例風險擬合患者生存回歸模型。為了評估這些模型的預后效用并將其與基于其他協(xié)變量(例如 TNM 分期)的模型進行比較,作者使用 k 折交叉驗證方法評估它們的性能。性能是使用 Harrell 的 C 指數(shù)來衡量的,該指數(shù)定義為模型可以根據生存時間正確排序的觀測值比例(參見“方法”部分),其中 0.5 表示隨機機會,值 1.0 對應于完美預測 [ 44]。使用所有 160 名患者,C 指數(shù)為 0.63 ± 0.12,表明生存信息確實編碼在 IMF 中。盡管很容易推測某些光譜位置會比其他光譜位置提供更多信息,但作者發(fā)現(xiàn)回歸容量的總體結果并非基于特定的紅外光譜特征,而是利用了整個光譜范圍的信息。為了更普遍地評估液體活檢中 IMF 的信息內容和能力,作者直接比較了其他診斷方法與 IMF 的能力 - 直接,在同一個體內 - 它們捕獲肺癌的能力。通過在10倍交叉驗證中評估經過訓練的 Cox 回歸模型上的 Harrell C 指數(shù)來完成比較。作者發(fā)現(xiàn) IMF 預測肺癌患者在初步診斷時生存的能力與需要侵入性組織采樣的組織病理學檢查(分期)的能力相當。此外,非常令人鼓舞的是,IMF 的能力與臨床診斷中實施的其他生物標志物(例如 NSE(神經元特異性烯醇化酶)、CEA(癌胚抗原)CYFRA-21-1(細胞角蛋白片段-21-1))相當,揭示了評估方法的有效性和潛力。作者進一步分析了 IMF 中編碼的生存信息。在這里,作者研究了在初次診斷后 1 年、2 年或 3 年內去世的未刪失個體的光譜與被刪失患者的光譜有何不同。在圖 4a 中,圖形表示說明了差分紅外光譜。這種描述突出了未經刪失的肺癌患者記錄數(shù)據中每個波數(shù)的平均方差,這些患者在初步診斷后 1、2 或 3 年內觀察到死亡。在這種情況下,對照組包括被審查的患者。陰影區(qū)域封裝了對照組中每個波數(shù)的標準偏差。這些結果新發(fā)現(xiàn),患者越接近最終死亡,通過 IMF 檢測到的肺癌特異性模式就越明顯。通過計算效應大?。ㄋ胁〝?shù)的平均值)可以得出相同的結論,如圖 4b 所示。為了進一步研究基于 IMF 的 Cox 回歸模型對風險的預測能力,在患者診斷的初始階段,作者使用預測的風險率作為死亡風險的相對衡量標準。在圖 4c 中,作者說明了基于 IMF 的風險率分布與腫瘤 TNM 分期之間的關聯(lián)。作者的研究結果揭示了一個明顯的趨勢(仍然沒有統(tǒng)計學意義),正如 IMF 分析所表明的那樣,死亡風險隨著階段的增加而增加。這種趨勢可以通過相關性分析更好地量化。通過直接計算,可以獲得風險比和階段之間的 Point-Biserial 相關性,在本例中為ρ=0.31,p 值 P=0.02。即使不是一個完全顯著的結果,觀察到的相關性也再次證實了上述 IMF 與疾病進展之間的關聯(lián)。此外,作者還探討了未刪失患者的預測風險率與觀察到的死亡時間之間的關系。圖 4d 顯示了隊列中包括的所有 76 名未刪失患者的風險率值與事件發(fā)生時間的關系散點圖。作者觀察到風險率與事件發(fā)生時間之間存在明顯的相關性。直接計算Pearson相關性也證實了這一點,在本例中為ρ=0.56,p值P=1.5×10-7。總結
總體而言,作者在紅外指紋與疾病進展之間建立了很強的相關性,特別是在腫瘤分期方面。此外,作者證明紅外指紋圖譜提供了對患者生存率的見解,其表現(xiàn)水平與腫瘤分期和相關基于血液的生物標志物相當。
本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請
點擊舉報。