背景
隨著2017年底MSK和FMI的兩個(gè)大panel分別獲得FDA批準(zhǔn);2018年國(guó)外——百時(shí)美施貴寶的歐狄沃(CFDA:非小細(xì)胞肺癌)、的科瑞達(dá)(CFDA:黑色素瘤和ALK陰性的非鱗狀非小細(xì)胞肺癌)國(guó)內(nèi)——君實(shí)的特瑞普利單抗(CFDA:黑色素瘤)、信達(dá)的信迪利單抗(CFDA:霍奇金淋巴瘤)以及恒瑞5月份剛獲批的卡瑞麗珠單抗(CFDA:霍奇金淋巴瘤)先后上市(圖1A,圖1B)。 同時(shí)鑒于PD-1/PD-L1抗體只對(duì)每一種癌癥的一部分病人有效果(例如在肺癌中僅對(duì)大約30%的肺癌患者起效)。腫瘤突變負(fù)荷(TMB)作為PD-L1表達(dá)、MSI/dMMR 等之外的PD-1/PD-L1藥物療效的標(biāo)志物之一必然會(huì)受到進(jìn)一步的重視。
目前不少基因檢測(cè)公司直接將MSK和FMI兩家產(chǎn)品的基因取并集后再做簡(jiǎn)單的增添,推出500多個(gè)基因的大panel產(chǎn)品用來(lái)檢測(cè)TMB。但同時(shí)市面上一些先行者則在已有的400-500個(gè)gene的panel產(chǎn)品上直接升級(jí)到800-1100個(gè)基因的panel。最后市面上各家公司的大panel都宣稱適用于泛實(shí)體瘤的TMB評(píng)估,這個(gè)“泛實(shí)體瘤”的癌種范圍到底有多“泛”也值得推敲。接下來(lái)在該轉(zhuǎn)化醫(yī)學(xué)專題中分兩篇文章嘗試對(duì)TMB與panel設(shè)計(jì)進(jìn)行分析,本篇著重回答以下3個(gè)TMB相關(guān)問(wèn)題,下一篇著重分析panel設(shè)計(jì):
Question1: 不同數(shù)量級(jí)別的panel在不同癌種上的TMB與WES金標(biāo)準(zhǔn)的相關(guān)性差異以及指定TMB區(qū)間內(nèi)不同panel的TMB波動(dòng)情況又是怎么樣?
Question2: 大panel是否在各個(gè)癌種上與WES數(shù)據(jù)TMB相關(guān)性都比小的panel高?
Question3: 市面上從WES 的2,1000多個(gè)gene中抽取 1/40~1/20做出來(lái)的500-1000 gene 的各種panel,其TMB在“泛”癌種上都能代替WES測(cè)序?
a. 數(shù)據(jù)來(lái)源:2018年TCGA數(shù)據(jù)挖掘文獻(xiàn)和2015年腫瘤純度分析綜述文獻(xiàn);
b. TMB計(jì)算方法: CCDS區(qū)域的突變頻率在5%以上的插入/缺失、錯(cuò)義和無(wú)義突變(本次不采用FMI的去除熱點(diǎn)突變同時(shí)引入同義突變的TMB計(jì)算方法);
c. 模擬panel基因數(shù)目梯度設(shè)計(jì):S1: ~580 genes(MSK+FMI+其它),S2: ~670 genes (580+90);S3: 707genes (580+127); S4:~800 genes (580+90+127);S5: WES: 21,000 genes;
d. 外顯子區(qū)域: WES:下載current.CCDS.txt,提取exon區(qū)間后liftover轉(zhuǎn)換為hg19版本, panel:以gene為的單位提?。▏?yán)格來(lái)講應(yīng)根據(jù)染色體位置來(lái)匹配,本次偷懶,暫時(shí)不考慮約3%的一基因多名稱的干擾)。
一. 不同大小梯度的panel TMB與WES TMB在各癌種上的相關(guān)性分析
1.1 TMB數(shù)據(jù)分布特征分析
指定癌種病人TMB理論上整體偏低,數(shù)據(jù)不呈正態(tài)分布特征,Q-Q圖和Shapiro-Wilk正態(tài)分布檢驗(yàn)也支持以上推斷,因此后續(xù)相關(guān)分析結(jié)果以spearman為準(zhǔn),同時(shí)列出pearson相關(guān)系數(shù)以作比較。
1.2 四個(gè)不同梯度 panel TMB與WES TMB 在32個(gè)癌種上的相關(guān)性分析
固定TMB計(jì)算方法和輸入數(shù)據(jù),實(shí)際變量為panel大小,分析不同大小panel在不同癌種上的TMB與WES的相關(guān)性。
在葡萄膜黑色素瘤(UVM)、胰腺癌(PAAD)、直腸腺癌(READ)等癌種上pearson相關(guān)系數(shù)比spearman相關(guān)系數(shù)高了不止一點(diǎn)點(diǎn),由于pearson相關(guān)對(duì)異常值敏感,猜測(cè)本次分析的這些癌種TMB存在異常值。分析原始數(shù)據(jù),不管是用x±3S,還是其它方法,確實(shí)存在TMB異常高的個(gè)體,參考異常值處理中的四分位距替換法,以上三個(gè)癌種處理異常值后的pearson相關(guān)系數(shù)大幅下降,而對(duì)spearman相關(guān)影響不大。推測(cè)其它癌種效果相似,總之實(shí)際問(wèn)題中如果想省去數(shù)據(jù)分布特征及異常值情況評(píng)估這一步,應(yīng)直接使用spearman相關(guān)。
50%的癌種(16/32)上panel TMB與WES TMB的spearman相關(guān)性低于0.65,只是在常見(jiàn)的肺鱗癌、肺腺癌、皮膚黑色素瘤、結(jié)腸癌等癌種上有較好的spearman相關(guān)性(注意彌漫性大B淋巴細(xì)胞瘤本次只有33個(gè)數(shù)據(jù)),市面上各種 panel的TMB可能只適用于部分實(shí)體瘤相關(guān)的免疫治療評(píng)估;
臨床入組前準(zhǔn)確的腫瘤診斷分型很重要--例如:葡萄膜黑色素瘤與皮膚黑色素瘤、子宮內(nèi)膜癌與子宮肉瘤、結(jié)腸癌與直腸腺癌等,spearman相關(guān)系數(shù)相差很大(#準(zhǔn)確翻譯TCGA上的癌種英文名稱也很重要,第一版的翻譯就不準(zhǔn),后續(xù)圖中的癌種中文名以上面表格中的名稱為準(zhǔn));

從近600個(gè)基因增加到近800個(gè)基因后,大部分癌種上panel TMB與WES TMB的spearman相關(guān)性是有一定提升的(如上圖4),如腎嫌色細(xì)胞癌(KICH)上相關(guān)性提升了接近10%;但是在一些癌種如彌漫性大B淋巴瘤(DLBC)上,相關(guān)性反而降低5%左右(如下圖5)。所以本次模擬增加的基因只是提高了彌漫性大B淋巴瘤和胸腺癌以外其它30個(gè)癌種 TMB與WES相關(guān)性。


798 panel 和 579 panel在32個(gè)癌種上TMB相關(guān)系數(shù)近似正態(tài)分布;bartlett.test 方差齊性檢驗(yàn) p-value = 0.7411,顯示兩組數(shù)據(jù)離散程度相當(dāng),直接采用配對(duì)樣本T檢驗(yàn)做進(jìn)一步分析:WES和panel TMB spearman相關(guān)性均值之差為0.027,!=0,95%置信區(qū)間為:(0.017,0.038),p-value = 1.157e-05。將panel從600個(gè)gene級(jí)別增加到800個(gè)級(jí)別從32個(gè)癌種整體上看確實(shí)可以提高其TMB與WES的相關(guān)性。
二. 不同梯度panel 在給定10個(gè)區(qū)間上與WES TMB的比較
雖然2019年第一版的非小細(xì)胞肺癌NCCN指南中指出如何衡量TMB閾值目前還沒(méi)有達(dá)成共識(shí)(圖8A),但借鑒CheckMate-227研究中Opdivo(nivolumab)+ Yervoy(ipilimumab)聯(lián)合療法一線療法,對(duì)于高TMB(TMB≥10個(gè)/Mb,無(wú)論P(yáng)D-L1表達(dá)如何)的晚期非小細(xì)胞肺癌(NSCLC)達(dá)到了無(wú)進(jìn)展生存期(PFS)的結(jié)果(圖8B),本次的TMB區(qū)間應(yīng)在10左右上下浮動(dòng)。


以給定TMB區(qū)間的WES樣本為準(zhǔn),與落入該區(qū)間的樣本在各個(gè)模擬panel的TMB進(jìn)行比較,分析不同大小panel在同一批病人上檢出TMB的穩(wěn)定性:


隨著基因數(shù)目的增加,與WES 數(shù)據(jù)的TMB相比, panel TMB值分布的四分位圖中的離群點(diǎn)、上邊緣、下邊緣等指標(biāo)在指定10個(gè)區(qū)間中的5個(gè)區(qū)間有較為明顯的好轉(zhuǎn):5.5-6.49,6.5-7.49,8.5-9.49,9.5-10.49,10.5-11.49(也可以對(duì)10個(gè)TMB區(qū)間的四分位距做個(gè)Wilcoxon test,但本次劃分區(qū)間少,同時(shí)也反映不出來(lái)異常值信息,暫不做定量判斷);
常規(guī)TMB計(jì)算方法得到的TMB,panel都要比WES高一截,這其實(shí)正常--panel畢竟都是從2,1000多個(gè)基因中挑選腫瘤相關(guān)基因設(shè)計(jì)的,本身就帶有偏好性,如果接近程度很好就有些奇怪了--用bootstrap的方法從基因全集里面迭代出部分子集應(yīng)該可以做出好看的結(jié)果。
三. 小結(jié)
a. 不同癌種,影響其TMB的基因集合差異也較大,設(shè)計(jì)大panel前可以充分利用TCGA相關(guān)的開(kāi)源數(shù)據(jù),反復(fù)調(diào)試迭代,找到既能均衡部分癌種 panel TMB與WES TMB的相關(guān)性,又可以使得該 panel TMB在各個(gè)指定區(qū)間內(nèi)波動(dòng)較小的基因集合,簡(jiǎn)單的將FDA已公布的MSK和FMI的基因取交集是不夠的;
b. panel包含的gene越多,其TMB與WES的相關(guān)性越高、穩(wěn)定性越好的結(jié)論實(shí)際上是因癌種而異的,例如本次模擬的798panel,其TMB與WES的相關(guān)性在彌漫性大B淋巴瘤上的表現(xiàn)反而大幅下降(**注意本次僅使用33個(gè)DLBC樣本,而信迪利單抗和卡瑞麗珠單抗相關(guān)的霍奇金淋巴瘤的WES數(shù)據(jù)本次未引入);
c. 800個(gè)gene規(guī)模的panel得到的TMB確實(shí)會(huì)比500-600個(gè)基因的panel 穩(wěn)定一些;
d.不同的癌種存在不同的TMB cutoff值(如下圖8), 其具體數(shù)值必然受該panel設(shè)計(jì)的gene影響,大而全的panel在計(jì)算TMB時(shí)似乎可通過(guò)取子集的方式保證足夠的冗余度(僅限于部分癌種) ;
e. 如果不談銷售渠道提成,直接上500X的WES可能也是個(gè)行的通的辦法:一方面PD-1/PD-L1藥物的適應(yīng)癥一直在拓展,另一方面與panel相比,畢竟WES測(cè)序成本沒(méi)高多少,而且在近一半的癌種上panel TMB其實(shí)并沒(méi)有較好的反映WES金標(biāo)準(zhǔn) 。

寫于2019年4月8日