筛选不受肿瘤组织取样部位影响的肿瘤分子标志
【摘要】:在临床取样获得的肿瘤组织样本中,通常包含肿瘤上皮细胞与肿瘤基质细胞两类表达模式不同的细胞。由于肿瘤组织不同部位的基质细胞浸润程度不同,在同一个患者肿瘤组织的不同部位取样,其肿瘤上皮细胞与肿瘤基质细胞构成比例存在差异,从而导致基因表达检测值易受到肿瘤组织取样部位的影响。在本研究中,利用TCGA数据库中结肠癌和乳腺癌肿瘤组织的表达谱数据及每个样本对应的肿瘤细胞构成比例信息,我们分别筛选出2271与2309个表达检测值与肿瘤细胞构成比例存在显著相关的基因(Spearman相关分析,FDR10%),并发现这些基因分别与肿瘤上皮细胞相对于肿瘤基质细胞之间的差异表达基因存在显著的一致交叠。推测可知,由于基因在肿瘤上皮细胞与肿瘤基质细胞间表达模式的差异,在肿瘤组织中检测的基因表达检测值会广泛地受到肿瘤细胞构成比例的影响。目前报道的肿瘤预后及耐药预测基因标志大多数是基于临床肿瘤组织中标志基因的表达检测值计算风险得分,对患者的预后和用药方案进行判断。然而,这类标志基因的表达检测值容易受肿瘤组织样本取样部位的影响,使得病人的诊断结果存在不确定性。因此,在临床肿瘤组织中筛选不受肿瘤细胞构成比例影响的稳健基因标志是当前亟需解决的问题。针对该问题,我们分析认为基于样本内基因表达相对大小的秩次关系对肿瘤细胞比例变化相对不敏感。首先,对来自27个患者(包括结肠癌和乳腺癌病人)配对的肿瘤上皮细胞与肿瘤基质细胞表达谱数据,对肿瘤上皮细胞中基因对秩次与配对的基质细胞基因对中秩次进行一致性比较分析,结果发现在两类细胞间超过80%的基因对秩次关系保持一致,预示着这部分基因对秩次关系与临床肿瘤组织中肿瘤细胞比例无关,不会受肿瘤细胞构成比例变化的影响。随后,通过对不同肿瘤细胞构成比例的临床肿瘤组织样本仿真模拟实验,进一步研究分析发现:即便临床肿瘤组织中肿瘤上皮细胞比例低至30%,仍有90%左右的基因对表达秩次关系与其对应的肿瘤上皮细胞中的基因对表达秩次关系保持一致。其中,两基因间存在较大表达秩次差的基因对,对肿瘤细胞比例变化具有更高的稳健性。最后,我们训练出一个基因对标志(CLDN8和MMP3),该基因对标志可以稳健地区分含有不同肿瘤细胞比例的结直肠癌肿瘤组织和结直肠正常组织样本。总之,基于样本内基因间相对表达秩次关系的基因对标志对肿瘤组织取样部位影响不敏感,对肿瘤细胞比例变化具有高度的稳健性,因此具有潜在的临床转化应用可行性。