收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

口腔鳞状细胞癌差异基因的筛选验证及相互作用的生物信息学分析

郑建伟  
【摘要】:口腔恶性肿瘤是一类严重威胁人类健康的疾病;在口腔癌中,约90%的患者为口腔鳞状细胞癌(oral squamous cell carcinoma, OSCC)。与其他肿瘤的发生一样,oscc的发生发展是一个多分子事件呈网络结构,多步骤、多阶段共同作用的长期复杂过程,是多基因共同作用的结果,各肿瘤基因之间的相互协同作用使肿瘤细胞形成和发展。目前肿瘤的发生机制及治疗均未取得重大突破,如何早期检测肿瘤病损及根治是现代肿瘤工作者难题及机遇。这一难题的解决有赖于对肿瘤发生发展分子机制的全面解析,对此,研究者们已经进行了深入研究并取得一些进展,但其发生机制仍未明确。现已公认肿瘤是一种分子水平的疾病,从基因蛋白水平进行肿瘤的研究是最终途径。近年在整体水平上以高通量分子扫描手段为基础的基因组学、蛋白质组学以及计算机辅助设计等技术的整合及相互关联的“技术链”的应用等为肿瘤的研究提供了新的契机,并且已经在乳腺癌、肺癌、胃癌、结肠癌、卵巢癌、黑色素瘤等的研究中取得了丰硕的成果。目前基因表达谱芯片是技术最可靠、应用最多的一种生物芯片,又叫DNA芯片、DNA微阵列(DNA microarray)。其制作方法是将大量的寡核苷酸或者eDNA片段预先设计好,高密度且有序列的排列在载体上制成芯片。检测样品用荧光染料如Cy5等标记制备成探针,探针与芯片按照碱基配对的原则进行杂交。结果通过激光共聚焦、荧光扫描方法采集杂交信号,获得样品分子的序列信息,由计算机分析并获得图像和数据。这样就可以在全基因组水平同步分析研究基因的序列及功能。一次获得大量的数据并同步分析,不仅可以大大加快实验进程,而且提高了分析的精确性。由于是在一个芯片上对多个目标基因进行分析,排除了各种因素导致的实验内在差异,从而可以进行大规模、高通量、高灵敏度、高精确度的检测研究。本实验通过基因表达谱芯片检测口腔鳞状细胞癌组织与癌旁正常对照组织的基因表达谱。从基因表达谱结果中筛选出变化明显的差异基因,并进行生物信息学分析,同时参考本课题组前期经典蛋白组学实验采用Bio-Rad双向电泳系统进行一向等电聚焦和二向垂直电泳结果构建的52种口腔鳞状细胞癌相关差异蛋白作用网络,最后筛选出与口腔鳞状细胞癌相关的差异基因,进行荧光定量RT-PCR验证,使用STRING数据库分析构建这些差异基因的相互作用通路网络,并通过NCBI、NEXTPROT、EMBL-EBI、NetPhos2.0等数据库对其中的节点基因进行功能、三维结构、结构域和磷酸化位点分析,为后续实验提供线索。根据构建的作用通路网络及基因结构功能分析,我们将在后期的实验中进行进一步的验证实验,逐步证实这些差异基因蛋白之间的网络作用机制,为将来揭示口腔鳞状细胞癌作用机制奠定基础。第一部分 口腔鳞状细胞癌的基因表达谱芯片检测目的:本实验通过基因表达谱芯片检测口腔鳞状细胞癌组织与癌旁正常对照组织的基因表达谱,从基因表达谱结果中筛选出变化明显的差异基因。方法:在广东省口腔医院收集口腔鳞状细胞癌患者两例,每例患者采集口腔鳞状细胞癌组织和癌旁正常对照组织作为一组,采用Roche NimbleGen全基因组表达谱芯片(芯片型号为Roche NimbleGen Homo_Sapiens 12x135k)进行口腔鳞状细胞癌及癌旁正常对照组织的基因表达谱检测。结果:按差异基因筛选标准,从32448条检测基因中筛选出口腔鳞状细胞癌肿瘤组织的差异基因共有7872条,占筛选基因总数的24%;其中上调表达的基因有3800条,下调表达的有4072条。结论:通过基因表达谱芯片检测并根据表达差异一倍以上的筛选标准得到了7872个表达差异的基因。由此可见肿瘤的发生发展不是单个或几个基因的作用结果,以往实验往往针对某个或某几个基因的研究有很大的局限性。同时也说明了肿瘤的产生是多基因成网络相互调节作用的结果,而且这个网络的作用关系是非常复杂的。第二部分 基因表达谱芯片数据的生物信息学分析目的:我们通过基因表达谱芯片检测比较了口腔鳞状细胞癌组织和癌旁正常对照组织的基因表达谱差异,为了把这些基因表达谱的数据和生物学功能联系起来,我们就要对数据进行聚类分析。此部分实验通过对基因表达谱芯片的检测结果进行生物信息学分析,找出筛选的差异基因的变化趋势及相互作用网络。方法:通过基因表达谱芯片配套软件Agilent GeneSpring GX v12.0分析第一部分基因表达谱芯片实验数据,进行GO分析和KEGG生物学通路富集分析,找出差异基因的变化趋势及相互之间的可能作用关系。结果:使用基因表达谱芯片配套软件Agilent GeneSpring GX v12.0进行差异基因功能分类注释(Gene ontology, GO)分析和基因表达谱芯片数据的KEGG生物学通路富集分析,将基因分为上调基因和下调基因分别进行功能富集分析。第一GO分析口腔鳞状细胞癌组织与癌旁正常对照组织样本RNA间的差异基因分布情况如下:1生物过程(Biological Process)部分1.1上调基因中生物过程部分:上调差异基因功能富集分析发现共有532个生物过程的亚层,差异表达的基因主要富集于刺激反应(response to stimulus)(6.75),免疫系统过程(immune system process) (6.06),细胞外基质组织(extracellular matrix organization) (5.54),免疫系统过程的调节(regulation ofimmune system process) (5.49),免疫反应(immune response) (5.39),器官形态(organ morphogenesis) (4.88),细胞外结构组织(extracellular structure organization) (4.84),淋巴细胞副刺激(lymphocyte costimulation) (4.77),T细胞副刺激(T cell costimulation) (4.77),细胞活化的正调节(positive regulation of cell activation) (4.75)。1.2下调基因中生物过程部分:下调差异基因功能富集分析发现共有715个生物过程的亚层,差异表达的基因其中主要集中于:信号(signaling)(9.70),生物调节(biological regulation)(9.29),死亡(death)(9.12),细胞死亡(cell death)(8.98),细胞过程(cellular process)(8.89),信号传导(signal transduction)(8.74),细胞组成活动(cellular component movement)(8.69),创伤反应(response to wounding)(8.24),生物质量调节(regulation of biological quality)(8.11),创伤愈合(wound healing)(7.90)。2细胞组分(Cellular Component)2.1上调基因中细胞组分部分:上调差异基因功能富集分析发现共有41个细胞组分的亚层,差异表达的基因其中主要集中于细胞外区域部分(extracellular region part)(12.14),细胞外区域(extracellular region)(12.14),细胞外空间(extracellular space)(10.91),质膜部分(plasma membrane part)(7.69),质膜必需的(integral to plasma membrane)(7.50),质膜固有的(intrinsic to plasma membrane)(7.49),细胞外基质(extracellular matrix)(6.00),纤维胶原蛋白(fibrillarcollagen)(5.53),质膜(plasma membrane)(5.02),细胞周围(cellperiphery)(4.93)。2.2下调基因中细胞组分部分:下调差异基因功能富集分析发现共有149个细胞组分的亚层,差异表达的基因其中主要集中于:细胞质(cytoplasm) (18.17),细胞质部分(cytoplasmic part) (11.18),细胞内部分(intracellular part) (9.07),质膜(plasma membrane part) (9.01),细胞内(intracellular) (8.88),细胞组成(cell fraction) (8.79),胞液(cytosol) (8.77),不溶组成(insoluble fraction) (8.65),细胞膜组成(membrane fraction) (7.99),细胞周围(cell periphery)(7.31)。3分子功能(Molecular Function)部分3.1上调基因中分子功能部分:上调差异基因功能富集分析发现共有97个分子功能的亚层,差异表达的基因其中主要集中于:信号传导活动(signal transducer activity)(6.74),分子传导活动(molecular transducer activity)(6.74),受体活动(receptor activity)(5.50),细胞外基质结构组分(extracellular matrix structural constituent)(5.30),碳水化合物结合(carbohydrate binding)(5.07),血红素结合(heme binding)(3.71),跨膜受体活动(transmembrane receptor activity)(3.58),钠离子跨膜传导体活动(sodium ion transmembrane transporter activity)(3.53),糖结合(sugar binding)(3.44),肝磷脂结合(heparin binding)(3.42)。3.2下调基因中分子功能部分:下调差异基因功能富集分析发现共有132个分子功能的亚层,差异表达的基因其中主要集中于:蛋白结合(protein binding)(17.68),酶结合(enzyme binding) (8.97),骨骼蛋白结合(cytoskeletal protein binding) (8.00),结合(binding) (7.69),肌动蛋白结合(actin binding) (6.30),结合跨接(binding, bridging) (5.43),蛋白异种二聚活动(protein heterodimerization activity) (4.96),蛋白二聚活动(protein dimerization activity)(4.65),激酶结合(kinase binding) (4.64), SH3域结合(SH3 domain binding) (4.46)。第二基因表达谱芯片数据的KEGG生物学通路富集分析根据最新KEGG数据库,我们进行基因表达差异数据的pathway分析。根据这个分析确定的差异基因表达富集的生物学路径如下:1.1上调差异基因的生物学路径上调差异基因的生物学路径分析发现差异基因富集于26条生物学路径,主要集中于:金黄色葡萄球菌感染-人(Staphylococcus aureus infection-Homo sapiens (human)) (4.59),刺激神经的配体相互作用-人(Neuroactive ligand-receptor interaction-Homo sapiens (human)) (4.46)哮喘-人(Asthma-Homo sapiens (human)) (4.25),DNA复制-人(DNA replication-Homo sapiens (human)) (3.80),产生IgA的肠免疫网络-人(Intestinal immune network for IgA production-Homo sapiens (human)) (3.28),移植物抗宿主疾病-人(Graft-versus-host disease-Homo sapiens (human)) (2.84),唾液分泌-人(Salivary secretion-Homo sapiens (human)) (2.74),细胞活素-细胞活素受体相互作用-人(Cytokine-cytokine receptor interaction-Homo sapiens (human)) (2.72),系统性红斑狼疮-人(Systemic lupus erythematosus-Homo sapiens (human) (2.52),细胞色素P450的外源物新陈代谢-人(Metabolism of xenobiotics by cytochrome P450-Homo sapiens (human)) (2.19),抗原加工和呈现-人(Antigen processing and presentation-Homo sapiens (human)) (2.19)。1.2下调差异基因的生物学路径:下调差异基因的生物学路径分析发现差异基因富集于55条生物学路径,主要集中于:氨基糖和核苷酸糖新陈代谢-人(Amino sugar and nucleotide sugar metabolism-Homo sapiens (human))(6.19),幽门螺杆菌感染的上皮细胞信号-人(Epithelial cell signaling in Helicobacter pylori infection-Homo sapiens (human))(6.14), NOD类受体信号通路-人(NOD-like receptor signaling pathway-Homo sapiens (human))(4.88),癌症通路-人(Pathways in cancer-Homo sapiens (human))(4.52),粘附连接-人(Adherens junction-Homo sapiens (human))(3.93),志贺菌病-人(Shigellosis-Homo sapiens (human))(3.83),风湿性关节炎-人(Rheumatoid arthritis-Homo sapiens (human))(3.83),中心粘附-人(Focal adhesionHomo sapiens (human))(3.79),溶酶体-人(Lysosome-Homo sapiens (human))(3.68),美洲锥虫病-人(Chagas disease (American trypanosomiasis)-Homo sapiens (human))(3.60)。结论:通过生物信息学分析我们发现口腔鳞状细胞癌差异基因富集于三大类共1666个亚类,主要集中于免疫、细胞结构及信号传导调节等生物过程方面,质膜、细胞膜、细胞质、胶原蛋白、细胞外区域等细胞组成方面和与蛋白、糖、酶、激酶、跨膜受体等结合的细胞功能方面。而这些方面的变化与肿瘤细胞的粘附、侵袭、转移等密切相关。由此可见肿瘤的发生发展不是单个或几个信号通路的作用结果,是多个信号通路呈网络相互调节作用的结果,这个网络的作用关系是非常复杂,是参与肿瘤发生的多信号通路的综合作用结果。第三部分 口腔鳞状细胞癌差异基因的荧光定量RT-PCR表达验证目的:本实验部分通过第一部分基因表达谱芯片数据与实验组前期蛋白组学实验构建的口腔鳞状细胞癌52种差异蛋白作用网络共同分析,筛选出表达变化趋势相同且差异相对较大的基因,通过荧光定量RT-PCR实验去验证这些差异基因在口腔鳞状细胞癌组织和癌旁对照组织中的表达,从而确定差异基因的表达及基因表达谱芯片的可靠性,进而研究各差异基因之间的可能作用机制。方法:1.需要进行荧光定量RT-PCR验证的差异基因的确认方法:在前期课题组经典蛋白组学实验采用Bio-Rad双向电泳系统进行一向等电聚焦和二向垂直电泳筛选出的52种口腔鳞状细胞癌差异蛋白中,我们综合基因表达谱芯片检测结果,选择与52种差异蛋白对应基因变化一致且相对变化较大的基因。我们共选出15个目标基因,其中表达上调的基因有6个,分别为:GNB2L1、ARHGDIB、STMN1、 LGALS7、EIF5A, TAGLN。表达下调的基因有9个,分别为:S100A7、S100A8、 S100A9、ANXA1、ANXA2、ANXA5、CSTB、CRYAB、SERPINB3。2.在广东省口腔医院等多个医院收集口腔鳞状细胞癌患者32例,每例患者采集口腔鳞状细胞癌组织和癌旁正常对照组织作为一组,通过荧光定量RT-PCR进行较大样本的表达验证。结果:经过荧光定量RT-PCR验证(GAPDH为内参)后,差异基因(GNB2L1、 ARHGDIB、STMN1、LGALS7、EIF5A、TAGLN)表达上调,差异具有统计学意义(P0.001)。差异基因(S100A7、S100A8、S100A9、ANXA1、ANXA2、 ANXA5、CSTB、CRYAB、SERPINB3)表达下调,差异具有统计学意义(P0.001)。荧光定量RT-PCR验证差异基因的变化趋势与基因表达谱芯片数据结果具有很好的一致性。结论:荧光定量RT-PCR技术是验证基因表达谱芯片数据最精确的技术,本实验我们采用荧光定量RT-PCR技术对较大样本量进行验证,实验结果表明荧光定量RT-PCR验证结果与基因表达谱芯片结果一致。鉴于差异基因经荧光定量RT-PCR验证与芯片基因表达一致,认为Roche NimbleGen全基因组表达谱芯片结果的可信性较高。通过基因表达谱芯片的检测和荧光定量RT-PCR的验证实验我们发现口腔鳞状细胞癌组织具有很多的差异基因、蛋白,而不是一个或者几个基因发生改变,也指示我们要研究口腔鳞状细胞癌的发生发展机制,要把这些差异基因都考虑进去,放在一起进行研究。第四部分 口腔鳞状细胞癌差异基因的相互作用关系构建目的:通过比较基因表达谱芯片数据及课题组前期经典蛋白组学实验采用Bio-Rad双向电泳系统进行一向等电聚焦和二向垂直电泳筛选的差异蛋白选择表达一致且差异相对较大基因,筛选出的差异基因使用STRING数据库进行生物信息学的方法构建他们之间的相互作用关系,并通过NCBI、NEXTPROT、 EMBL-EBI、NetPhos2.0等数据库对其中的节点基因进行功能、三维结构、结构域和磷酸化位点分析,同时结合荧光定量RT-PCR实验验证结果共同分析为后续实验提供线索。方法:1差异基因的确定:综合分析基因表达谱芯片数据与课题组前期蛋白组学实验采用Bio-Rad双向电泳系统进行一向等电聚焦和二向垂直电泳确定的差异蛋白,选择表达一致且差异相对较大的基因,总计15个,其中表达上调的基因有6个,分别为GNB2L1、ARHGDIB、STMN1、LGALS7、EIF5A、TAGLN。表达下调的基因有9个,分别为S100A7、S100A8、S100A9、ANXA1、ANXA2、 ANXA5、CSTB、CRYAB、SERPINB3。2将筛选的差异基因输入STRING数据库(http://string.embl.de)进行分析,找出对应各蛋白亚基之间的可能作用关系,构建相互作用网络图。3.节点基因的分析结果:1.通过STRING数据库构建了这15个差异基因间的相互作用网络。在整个网络结构图中这15个差异基因间构成了复杂的相互作用。我们分析发现TAGL、LGALS7、SERPINB3和GNB2L1这四个基因为发生作用最多的基因,是整个网络的节点基因。2.节点基因TAGLNTAGLN基因编码蛋白钙结合蛋白与其他差异基因蛋白相互作用,共与9个差异基因蛋白构建了18条相互作用网络,如下:COG4826(SERPINB3)、COG2319 (GNB2L1)、KOG1997 (STMN1)、KOG2392 (SERPINB3)、KOG3587 (LGALS7)、KOG2046 (TAGLN)、KOG3205 (ARHGDIB)、KOG3591 (CRYAB)、KOG0819 (ANXA1、2、5)、NOG26977 (ANXA2)、NOG26977 (ANXA2)、COG5199 (TAGLN)、KOG1997 (STMN1)、 KOG2392 (SERPINB3)、KOG3587 (LGALS7)、KOG3591 (CRYAB)、KOG0819 (ANXA1、2、5)、KOG3205 (ARHGDIB).3.节点基因LGALS7LGALS7基因编码半乳糖-7蛋白与其他差异基因蛋白相互作用,共与9个差异基因蛋白构建了10条相互作用网络,如下:KOG0819 (ANXA1、2、5)、KOG2046 (TAGLN)、KOG3591 (CRYAB)、 KOG3205 (ARHGDIB)、KOG2392 (SERPINB3)、KOG1997 (STMN1)、 KOG0279 (GNB2L1)、NOG26977 (ANXA2)、NOG29074 (CSTB)、COG5199 (TAGLN)。4.节点基因SERPINB3SERPINB3基因编码蛋白丝氨酸蛋白酶抑制蛋白与其他差异基因蛋白相互作用,共与9个差异基因蛋白构建了10条相互作用网络,如下:KOG0279(GNB2L1)、KOG3205 (ARHGDIB)、KOG2046 (TAGLN)、KOG0819 (ANXA1,2,5), KOG3591 (CRYAB)、KOG3587(LGALS7)、NOG29074(CSTB)、 NOG26977(ANXA2)、NOG47012(S100A9)、COG5199(TAGLN)。5.节点基因GNB2L1GNB2L1基因编码蛋白RACK1蛋白与其他差异基因蛋白相互作用,共与7个差异基因蛋白构建了9条相互作用网络,如下:COG5199 (TAGLN)、COG0231 (EIF5A)、COG4826 (SERPINB3)、NOG26977 (ANXA2)、NOG75290 (STMN1)、NOG29074 (CSTB)、KOG3587 (LGALS7)、 KOG2392 (SERPINB3)、KOG3271 (EIF5A)。结论:通过STRING数据库分析构建这15个差异基因相互作用的结构网络图。我们分析发现TAGLN、LGALS7、SERPINB3和GNB2L 1这四个基因为发生相互作用最多的基因,是整个网络的节点基因。而其他未直接发生作用的基因也通过与其他相关基因作用间接的与这四个节点基因发生相互作用,因此这四个差异节点基因可能是口腔鳞状细胞癌的关键节点,这与前述研究者们的研究一致。同时通过直观的结构网络图指示我们下一步实验就是对这些关键的节点基因进行干预、调节,检测其他基因蛋白之间的变化,进而一步步揭示口腔鳞状细胞癌的发生发展机制。根据实验确定的作用通路网络,我们将在后期的实验中进行进一步的验证实验,逐步证实这些差异蛋白之间的作用机制。本研究的创新点1.通过基因表达谱芯片检测获知整个基因组的表达及变化,在全基因组范围内寻找与口腔鳞状细胞癌发生发展相关的基因变化,从而从分子水平探讨口腔鳞状细胞癌可能的发生机制,进一步运用分子生物学和生物信息学方法分析寻找这些差异基因可能的变化规律,再进行较大样本病例验证口腔鳞状细胞癌组织的差异基因,使结论具有说服力。2.参考课题组前期蛋白组学实验采用Bio-Rad双向电泳系统进行一向等电聚焦和二向垂直电泳构建的口腔鳞状细胞癌的癌变相关关键蛋白信号通路,与基因表达谱芯片结果对比,筛选出差异基因,并通过荧光定量RT-PCR进行验证,使用STRING数据库进行生物信息学分析的方法构建它们之间的相互作用关系网络,并通过NCBI、NEXTPROT、EMBL-EBI、NetPhos2.0等数据库对其中的节点基因进行功能、三维结构、结构域和磷酸化位点分析,为后续实验提供线索,找出与口腔鳞状细胞癌相关的差异蛋白、基因之间的信号通路,分析之间的相互作用关系。3.整合基因芯片,蛋白组学等新技术,以“成组研究”为特点开展口腔鳞状细胞癌机制研究。成组研究的意义在于不在局限于单个基因或蛋白,而是着眼于与此基因或蛋白相关的信号通路中整个网络的相互作用关系。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978