收藏本站
《电子科技大学》 2014年
收藏 | 手机打开
二维码
手机客户端打开本文

基于基因表达秩序关系识别癌症预后与早期诊断标志

章琳  
【摘要】:随着全基因组基因表达芯片的广泛应用,大量基于基因表达谱开发的分子标志为癌症的预后预测和早期诊断提供了重要的辅助手段。然而,由于基因芯片检测的批次效应和癌症患者的异质性等原因,目前基于基因表达谱得到的分子标志的预测能力在跨实验室的独立数据中往往有大幅的下降。针对这一问题,本论文提出了一种具有一定普适性的基于基因表达秩序关系的预测算法。由于乳腺癌化疗预后及肝癌癌前病变的数据较为丰富,本论文将该算法分别应用于乳腺癌预后的预测及肝癌的早期诊断。本论文主要包括以下四部分内容:癌症标志稳健性的评价。对同一种癌症类型的研究,不同的实验室运用基因芯片技术得到的标志通常很不一致,且癌症标志在不同实验室数据中分类性能也不够稳健。对于多数工作中常规作为诊断或预后分子标志的最显著差异表达的基因标志,我们通过一定的合理生物学假设(或分子模型)从功能联系和分类性能两个层面对其进行了稳健性评价。结果显示,最显著差异表达的基因倾向于显著共表达且在蛋白质互作网络上紧密连通,并且通过该功能关系所构建的从最显著差异表达基因出发的癌症条件相关的活性子网在来自不同实验室的数据中有稳健的鉴别癌症与正常样本的能力。乳腺癌化疗反应的预测。对于基于紫衫类和蒽环类的乳腺癌新辅助化疗,病理完全反应(pathological complete response,pCR)的患者有着明显优于癌细胞残留(residue disease,RD)的患者的总体生存率。一些工作报道了基于基因表达谱的pCR预测分类器来指导患者的新辅助化疗,然而现有的pCR分类器在独立验证的稳健性方面仍存在问题。为了建立稳健的pCR分类器,我们提出了一个基于基因表达秩序关系的CTSP(Combinational top scoring pairs)算法。首先,我们提取出基因表达的相对秩次关系在pCR和RD两类患者之间发生了显著逆转的基因对。然后,基于一定的决策规则,我们利用这些基因对的组合构建pCR分类器。该pCR分类器在两套来自不同实验室的独立验证集中的敏感性指标分别为74%和86%,特异性指标分别为71%和68%,明显优于三个已报道的pCR分类器。乳腺癌化疗预后的预测。考虑到pCR的患者的比例不高而少量癌细胞残留的患者也倾向于有良好的预后,作为pCR分类器的补充,我们提出了一个预测乳腺癌化疗预后的分类器。由于患者化疗前内在的雌激素水平、临床分期等与预后相关的风险因素会对化疗后的预后产生一定的影响,本论文通过结合患者化疗前的风险因素和化疗后癌细胞残留程度两方面因素对患者治疗的预后进行预测。首先,按照CTSP算法,我们对化疗后癌细胞的残留程度进行预测。然后,我们将预测的癌细胞残留程度与临床指标相结合,通过COX回归分析得到了对单个个体化疗后生存进行评价的风险概率指标。结果显示该风险概率指标可以有效地将个体的化疗后生存情况区分为预后良好和预后不理想的两组,这两组患者的三年生存率(无远端复发的生存时间在三年以上的患者在所有患者中所占的比例)的差值为17%,其整体生存曲线间也存在着显著的差别(log-rank检验,p=0.001)。肝癌高危人群的早期诊断。对于在肝癌(hepatocellular carcinoma,HCC)的早期检测中放射成像技术无法确定的结节,通常需要通过活检取样来进行组织病理学鉴定。然而,一些早期肝癌组织中所呈现的病理改变微小难辨,活检取样时也经常会出现未取到癌组织而漏检的情况。针对这种肝癌早期诊断的困难,我们提出了利用癌旁组织的基因表达的秩序关系来鉴别早期肝癌及癌前病变的方法。首先,我们找出在伴肝硬化肝癌患者的肝硬化组织(cirrhosis tissue in patients with HCC,wHCC)和非肝癌肝硬化患者的肝硬化组织(cirrhosis tissue in patients without HCC,woHCC)这两类样本间基因表达值的相对秩序发生了逆转的基因对。然后,我们借用大样本的肝癌组织表达谱数据筛选出在HCC及wHCC中表达的相对秩序一致的基因对,再基于这些基因对发展能将HCC、wHCC与woHCC进行鉴别的分类器。结果显示,该分类器对来自不同平台、不同实验室的验证集都有稳健的分类能力,可以用于早期肝癌与癌前病变的辅助鉴别诊断。综上,本论文提出了CTSP算法从两方面来解决基因表达分子标志在跨实验室应用中缺乏稳健性的问题:一方面,以相对表达大小(秩次)关系取代具体表达值作为特征具有一定的稳健性,由于每个样本中的基因间秩序关系是不受样本间的检测条件差异或线性的片间标准化影响的。另一方面,以大样本量的对照组(如正常、化疗不敏感)的样本中稳定存在的基因表达秩序关系为基准,可以识别出仅在观察组(如癌症、化疗敏感)中的部分样本中发生的基因表达秩序关系的变化,这为复杂疾病条件下具有高生物学变异的应用(如化疗反应预测等)提供了新的思路。
【学位授予单位】:电子科技大学
【学位级别】:博士
【学位授予年份】:2014
【分类号】:R730.4

免费申请
【共引文献】
中国期刊全文数据库 前10条
1 庄振华;王年;李学俊;梁栋;王继;;癌症基因表达数据的熵度量分类方法[J];安徽大学学报(自然科学版);2010年02期
2 陈乐;王年;苏亮亮;王蕊平;;基于邻接谱主分量分析的肿瘤分类方法[J];安徽大学学报(自然科学版);2011年04期
3 叶爱霞;王年;苏亮亮;;基于非负矩阵分解和Normal_Matrix的肿瘤基因分类[J];安徽大学学报(自然科学版);2012年03期
4 牟少敏;田盛丰;尹传环;;基于协同聚类的多核学习[J];北京交通大学学报;2008年02期
5 尚坤;李培军;程涛;;基于合成核支持向量机的高光谱土地覆盖分类[J];北京大学学报(自然科学版);2011年01期
6 陈斌;阎兆立;程晓斌;;旋转设备声学故障特征提取与优化方法[J];北京邮电大学学报;2011年04期
7 赵三元;沈庭芝;孙晨升;刘朋樟;岳雷;;Feature subset selection method for AdaBoost training[J];Journal of Beijing Institute of Technology;2011年03期
8 王国胤;罗川江;;基于置换检验的两步基因特征选择算法[J];重庆邮电大学学报(自然科学版);2012年04期
9 童姗姗;窦霁虹;贾玲;王佳颖;;基于实例的基因分类及确定基因标签模型[J];纯粹数学与应用数学;2011年04期
10 陈淑飞;韩斌;厉力华;Rebecca Sutphen;祝磊;代琦;;基于磷脂质类数据的早期卵巢癌特征提取研究[J];传感技术学报;2010年10期
中国重要会议论文全文数据库 前10条
1 武进;尹恺;王长明;张家才;;SVDM在蔬菜病害图像分类中的应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
2 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
3 ;Final Sulfur Content Prediction Model in Hot Metal Desulphurization Process Based on IEA-SVM[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
4 陈益定;郑树;余捷凯;;血清蛋白质指纹图谱在大肠癌早期诊断中的应用[A];第三届中国肿瘤学术大会教育论文集[C];2004年
5 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
6 李文法;段洣毅;刘悦;孙春来;;一种面向流分类的特征选择算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
7 折闪电;郭岩;夏天;程学旗;;A CRF-based Feature Selection Algorithm for Web Information Extraction[A];第六届全国信息检索学术会议论文集[C];2010年
8 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 赵锴;黄应清;蒋晓瑜;汪熙;;一种提高SVM分类器识别效率的特征选择方法[A];第六届全国信号和智能信息处理与应用学术会议论文集[C];2012年
10 Haitao Yu;Jianyi Guo;Zhengtao Yu;Yantuan Xian;Peng Chen;;The Design of Digit Recognition Teaching Experiment Based on BP Neural Network[A];第25届中国控制与决策会议论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
3 章鹏;多尺度特征检测:方法和应用研究[D];中国科学技术大学;2010年
4 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
5 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
6 吕青;思维进化和支持向量机理论及其在炼焦配煤优化中的应用研究[D];太原理工大学;2011年
7 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
8 程砚秋;基于支持向量机的农户小额贷款决策评价研究[D];大连理工大学;2011年
9 王立鹏;特征提取及分类算法在膜蛋白分类预测问题中的应用[D];兰州理工大学;2010年
10 戴俊程;基于全基因组关联研究的中国女性乳腺癌风险预测模型研究[D];南京医科大学;2011年
中国硕士学位论文全文数据库 前10条
1 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
2 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年
3 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
4 赵丹;基于SVM分类机的DNA序列分类方法[D];南昌大学;2010年
5 王明黔;口令认证系统的安全性研究与实现[D];昆明理工大学;2009年
6 田昊;雷达辐射源特征选择和在线学习算法研究[D];西安电子科技大学;2011年
7 焦昂;针对包含异常值数据的优化K-MEANS聚类算法[D];西安电子科技大学;2009年
8 周萍;基于频度与联合效应的基因选择[D];西安电子科技大学;2009年
9 张翔;特征提取新方法及其应用研究[D];江南大学;2011年
10 熊勰;生理信号情感识别中的特征组合选择研究[D];西南大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 魏建军;郭亦寿;;脑基因表达的研究进展[J];国外医学.遗传学分册;1991年05期
2 ;基因表达[J];劳动医学;1999年03期
3 朱晓松 ,邵黎;基因表达启动过程的新认识[J];生理科学进展;2002年03期
4 陈伟,付小兵,葛世丽,周岗,盛志勇;胎儿和少儿皮肤内转化生长因子-β1和β3基因表达的变化[J];中华实验外科杂志;2003年11期
5 胡劲松,黄辰,党娜娜;基因表达的系统分析在基因组转录谱研究中的应用[J];国外医学.遗传学分册;2003年03期
6 王春花,刘克明,张明月,刘玉清;SOD基因表达与衰老的相关性[J];中国公共卫生;2004年08期
7 李潇;;基因表达水平成为年老的标志[J];中国生物化学与分子生物学报;2007年04期
8 ;首次实现基因表达控制量化[J];生物医学工程与临床;2011年04期
9 ;研究阐明饮食对基因表达和生理的影响[J];生物医学工程与临床;2013年03期
10 韩济生;“中枢神经系统基因表达”国际会议十月在京召开[J];生理科学进展;1993年02期
中国重要会议论文全文数据库 前10条
1 李立青;田亚平;董矜;张阳东;胡金川;温新宇;;高通量测定基因表达方法的建立及运动相关基因表达的检测[A];第七届全国医学生物化学与分子生物学和第四届全国临床应用生物化学与分子生物学联合学术研讨会暨医学生化分会会员代表大会论文集[C];2011年
2 邓大君;;基因表达群与中医证概念的关系[A];中医现代化科学研究发展策略[C];1999年
3 周天寿;;染色质控制的随机基因表达[A];第一届全国神经动力学学术会议程序手册 & 论文摘要集[C];2012年
4 奚文辉;张文广;李金泉;张燕军;王敏;冯林;;单细胞PCR在哺乳动物毛囊基因表达研究中的应用[A];中国动物遗传育种研究进展——第十五次全国动物遗传育种学术讨论会论文集[C];2009年
5 卢学春;朱宏丽;范辉;李素霞;姚善谦;;LRP16基因表达抑制剂的生物信息学筛查[A];第11次中国实验血液学会议论文汇编[C];2007年
6 计峰;罗绪刚;李素芬;刘彬;余顺祥;;锌对基因表达的影响[A];中国营养学会第七届微量元素营养学术会议论文摘要汇编[C];2001年
7 李拥军;赵有璋;;哺乳动物早期胚胎发育的基因表达[A];中国畜牧兽医学会养羊学分会全国养羊生产与学术研讨会议论文集[C];2005年
8 张波;陈宝安;高冲;高峰;夏国华;邵泽叶;丁家华;赵刚;程坚;王骏;宋慧慧;鲍文;仲悦娇;裴孝平;王飞;;骨髓增生异常综合征相关基因表达研究[A];第12届全国实验血液学会议论文摘要[C];2009年
9 项翠琴;梅兵;吴自荣;张云英;沈红;阮素云;顾祖维;;低剂量镉对肾脏SOD基因表达及其活性的影响[A];海峡两岸首届毒理学研讨会论文(摘要)集[C];2001年
10 万静;马业新;;干扰RNA片段对过氧化物酶体增殖物激活受体γ及内皮素-1基因表达的影响[A];中华医学会心血管病学分会第八次全国心血管病学术会议汇编[C];2006年
中国重要报纸全文数据库 前10条
1 记者 铁铮 通讯员 李鑫;基因表达研究攻克世界性难题[N];中国绿色时报;2013年
2 常丽君;细胞内的分子聚集有利于基因表达[N];科技日报;2013年
3 胡轩逸;环境影响基因表达[N];光明日报;2014年
4 苏信;江苏省基因表达工程研究中心成立[N];医药经济报;2001年
5 记者 刘鹏 通讯员 陈芃;藏族人群基因表达具有地域性[N];光明日报;2014年
6 应莉;长期饮酒易致肝细胞基因表达适应性改变[N];医药经济报;2009年
7 记者 刘霞;科学家开发强化神经细胞基因表达新技术[N];科技日报;2008年
8 羡 良;母亲服期营养摄入决定后代基因表达[N];大众科技报;2003年
9 新;基因表达受生物钟控制[N];医药经济报;2002年
10 王小龙;降低单个基因表达可让小鼠延寿20%[N];科技日报;2013年
中国博士学位论文全文数据库 前10条
1 李利;绵羊胚胎发育后期骨骼肌中转录组水平基因表达分析及基因网络的构建[D];中国农业科学院;2012年
2 Samuel Jerry Cobbina;[D];江苏大学;2015年
3 周宁;锌对水貂毛色基因表达及生产性能的影响[D];延边大学;2015年
4 章琳;基于基因表达秩序关系识别癌症预后与早期诊断标志[D];电子科技大学;2014年
5 苏晔;PH II-7作用模式和机理研究[D];中国协和医科大学;2009年
6 刘泉;基因表达及其调控过程的随机动力学研究[D];华中师范大学;2007年
7 旷菊红;随机基因表达的均值与噪声及其动力学行为[D];广州大学;2012年
8 陈朝俊;黄芪多糖干预树突状细胞基因表达与动脉粥样硬化斑块关系的研究[D];南方医科大学;2009年
9 柴立民;从益髓生血颗粒调控β-珠蛋白及相关基因表达探讨肾生髓理论的分子机制[D];中国中医研究院;2005年
10 吴佳楠;基因表达数据分析方法及其应用研究[D];吉林大学;2013年
中国硕士学位论文全文数据库 前10条
1 蔡佳;新型凝胶多糖纳米粒子的制备及体外递送siRNA研究[D];内蒙古大学;2015年
2 刘翔宇;不同电场条件处理柠条种子对干旱条件下幼叶基因表达的影响[D];内蒙古大学;2015年
3 苏运聪;基于MIAME的基因表达数据融合方法设计及应用实践[D];浙江大学;2015年
4 张宝修;活性氧对鼠早期胚胎抗氧化酶基因表达的影响[D];延边大学;2015年
5 周瑜;Egr-1对APP基因表达的调控作用[D];宁夏医科大学;2015年
6 王玉;埃他卡林对重要器官心脑肝基因表达的影响[D];中国人民解放军军事医学科学院;2005年
7 吕志一;小鼠2细胞胚胎基因表达谱研究[D];西北农林科技大学;2010年
8 武伟;中药调脂续命饮调脂作用及其对肝脏LDLR基因表达的影响[D];山西医科大学;2003年
9 孙新强;参芪益肝煎对HeP-A-22肝癌小鼠Survivin基因和CyclinD1基因表达影响的基础实验研究[D];大连医科大学;2012年
10 孙伟;嗅质丁香酚改善嗅觉认知及其机制的探讨[D];安徽医科大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026