收藏本站
《南方医科大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

乳腺癌组织学分级特征基因提取及基因集富集分析

叶云  
【摘要】: 乳腺癌是女性最常见的恶性肿瘤之一,而且也是妇女恶性肿瘤主要的死亡原因之一。乳腺癌多发于西方欧美国家,尽管死亡率已经逐渐得到控制并有所下降,但发病率一直居高不下。近年来,原为乳腺癌低发区的亚洲国家发病率也呈逐年升高的趋势。乳腺癌严重威胁着妇女的健康,但乳腺癌病因相当复杂,与遗传因素、激素、免疫及各种环境因素(理化、生物因子、生活方式等)有关。 影响乳腺癌的预后因素很多,从病理角度分析,肿瘤的组织病理学类型和组织学分级是重要的预后因素。由于乳腺癌组织学分级能够提供重要的预后信息,在临床上早已得到医学工作者的认可。目前应用得最广泛的乳腺癌分级方法是B-R分级,也被称为诺丁汉分级系统。这个分级方法以肿瘤细胞的形态学和细胞学特征作为评价依据,综合腺管形成的程度、细胞核的多形性和核分裂计数3个方面的得分,将乳腺癌分为Ⅰ级(G1,高分化,生长慢),Ⅱ级(G2,中分化),Ⅲ级(G3,低分化,高度增生)恶性肿瘤。对大量病人进行的多变量分析表明,未治疗G1病人的5年生存率为95%,而G2和G3的乳腺癌5年生存率则分别只有75%和50%。因而,组织学分级可以独立于淋巴结和肿瘤大小,作为预测乳腺癌复发和死亡的一个重要的指标。虽然组织学分级对于判断预后的重要性已越来越受到重视,但由于在分级评估过程中存在着一些主观的成分,而且操作比较繁琐,所以乳腺癌分级的可重复性还不够理想,即在不同的观察者之间存在着不一致性,通常其重复性只有60%-85%。 肿瘤的基因组表达模式反映了肿瘤的生物学特性,基因表达谱可用于区分无法用病理学方法区别的肿瘤类型,为乳腺癌的生物学研究和预后提供了一种全新的方法。通过基因芯片表达数据可以获得与乳腺癌组织学分级相关的分类特征,实现乳腺癌的正确组织学分类,为乳腺癌的诊断和预后提供可靠的预测依据。已有研究者利用基因芯片分析获得了乳腺癌预后的标记基因,这种方法比传统的预后标记能更准确地判断乳腺癌的预后,且在随后的实验中也进一步证实了结果的可靠性。然而,这些研究还存在缺陷,即预测和验证都采用同一组数据,进一步验证也没有采用其他数据集。另外,基因芯片表达谱中许多被测基因与样本的区分没有很大关系。在分类问题中引入这些不必要的基因,将增加分类问题中样本的维数,导致计算复杂度的增加,同时可能会产生一些不必要的噪声数据。如果存在能将两类区分开的较小的基因子集,将有利于生物医学工作者专门研究这些基因的功能,了解其生物意义,开发基于这些基因的价格低廉的癌症诊断芯片。因此,特征提取是DNA微阵列研究的一个很重要的内容,通过特征提取找到足够少的能够进行有效分类的基因子集是非常必要的。 不同分级对应于不同的细胞分化程度,低分化的肿瘤通常预后更差。肿瘤细胞的分化程度基于病理上的组织学分级分类,虽然低分化的肿瘤预后更差,然而其中的分子机制却仍然不清楚。肿瘤细胞具有无限增殖维持肿瘤克隆生长的能力,这与干细胞最重要的特性之一——自我更新能力存在着惊人的相似性,表明肿瘤可能起源于正常干细胞或者其祖细胞。目前已经发现很多致癌基因可以干扰正常细胞的分化,这些基因同样也可以影响肿瘤细胞的分化。因此,控制干细胞功能的某些调控网络,可能在某些肿瘤中也同样发挥作用。我们通过对不同分化程度乳腺癌基因表达谱的基因集富集分析,以期发现不同分化程度的乳腺癌的基因表达差异,并能用于改善乳腺癌组织学的分级,从而更好地了解肿瘤细胞分化的分子机制及与正常胚胎干细胞是否存在联系。 研究内容主要分为三个部分: 第一部分:芯片数据质量控制 从NCBI共享数据库GEO(http://www.ncbi.nlm.nih.gov/geo/)下载乳腺癌相关的基因芯片数据,登录号为GSE2109、GSE5460、GSE1456和GSE3494。用dChip对芯片数据进行预处理,以总荧光强度为中位数的芯片为基准,对所有芯片进行标准化,以PM/MM模式均一化各芯片中所有基因的表达水平。同时,对有污染的芯片进行校正,还原原始芯片扫描图像,生成芯片质量报告。根据探针污染率和探针交叉杂交率判别芯片的质量,将校正后探针交叉杂交和污染仍大于5%的样本分样本和临床数据缺失的样本排除在下一步分析之外。共有676个乳腺癌芯片样本达到质控标准,可以用于后期的数据分析,GSE2109、GSE5460、GSE1456和GSE3494分别有186、109、147和234个样本。 表达谱的基因表达值以2为底进行对数转换,选择PM-only模式分析得出各芯片中所有基因的表达水平,随后按以下标准进行过滤:0.5标准差
【学位授予单位】:南方医科大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:R737.9

手机知网App
【引证文献】
中国期刊全文数据库 前2条
1 孔薇;黄晨曦;牟晓阳;;基于ICASSO的乳腺癌基因表达数据可靠特征提取[J];安徽医科大学学报;2013年10期
2 孔薇;李海燕;牟晓阳;杨旸;;乳腺癌组织学分级下目标基因提取及转录调控网络构建[J];安徽医科大学学报;2014年10期
【参考文献】
中国期刊全文数据库 前3条
1 滕晓坤;肖华胜;;基因芯片与高通量DNA测序技术前景分析[J];中国科学(C辑:生命科学);2008年10期
2 李霞,张田文,郭政;一种基于递归分类树的集成特征基因选择方法[J];计算机学报;2004年05期
3 曹文君;李运明;陈长生;;基因表达谱富集分析方法研究进展[J];生物技术通讯;2008年06期
【共引文献】
中国期刊全文数据库 前10条
1 庄振华;王年;李学俊;梁栋;王继;;癌症基因表达数据的熵度量分类方法[J];安徽大学学报(自然科学版);2010年02期
2 陈乐;王年;苏亮亮;王蕊平;;基于邻接谱主分量分析的肿瘤分类方法[J];安徽大学学报(自然科学版);2011年04期
3 叶爱霞;王年;苏亮亮;;基于非负矩阵分解和Normal_Matrix的肿瘤基因分类[J];安徽大学学报(自然科学版);2012年03期
4 陈萍;朱四清;;心理干预对乳腺癌术后患者身心特点的影响[J];安徽卫生职业技术学院学报;2010年05期
5 王玲;王露;陈剑琼;张超学;;乳腺癌声像图特征及其与病理组织学的相关性分析[J];安徽医学;2011年12期
6 陈剑琼;孙国平;王露;;乳腺癌超声特征与ER、PR、C-erbB-2表达的相关性分析[J];安徽医学;2011年12期
7 吴素英;毛秀娟;;年轻乳腺癌病人围手术期的心理分析与护理[J];安徽医药;2007年02期
8 温李花;邓八妹;张惠珍;;乳腺纤维瘤手术护理体会[J];安徽医药;2011年06期
9 邱晓光,刘永平,蒲庆田,顾庆焕,韩建军;乳腺肿瘤组织中端粒酶的表达及其对诊治的意义[J];癌症;2002年11期
10 王曦,梁卫江,朱振宇,杨名添,曾益新;乳腺癌患者血清蛋白质芯片检测[J];癌症;2004年S1期
中国重要会议论文全文数据库 前10条
1 吴加花;;局部晚期乳腺癌动脉介入TAC方案化疗的护理要点[A];第七届全国中西医结合围手术期医学专题研讨会全国中西医结合围手术期快速康复新进展培训班广东省中医药学会外科学会会议论文集[C];2012年
2 马仲丽;李颖;买建修;;乳癖散结膏外贴治疗乳腺增生病136例临床观察[A];第十二次全国中医、中西医结合乳房病学术会议论文集[C];2011年
3 晏立;何艳;罗金波;;乳管镜下乳腺导管内渗出性疾病治疗分析[A];第十二次全国中医、中西医结合乳房病学术会议论文集[C];2011年
4 武进;尹恺;王长明;张家才;;SVDM在蔬菜病害图像分类中的应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
5 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
6 孙倩;张聪建;熊彦;董婷;;高频超声引导自动活检在乳腺病变诊断中的应用(附48例)报告[A];2007年贵州省医学会超声学分会学术会议论文汇编[C];2007年
7 ;Final Sulfur Content Prediction Model in Hot Metal Desulphurization Process Based on IEA-SVM[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
8 张靖博;陈宝文;王小丽;孙燕;李澄;孙红光;;ROC分析CR钼铑双靶摄影与超声对乳腺良恶性结节的诊断价值[A];第二届全国乳腺影像诊断与技术应用研讨会暨学习班论文汇编[C];2007年
9 陈益定;郑树;余捷凯;;血清蛋白质指纹图谱在大肠癌早期诊断中的应用[A];第三届中国肿瘤学术大会教育论文集[C];2004年
10 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
3 章鹏;多尺度特征检测:方法和应用研究[D];中国科学技术大学;2010年
4 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
5 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
6 吕青;思维进化和支持向量机理论及其在炼焦配煤优化中的应用研究[D];太原理工大学;2011年
7 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
8 冯奇;POMDP近似解法研究及在中医诊疗方案优化中的应用[D];北京交通大学;2011年
9 程砚秋;基于支持向量机的农户小额贷款决策评价研究[D];大连理工大学;2011年
10 张晓清;乳腺癌与甲状腺疾病的关系及乳腺钠碘转运体功能调控的研究[D];广州中医药大学;2011年
中国硕士学位论文全文数据库 前10条
1 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
2 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
3 严康;基于支持向量机的特征选择算法研究[D];大连理工大学;2010年
4 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
5 曲歌;乳宁汤对乳腺癌患者术后化疗增效减毒作用的临床研究[D];黑龙江中医药大学;2010年
6 汪湍;数字x线摄影肿块边缘及周围征象对乳腺病变诊断的意义[D];新疆医科大学;2010年
7 姜涛;评价彩超与X线钼靶对乳腺癌分层研究中的诊断价值[D];新疆医科大学;2010年
8 赵丹;基于SVM分类机的DNA序列分类方法[D];南昌大学;2010年
9 张芬;96例女性乳腺癌患者术后生存分析[D];山东中医药大学;2010年
10 王明黔;口令认证系统的安全性研究与实现[D];昆明理工大学;2009年
【同被引文献】
中国期刊全文数据库 前1条
1 江丽华;李亦学;刘琪;;综合ChIP-chip数据、基因敲除数据和表达谱数据重构基因调控网络[J];生物化学与生物物理进展;2010年09期
【二级参考文献】
中国期刊全文数据库 前1条
1 屠康,喻辉,郭政,李霞;GO功能类与基因差异表达的关联规则挖掘算法[J];生物化学与生物物理进展;2004年08期
【相似文献】
中国期刊全文数据库 前10条
1 曾明秀;基因表达差异的比较分析[J];数理医药学杂志;2000年03期
2 孙银华;张瑞;裴善良;;基因表达差异比较在中药研究中的应用[J];中国实用医药;2009年30期
3 岳文,孙丽亚,傅春江,李春海;差异表达基因的克隆筛选及其在肿瘤研究中的应用[J];中国肺癌杂志;2001年01期
4 刘永,唐孝达,谭建明,毛雪莹;显性调控相关早反应基因的大规模扫描和分析[J];中华器官移植杂志;2002年02期
5 吕嘉春,陈家堃,纪卫东,蒋义国,施侣元,吴中亮,何敏,曾波航;应用基因芯片技术筛查肺癌变相关基因的研究[J];中华医学杂志;2003年24期
6 马业伟,千新来,赵清正,周小山,李艳春;应用抑制性消减杂交技术分离E1A药敏相关基因[J];癌症;2004年02期
7 徐娟;吴宜琴;王迎伟;徐静华;佟建霞;;基因芯片筛选抗胸腺细胞血清性肾炎大鼠肾组织基因表达差异的初步研究[J];中国病理生理杂志;2006年10期
8 刘可可;聂珍媛;徐爱玲;夏金兰;;Acidiphilium cryptum DX1-1 CO_2固定相关基因的克隆及在不同营养方式下的差异表达研究[J];现代生物医学进展;2011年18期
9 包俊英,余新炳,吴忠道;比较基因的表达分析[J];热带医学杂志;2001年02期
10 朱涛;吴明富;周金华;李红雨;徐钢;周建锋;卢运萍;马丁;;转移负相关新基因C14orf106的生物信息学分析[J];中国医学工程;2006年02期
中国重要会议论文全文数据库 前6条
1 张文俊;江华;赵耀忠;朱晓海;刘安堂;;皮肤恶性黑色素瘤与良性痣基因表达差异的研究[A];第四届华东六省一市整形外科学术会议暨2007年浙江省整形、美容学术会议论文汇编[C];2007年
2 杨劲松;郑新民;陈诗书;;诱导PTPα表达24小时NIH3T3细胞基因表达差异的研究[A];中国生物化学与分子生物学会第八届会员代表大会暨全国学术会议论文摘要集[C];2001年
3 孟金萍;刘云波;张以河;孙淑华;王艳蓉;吕凤柱;杨旭;;铅暴露U251细胞基因表达谱改变及基因通路分析[A];实验动物与药理学、毒理学研究学术交流会论文汇编[C];2009年
4 刘丹慧;陈少松;罗崇林;肖雪媛;何大澄;;一个在肺癌中缺失的基因的筛选与初步研究[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
5 宾晓农;谭敏;吕嘉春;蒋义国;陈家堃;;基因芯片筛选BPDE转化16HBE相关基因的研究[A];第五届广东省环境诱变剂学会暨第三届广东省预防医学会卫生毒理专业委员会学术交流会论文集[C];2006年
6 霍晓芳;张俊武;;红系分化相关基因的鉴别与功能研究[A];中国遗传学会七届一次青年研讨会暨上海高校模式生物E——研究院第一届模式生物学术研讨会论文汇编[C];2005年
中国重要报纸全文数据库 前4条
1 吴一福;第四军医大学发现抑癌新基因[N];中国医药报;2008年
2 柯尊洪;基因技术在中药研究中的作用[N];中国中医药报;2002年
3 王兴 闫智勇 郝晓锋;借助基因技术发展现代中药[N];中国医药报;2003年
4 本报记者 吴红月;医院病理科借助基因检测延伸新服务[N];科技日报;2014年
中国博士学位论文全文数据库 前10条
1 李鑫;小鼠腭裂相关基因的克隆、筛选及功能的研究[D];中国人民解放军第四军医大学;2003年
2 孙各琴;幽门螺杆菌可塑区JHP947基因功能的初步研究[D];福建医科大学;2008年
3 周津;食管上皮癌变不同时期差异表达基因与基因表达概况的分析[D];中国协和医科大学;2000年
4 汪金荣;一个人类睾丸特异表达新基因-septin 12 transcript variant 2的克隆与功能初步研究[D];中南大学;2007年
5 梁巧仪;三个新的人内源性逆转录病毒(HERV)相关基因的研究[D];浙江大学;2009年
6 余梅;猪12号染色体上四个新基因的分离、鉴定与物理定位[D];华中农业大学;2003年
7 樊小农;用基因表达谱芯片筛选老年痴呆异常表达基因及针刺对其主效基因的影响[D];天津中医学院;2003年
8 梁锐;个旧矿粉诱导支气管上皮转化细胞差异表达基因的克隆和鉴定[D];昆明医学院;2007年
9 钟星;人肝癌血管内皮细胞相关基因的筛选及功能的初步研究[D];中国协和医科大学;2004年
10 陈鹏;肺癌组织中HMGN5基因的表达及其在肺癌发病中作用机制的研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 唐奇;CRYAB基因在HCC中的表达、临床预后分析及抗凋亡功能研究[D];南京医科大学;2007年
2 杨波波;不同肿瘤基因表达分析中内参基因的选择和研究[D];西北大学;2014年
3 陈海英;HP450基因的克隆及其重组逆转录病毒载体pLXSN-HP450的构建和鉴定[D];广西医科大学;2006年
4 梁正翠;鸭的色素相关基因ASIP和AGRP的研究[D];扬州大学;2010年
5 王中华;1.正、反义Heparanase基因的克隆、转染及功能研究  2.Heparanase基因的原核表达、多抗的制备及应用[D];中国人民解放军第四军医大学;2003年
6 张威;基因集富集分析在肿瘤标志物筛选中的比较研究[D];第四军医大学;2013年
7 刘娟;棉花叶片衰老及氮素再利用相关基因的克隆和分析[D];山东农业大学;2008年
8 漆辉洲;Sulfobacillus sp.TPY在铜离子和汞离子胁迫下基因差异表达研究[D];中南大学;2009年
9 高梦雅;Prelid2基因在小鼠胚胎中的表达及其调控机制的研究[D];哈尔滨工业大学;2009年
10 贺小彦;烟草受激素诱导和逆境胁迫相关基因的克隆与表达分析[D];福建农林大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026