收藏本站
《东南大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于基因芯片表达谱的癌症预后元分析方法研究

杨锡南  
【摘要】: 大多数癌症芯片数据研究关注的是识别特异组织癌细胞的分子特性。最近,科研工作者开始利用基因芯片数据,研究特异组织癌细胞的预后特性,但关于普遍的肿瘤预后的分子生物学机制仍待研究。本文在现有研究成果之上,使用元分析(meta-analysis)手段研究多种肿瘤数据源的信号共发生的几率。 本文首先通过研究特异组织肿瘤亚型间的共同表达调控信号,研究多源数据元分析方法。论文修正现有的元分析方法:基于不同数据源的有序基因列表秩打分(RS)算法。利用实际表达芯片数据,发现RS与“一对多”(OVA)或“一对一”(OVO)比对结合,是分析多源数据的有效方法。论文还通过有效聚类说明,6个独立实验的白血病亚型间的信号差异强于芯片系统间信号德差异。 论文探讨了跨临床表征的癌症共同分子机制的存在性,并研究发现这一共性的方法。论文工作创造性地设立了模式匹配(Meta-Analysis Pattern Matches)元分析概念。在分析了白血病、恶性间皮瘤和两个独立乳腺癌共四个基因芯片数据后,发现42个基因在不同癌症病人的治疗结果分组比对中都显示了一致的差异表达。这些基因不但证实了跨临床表征的癌症共同分子机制的存在性,而且是已公布的候选通用预后标志(universal prognostic markers)基因的补充。 为了定量地测定与治疗结果相关的不同表型癌症间的共同分子机制,论文进一步研究并提出了新的更成熟的统计算法----排序的基因列表的相似性打分算法(Similarities of Ordered Gene List - SOGL)。SOGL算法的核心思想是不依赖于某个单一数据集中显著的差异表达的效应量,而是关注多实验中一致的差异表达的效应量。该算法基于有序基因列表的排序,赋予越位于排序列表两端的基因越高的权重,累加权重的打分揭示了有序基因列表间的相似性。与其它元分析算法比较,它尤其敏感于差异表达排序相似但有序基因列表本身的差异表达不明显的情况。在分析了五个独立的临床数据源后(恶性间皮瘤、神经胶质瘤、前列腺癌和两个独立乳腺癌),我们从10对可能的成双比对中检测到5对显著相似的有序基因列表。为了说明算法的敏感性,以上5个被分析的数据集中包括无显著差异表达基因的数据集。 研究目标是从大规模芯片数据中统计保守的癌症预后标志基因。不包含显著差异表达基因的数据集产生的有序基因列表间的相似结果往往令人质疑:这样找到的标志基因是否能提高预后效果?因此,在SOGL的基础上,论文将现有的两两比对算法扩展为多列表比对。结果发现前列腺癌存活、恶性间皮瘤复发和神经胶质瘤存活所对应的3条有序基因列表之间显著相似。随后,作者选用排序列表相似性打分为支持向量机(SVM)算法的变量提取算法,发现导致3条有序基因列表相似的13个标志基因能够提高原始数据集的预后判别准确率。有临床意义的是,这组标志基因中的12个基因与血管增生调控(regulation of angiogenesis)有关,并且能够准确地预测成人T细胞白血病人的治疗后效果。13个标志基因中的12个涉及血管增生及其调控的基因是MDK、CPE、POSTN、COL4A1、COL11A1、COL1A2、COL5A2、IGFBP3、FN1、ANXA2、BGN和PTGDS。该结果提示细胞外的基质蛋白的破坏是血管新生相关的癌症入侵和转移的重
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:R73

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 张润锋,陈宏;基因芯片及应用[J];黄牛杂志;2002年03期
2 宇缨;;支持向量机及其在自然语言处理中的应用[J];东莞理工学院学报;2007年01期
3 肖谦,张玉洪,汪恕萍;醛糖还原酶基因启动区(C-106T)单核苷酸多态性与糖尿病肾病关系的初步研究[J];第三军医大学学报;2003年14期
4 傅遍红,吴泽志;整合素在肝癌细胞侵袭和转移中的作用[J];重庆大学学报(自然科学版);2002年06期
5 李伟红;龚卫国;陈伟民;梁毅雄;尹克重;;基于SVM RFE的人脸特征选择方法[J];光电工程;2006年05期
6 刘芳;单核苷酸多态性与高脂血症[J];国外医学.临床生物化学与检验学分册;2001年04期
7 李辉,侯井榕,杨宁宁;广西六甲人来源的分子人类学分析[J];广西民族学院学报(哲学社会科学版);2002年05期
8 李光荣;赵明祥;左丽;刘芳;况时祥;;载脂蛋白E基因多态性与散发阿尔茨海默病的关系[J];贵阳医学院学报;2006年01期
9 张军英,Y.J.Wang,J.Khan,R.Clarke;基于类别空间的基因选择[J];中国科学E辑;2003年12期
10 李颖新,阮晓钢;基于支持向量机的肿瘤分类特征基因选取[J];计算机研究与发展;2005年10期
中国重要会议论文全文数据库 前5条
1 WANG Juan~1 Gong Xue-jing~1 CI Lin-lin~2 YAO Kang-ze~3 Information and Science Technology Academy,Beijing Institute of Technology,Beijing,100081,China;2,3.Information and High Technology Institute,Beijing,100085,China;Method for Feature Selection in SAR ATR Systems[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 6)[C];2005年
2 姚凯丰;陆文凯;张善文;肖焕钦;李衍达;;基于特征扩展和特征选择的油气预测方法[A];CPS/SEG2004国际地球物理会议论文集[C];2004年
3 Yao Kaifeng, Lu Wenkai State Key Laboratory of Intelligent Technology and Systems, Dept. of Automation, Tsinghua Vniversity , Beijing, China Zhang Shanwen, Xiao Huanqin Shengli Oil field Limited Company, Dongying, Shandong Province, China Li Yanda State Key Laboratory of Intelligent Technology and Systems, Dept. of Automation, Tsinghua University, Beijing , China;Hydrocarbon reservoir prediction using a feature expansion and feature selection method[A];Expanded Abstracts CPS/SEG 2004 International Geophysical Conference (Volume Ⅱ)[C];2004年
4 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
5 陈益定;郑树;余捷凯;;血清蛋白质指纹图谱在大肠癌早期诊断中的应用[A];第三届中国肿瘤学术大会教育论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 施锦绣;I.人类21号染色体已知基因序列多态研究及与灵长类动物基因序列比较 II.应用SNP寻找复杂疾病致病基因,环境因子敏感基因及HBV病毒株的研究[D];中国科学院研究生院(上海生命科学研究院);2002年
2 冯刚;小鼠创伤反应异质性相关基因的筛选与克隆[D];第三军医大学;2002年
3 李冬娜;侾黎、杞黎永生细胞库的建立与Y染色体DNA多态性研究[D];第三军医大学;2002年
4 李非;MRL/lpr自发性狼疮小鼠Th1/Th2的表达及复方中药肾怡调控的机理研究[D];中国人民解放军军医进修学院;2003年
5 李琳琳;膳食因素和Calpain-10基因与维吾尔族哈萨克族2型糖尿病[D];新疆医科大学;2003年
6 黄艳群;鸡多趾候选基因Lmbr1的克隆和功能研究[D];四川农业大学;2003年
7 崔永安;原发性肝癌的中西医结合治疗及砒霜制剂抗肝癌肿瘤血管形成的实验研究[D];南京中医药大学;2003年
8 叶青海;肝细胞癌转移预测模型的建立及其转移相关基因的筛选——cDNA微阵列技术分析[D];复旦大学;2002年
9 梁玉龙;β1族整合蛋白过表达对人肝癌细胞细胞周期的调控及其机制研究[D];复旦大学;2003年
10 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
中国硕士学位论文全文数据库 前10条
1 郭刚;载脂蛋白B、CⅢ、E基因多态性与脂肪肝患者脂代谢关系的研究[D];新疆医科大学;2004年
2 蔡月明;纤维蛋白原Bβ启动区单核苷酸多态性与脑梗死关联研究[D];暨南大学;2002年
3 张莹;部分中国人群ABO血型分泌型α(1,2)-岩藻糖转移酶基因(FUT2)多态性研究[D];东北农业大学;2002年
4 尹巧香;载脂蛋白E基因多态性与代谢综合征及冠心病的关联研究[D];中国人民解放军军医进修学院;2003年
5 方明;血管紧张素Ⅱ1型受体基因A1166/C多态性与高血压病的关联研究[D];暨南大学;2003年
6 吕贯廷;基于TDI-FP技术的高通量单核苷酸多态性分析系统的建立和初步应用[D];中国人民解放军第四军医大学;2003年
7 宫立国;1、人类单纯性先天性心脏病中TBX5基因的突变及表达研究  2、单纯性先天性心脏病易感区域12q13内相关基因SNPs分析[D];中国医科大学;2003年
8 涂荣剑;猪解耦联蛋白基因3(UCP3)的序列及多态性研究[D];华中农业大学;2003年
9 刘申岭;基于SVM的基因选择[D];西安电子科技大学;2004年
10 刘清利;中国北方汉族群体HLA-DRA基因座3个SNPs位点遗传多态性及法医学应用研究[D];中国医科大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 陆运青;自我放松训练减轻考场焦虑效果考查[J];健康心理学杂志;1999年03期
2 刘广珠;沙拉松考试焦虑量表试用报告[J];健康心理学杂志;2000年04期
3 赵荣霞,李惠英,闫克乐;渐进性放松、腹式呼吸训练消除焦虑,提高高考成绩的实验研究[J];健康心理学杂志;2003年04期
4 刘素贞;张翠红;朱金富;曹素霞;许明智;;综合性团体干预对大学生考试焦虑的影响[J];临床心身疾病杂志;2006年01期
5 王伟红;刘薇;邸向瑜;;生物反馈疗法干预医学生考试焦虑效果评价[J];临床心身疾病杂志;2007年04期
6 韩磊;王鹏;高峰强;;青少年人格特征与考试焦虑的相关研究[J];山东省青年管理干部学院学报;2006年03期
7 李江雪;申荷永;;沙盘游戏疗法的形成与应用[J];社会心理科学;2005年02期
8 谭美婵,肖振华;团体咨询干预过度考试焦虑的研究[J];上海教育科研;2002年10期
9 郑凤英,彭少麟;Meta分析中几种常用效应值的介绍[J];生态科学;2001年Z1期
10 董巍,包飞;生物反馈疗法干预考试焦虑的效果观察[J];中国临床康复;2005年32期
中国博士学位论文全文数据库 前1条
1 田宝;高中生考试焦虑影响考试成绩的模式和对策研究[D];首都师范大学;2001年
中国硕士学位论文全文数据库 前5条
1 张媛芳;湖南省小学高年级学生考试焦虑的初步研究[D];湖南师范大学;2002年
2 陈顺森;箱庭疗法缓解初中生考试焦虑有效性的研究[D];河北大学;2005年
3 任智;理性情绪教育对初中学生考试焦虑的干预实验研究[D];湖南师范大学;2005年
4 张龙真;高中生考试焦虑的父母教养方式与人格特征研究[D];郑州大学;2006年
5 刘春艳;接受式音乐疗法缓解中学生考试焦虑作用的实验研究[D];四川师范大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 周艳宏;张必成;曾朝阳;张文玲;范松青;李小玲;熊炜;曹利;李伟芳;李桂源;;利用GenMAPP筛查鼻咽癌差异表达基因[J];生物化学与生物物理进展;2005年12期
2 陈志宏;严壮志;刘书朋;;基于模糊自适应共振网络简化模型方法的乳腺肿瘤基因分类[J];上海大学学报(自然科学版);2006年04期
3 张玲;伍亚舟;陈军;易东;;小波-神经网络方法在基因表达数据分析中的应用研究[J];重庆医学;2010年17期
4 武振宇;李康;;支持向量机在基因表达数据分类中的应用研究[J];中国卫生统计;2007年01期
5 罗万春;易东;;胎儿小脑基因表达多尺度降噪的y~n曲线模型[J];计算机工程与应用;2011年07期
6 武晓岩;李康;;基因表达数据判别分析的随机森林方法[J];中国卫生统计;2006年06期
7 武晓岩;闫晓光;李康;;基因表达数据的随机森林逐步判别分析方法[J];中国卫生统计;2007年02期
8 伍亚舟;张玲;罗万春;易东;;基因表达数据的多尺度特征提取与分类研究[J];计算机工程与应用;2009年13期
9 徐源;彭斌;邓宇;田考聪;;基于小波去噪的基因表达数据聚类集成算法的研究[J];重庆医科大学学报;2010年05期
10 马猛;钮俊清;宁岩;郑浩然;王煦法;;聚类和关联规则挖掘在基因表达数据分析中的应用研究[J];北京生物医学工程;2008年04期
中国重要会议论文全文数据库 前10条
1 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 徐光兴;;心理咨询与治疗的效果评估与研究的伦理困境[A];第十二届全国心理学学术大会论文摘要集[C];2009年
3 李昌庆;何木叶;;我国农民工SCL-90研究的元分析[A];第十二届全国心理学学术大会论文摘要集[C];2009年
4 张敏强;焦璨;;虚无假设检验应用的元分析及问题探析[A];第十二届全国心理学学术大会论文摘要集[C];2009年
5 王欣;;工作满意度与工作绩效的关系的元分析[A];中国社会心理学会2008年全国学术大会论文摘要集[C];2008年
6 谢章明;葛明贵;;学业成就影响因素的元分析[A];第十二届全国心理学学术大会论文摘要集[C];2009年
7 钱明;王栋;陈祖培;;缺碘、补碘和高碘对儿童智力影响的元分析[A];第九届全国心理学学术会议文摘选集[C];2001年
8 张慧英;宫火良;;述情障碍与心身疾病的关系[A];第十一届全国心理学学术会议论文摘要集[C];2007年
9 乔坤;周悦诚;;人力资源管理实践对组织绩效影响的元分析[A];第十届中国管理科学学术年会论文集[C];2008年
10 李凌;李强;;大学生择业焦虑的循证研究[A];第十二届全国心理学学术大会论文摘要集[C];2009年
中国重要报纸全文数据库 前10条
1 明贵栋;绿色GDP推行艰难 委员呼吁加快配套制度改革[N];中国工业报;2007年
2 本报记者 高慧斌;如何认识中国汽车产业发展趋势[N];辽宁日报;2005年
3 ;置信电气(600517)处在快速成长期[N];中国证券报;2007年
4 记者 唐星善;中铝广西分公司7项科技成果通过鉴定[N];中国有色金属报;2006年
5 本报记者 傅莲英;中国家纺产品魅力难抗拒[N];国际商报;2004年
6 ;直销企业欲在全球开千家零售店[N];消费日报;2007年
7 朱冰;“山寨机”海外遭封杀 国产品牌手机双重压力陷困局[N];中国高新技术产业导报;2008年
8 ;*ST三普年关喜获“保命钱”[N];医药经济报;2004年
9 胡荣山 马巍;上海海大一课题列入国家“863”计划[N];中国船舶报;2007年
10 刘佳;2006:量增房优功能全[N];黄石日报;2007年
中国博士学位论文全文数据库 前10条
1 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年
2 陆慧娟;基于基因表达数据的肿瘤分类算法研究[D];中国矿业大学;2012年
3 程慧杰;基于模式识别方法的基因表达数据分析研究[D];哈尔滨工程大学;2012年
4 杨锡南;基于基因芯片表达谱的癌症预后元分析方法研究[D];东南大学;2006年
5 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
6 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
7 裴永生;薄板多点成形过程有限元分析的研究[D];吉林大学;2004年
8 王广云;肿瘤基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2009年
9 蔡立军;基因分类及基因表达数据分析方法的研究[D];湖南大学;2007年
10 邱浪波;基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前10条
1 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年
2 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年
3 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年
4 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
5 张礼;寻找差异基因的概率方法研究[D];南京航空航天大学;2010年
6 张彦琦;基因调控网络建立的数学模型研究[D];第三军医大学;2003年
7 张志国;基于生成树基因表达数据聚类方法分析[D];东北大学;2006年
8 沈小乔;基因表达数据分类算法及其应用研究[D];湖南大学;2005年
9 朱婵;聚类算法在基因表达数据分析中的应用研究[D];暨南大学;2005年
10 杨小涛;支持向量机算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026