收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于DNA微阵列数据的癌症分类技术研究

于化龙  
【摘要】: 随着人类基因组计划的基本完成,生命科学的进程进入了后基因组时代,在后基因组时代,研究的重点从对单个基因的研究上升到了对整个基因组功能和动态变化规律的研究,从而产生了对海量生物信息进行处理的需求。DNA微阵列(也称基因芯片)技术的出现是后基因组时代的一个主要标志,同时也是目前生物信息学研究的主要领域之一。通过此技术,可以同时检测成千上万个基因在生物体内的活性,为从分子层次上对疾病,尤其是癌症进行诊断、分型、致病机理的研究以及药物的快速开发提供了极大的便利。但是由于实验成本的限制,使得微阵列数据集通常包含的样本数较少,因此造成了其高维小样本的特点。如何从这些高维小样本数据中挖掘有用的生物学信息并使用这些信息对癌症的检测与分型提供有效的指导,便成为了机器学习与模式识别领域研究的当务之急。本文主要围绕癌症微阵列数据分类问题开展研究,具体研究成果主要包括: (1)缠绕型特征基因选择方法通常具有以下两个缺点:收敛速度过慢和易陷入局部最优。故此提出了两种基于群集智能的特征基因选择方法:基于蚁群的特征基因选择方法和基于改进的离散粒子群的特征基因选择方法。前者实现简单,且可以快速的获取一个较优解,有效地解决了现有方法收敛速度过慢的问题。而后者则通过增加一条简单的规则使算法可以巧妙地避开局部最优解,具有更强的寻优能力。 (2)针对现有的选择性集成分类方法通常具有较高时间复杂度的问题,提出了一种基于相关分析的集成分类方法,其通过将差异的选择从分类器层转换到训练子集层这一巧妙的策略有效地降低了计算的复杂度,同时可以保持分类的准确率并节省存储的开销,具有较强的实用性。 (3)提出了一种基于可信分析的多类微阵列数据分类方法。该方法的思想是首先使用“一对多”支持向量机对样本进行分类,然后评估分类结果的可信性,对可信度低的样本采用一种称为基于质心距离的类别优先级评估方法进行评判。该方法的优势在于提高了分类的精度,且并未在计算复杂度方面有显著地增加。 (4)考虑微阵列数据集小样本的特性,提出了一种基于无标签样本的癌症增量诊断方法。该方法的思想是首先使用现有的有标签样本训练一个诊断系统,使其在实际的临床诊断中为测试样本作出判别,并对判别结果的可信度作出定量的评估。然后根据可信度的高低来决定是否需要人类医学专家的辅助判别。最后将新标记的样本加入到有标签样本集中并更新系统。该方法在保证诊断精度的同时,兼顾了系统的利用率,同时可使诊断系统的性能得到增量的提高。与传统方法相比,其在实际临床诊断中具有更强的实用性。
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:R730.4

【引证文献】
中国期刊全文数据库 前1条
1 黄丹凤;祁云嵩;许姗娜;;基于粗糙集和蚁群算法的特征基因选择方法[J];计算机技术与发展;2012年06期
中国博士学位论文全文数据库 前1条
1 程慧杰;基于模式识别方法的基因表达数据分析研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前3条
1 陈文;基于演化硬件的DNA微阵列数据分类方法研究[D];重庆邮电大学;2012年
2 孙伟平;面向转化医学的生物信息学数据融合与搜索算法研究及应用[D];中南大学;2012年
3 黄丹凤;基因微阵列数据特征选择与分类方法研究[D];江苏科技大学;2012年
【参考文献】
中国期刊全文数据库 前9条
1 李颖新,阮晓钢;基于支持向量机的肿瘤分类特征基因选取[J];计算机研究与发展;2005年10期
2 龙军;殷建平;祝恩;赵文涛;;主动学习研究综述[J];计算机研究与发展;2008年S1期
3 周志华,陈世福;神经网络集成[J];计算机学报;2002年01期
4 李颖新;李建更;阮晓钢;;肿瘤基因表达谱分类特征基因选取问题及分析方法研究[J];计算机学报;2006年02期
5 王树林;王戟;陈火旺;李树涛;张波云;;肿瘤信息基因启发式宽度优先搜索算法研究[J];计算机学报;2008年04期
6 邓林,马尽文,裴健;秩和基因选取方法及其在肿瘤诊断中的应用[J];科学通报;2004年13期
7 唐发明,王仲东,陈绵云;支持向量机多类分类算法研究[J];控制与决策;2005年07期
8 李建中;杨昆;高宏;骆吉洲;郭政;;考虑样本不平衡的模型无关的基因选择方法[J];软件学报;2006年07期
9 ;Prominent feature selection of microarray data[J];Progress in Natural Science;2009年10期
【共引文献】
中国期刊全文数据库 前10条
1 马宁;李斌;;基于神经网络集成的车牌字符识别[J];安徽广播电视大学学报;2012年02期
2 蔡坤琪;;基于相关鉴别分析和随机森林的人脸识别方法[J];安徽电子信息职业技术学院学报;2012年01期
3 庄振华;王年;李学俊;梁栋;王继;;癌症基因表达数据的熵度量分类方法[J];安徽大学学报(自然科学版);2010年02期
4 陈乐;王年;苏亮亮;王蕊平;;基于邻接谱主分量分析的肿瘤分类方法[J];安徽大学学报(自然科学版);2011年04期
5 叶爱霞;王年;苏亮亮;;基于非负矩阵分解和Normal_Matrix的肿瘤基因分类[J];安徽大学学报(自然科学版);2012年03期
6 李豹;;并行神经元集成在风险评估中的应用[J];安徽工程科技学院学报(自然科学版);2009年04期
7 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
8 李亭;杨敬锋;彭晓琴;陈志民;;基于最大似然法集成的黄曲条跳甲预警模型[J];安徽农业科学;2008年25期
9 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
10 牟少敏;田盛丰;尹传环;;基于协同聚类的多核学习[J];北京交通大学学报;2008年02期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;Predictive Control Based on Multi-network for a Deep Seabed Mining Robot Vehicle[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 刁智华;母媛媛;;一种基于马氏距离的SVM决策树多类分类算法[A];中国自动化学会控制理论专业委员会B卷[C];2011年
4 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
5 贾少春;胡秀珍;;A Method of Predicting theβ-hairpin Motifs in Proteins[A];第四届全国生物信息学与系统生物学学术大会论文集[C];2010年
6 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 居胜峰;王中卿;李寿山;周国栋;;情感分类中不同主动学习策略比较研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 李胜朋;王洪礼;冯剑丰;;基于不连续回归树的最大李雅谱诺夫指数计算方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
9 武进;尹恺;王长明;张家才;;SVDM在蔬菜病害图像分类中的应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
10 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
2 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
3 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
4 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
5 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
6 章鹏;多尺度特征检测:方法和应用研究[D];中国科学技术大学;2010年
7 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
8 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
9 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
10 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 王萍;语音情感识别研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
5 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
6 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
7 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
8 吴正娟;特征变换在组合分类中的应用研究[D];郑州大学;2010年
9 曹彦;基于支持向量机的特征选择及其集成方法的研究[D];郑州大学;2010年
10 周驰;数据流上概念漂移的检测和分类[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 蒋行志;刘荣玉;;分子生物标志物在肺癌早期诊断中的价值[J];安徽医学;2011年01期
2 高琴;张燕蕾;谢志耘;张其鹏;胡章志;;caCORE——美国癌症研究的生物信息核心框架[J];北京大学学报(医学版);2006年02期
3 刘智珺;彭媛;;XML的生物信息数据的存储与实现[J];电脑编程技巧与维护;2009年18期
4 赵曙光,刘贵喜,王军宁,杨万海;基于自适应遗传算法的模拟电路自动设计方法[J];电子学报;2004年04期
5 卢新国;林亚平;王海军;李小龙;易叶青;;基于微阵列基因表达谱的一种关联空间的癌症分类算法[J];电子学报;2008年04期
6 朱明旱;罗大庸;易励群;;一种序列的加权kNN分类方法[J];电子学报;2009年11期
7 吴郢,阎平凡;结构自适应自组织神经网络的研究[J];电子学报;1999年07期
8 李晓凯;郭红;;一种可变长子片段对拼接的DNA双序列局部比对算法[J];广西师范大学学报(自然科学版);2008年04期
9 张蔚;方芙蓉;徐小霞;洛若愚;;用基因芯片技术检测宫颈癌患者相关基因的差异表达[J];武汉大学学报(医学版);2007年01期
10 程学云;吉根林;徐慧;;支持向量机及其改进算法研究[J];信息技术;2006年10期
中国博士学位论文全文数据库 前4条
1 卢新国;基于DNA微阵列基因表达谱数据的癌症检测研究[D];湖南大学;2007年
2 蔡立军;基因分类及基因表达数据分析方法的研究[D];湖南大学;2007年
3 刘昆宏;多分类器集成系统在基因微阵列数据分析中的应用[D];中国科学技术大学;2008年
4 邱浪波;基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2007年
中国硕士学位论文全文数据库 前5条
1 马煜;微阵列数据的聚类算法研究[D];西北大学;2006年
2 吴希贤;基于优化算法的基因选择与癌症分类[D];湖南大学;2008年
3 张伟;基于进化算法的硬件演化基础研究[D];南京理工大学;2008年
4 盛高斌;基于半监督回归的选择性集成算法及其应用研究[D];浙江工业大学;2009年
5 高倩倩;基因表达数据的聚类算法研究及其实现[D];江南大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 阮晓钢;李颖新;李建更;龚道雄;王金莲;;基于基因表达谱的肿瘤特异基因表达模式研究[J];中国科学C辑:生命科学;2006年01期
2 李颖新,阮晓钢;基于支持向量机的肿瘤分类特征基因选取[J];计算机研究与发展;2005年10期
3 朱云华,李颖新,阮晓钢;基于基因表达谱的SRBCT分类研究[J];计算机工程与应用;2005年01期
4 崔伟东;周志华;李星;;神经网络VC维计算研究[J];计算机科学;2000年07期
5 李霞,张田文,郭政;一种基于递归分类树的集成特征基因选择方法[J];计算机学报;2004年05期
6 李颖新;李建更;阮晓钢;;肿瘤基因表达谱分类特征基因选取问题及分析方法研究[J];计算机学报;2006年02期
7 阮晓钢;晁浩;;肿瘤识别过程中特征基因的选取[J];控制工程;2007年04期
8 邓林,马尽文,裴健;秩和基因选取方法及其在肿瘤诊断中的应用[J];科学通报;2004年13期
9 马笑潇,黄席樾,柴毅;基于SVM的二叉树多类分类算法及其在故障诊断中的应用[J];控制与决策;2003年03期
10 周志华;何佳洲;陈世福;;神经网络国际研究动向——2000年国际神经网络联合大会评述[J];模式识别与人工智能;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 杨海银,刘祥红,陈榜军;基于肤色模型和神经网络的人脸检测算法[J];湖南科技学院学报;2005年11期
2 高虹;张建富;鲍旭东;;外周血白细胞自动识别分类系统的研制[J];医疗卫生装备;2006年06期
3 林其忠;余建国;赵暖;王威琪;王怡;陈亚青;;乳腺肿瘤超声图像的特征分析[J];仪器仪表学报;2006年S1期
4 李丹婷;程存归;杜正雄;何佑秋;孔黎春;;基于FTIR-SVM的西洋参与籽播参的分类研究[J];光谱学与光谱分析;2006年12期
5 林其忠;余建国;陈亚青;王威琪;王怡;;乳腺肿瘤超声图像识别模式分类方法的比较研究[J];上海医学影像;2006年02期
6 顾志伟;吴秀清;荆浩;尹东;王艺元;;一种基于特征选择的医学图像检索方法[J];中国生物医学工程学报;2007年01期
7 王耿媛;彭达明;余学飞;;应用PCA和BP神经网络的医学彩色图像语义标注[J];医疗卫生装备;2011年04期
8 李霞,张田文,李丽,郭政;决策树特征基因选择方法对SVM有效性的研究[J];中国生物医学工程学报;2004年01期
9 张小梅;计算机试题题库设计方案[J];卫生职业教育;2005年18期
10 胡爱萍;;《中国药物学集成》初评[J];湖北中医杂志;1987年04期
中国重要会议论文全文数据库 前10条
1 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
2 朱思俞;石锋;;不定人连续汉语音的四声识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
4 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
5 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
6 陈颖颖;张雁军;贾鑫;;通信信号调制识别方法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
8 肖惠玲;曾翎;黄海莹;张琳;王昱清;杨勤;陈华富;;支持向量机探测脑功能活动[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
9 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 叶强;李一军;;基于支持度-显著度的关联规则分类方法研究[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 钱秀丽;今年全力以赴做好五项重点工作[N];中国海洋报;2010年
2 记者 朱夕子;商业规划师何雨生日本设计师小川浩史加盟集成[N];中国纺织报;2009年
3 安向琦 赵鲜娜;从“孤岛”走向集成[N];中国航空报;2010年
4 本报记者 宋斌斌;研发设计信息化:新时期工业企业创新的源泉[N];中国工业报;2009年
5 证券时报记者 黄婷;宝钢股份自主集成冷轧产线在梅钢投产[N];证券时报;2009年
6 本报记者 同黎娜;集成控股收购日本设计公司始末[N];中国服饰报;2009年
7 ;在MCU中集成模拟和安全技术[N];中国电子报;2009年
8 见习记者 石俊;成飞集成缘何成为“第一妖股”[N];中华工商时报;2010年
9 吴绵;以顾客为中心森歌巡检集成灶[N];中国质量报;2009年
10 本报记者 林铭铭;成飞集成暴涨:讲不完的“锂电”故事?[N];21世纪经济报道;2010年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 宁博;面向行人检测的动态视觉词提取与集成分类方法研究[D];中国科学技术大学;2012年
3 王喆;面向模式表示与模式源的分类器设计方法研究[D];南京航空航天大学;2008年
4 谢元澄;分类器集成研究[D];南京理工大学;2009年
5 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
6 欧阳震诤;不平稳数据流的分类技术研究[D];国防科学技术大学;2009年
7 杨显飞;数据流集成分类器算法研究[D];哈尔滨工程大学;2011年
8 汪中;面向变化场景的行人分类检测方法研究[D];中国科学技术大学;2011年
9 杨艳屏;主动学习算法及其在心血管疾病诊断中的应用研究[D];华中科技大学;2010年
10 冯爱民;结构驱动的单类分类器设计及拓展研究[D];南京航空航天大学;2011年
中国硕士学位论文全文数据库 前10条
1 曹军;基于分类器集成学习的多变量质量诊断研究[D];南京理工大学;2012年
2 高丽;评估几种流行学习降维分类器应用于癌症数据的性能[D];天津师范大学;2012年
3 武婷婷;分类器性能评价研究[D];北京交通大学;2010年
4 王亚松;关于组合分类器修剪方法的研究[D];郑州大学;2011年
5 潘世瑞;基于分类器集成技术的数据流分类研究[D];西北农林科技大学;2011年
6 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
7 于柏森;发动机机械故障诊断系统分类器设计[D];长春工业大学;2010年
8 王秀霞;分类器的选择性集成及其差异性研究[D];兰州理工大学;2011年
9 于洋;基于基因表达谱的肿瘤特征基因选取研究[D];昆明理工大学;2012年
10 李婷俐;基于多特征级联分类器的道路车辆检测方法研究[D];湖南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026