收藏本站
《湖南大学》 2016年
收藏 | 手机打开
二维码
手机客户端打开本文

基因表达谱数据的特征选择与分类算法研究

何晓明  
【摘要】:基因芯片技术能够快速的测量成千上万条基因的表达。随着微阵列技术广泛应用到肿瘤研究中,产生了大量高维小样本的基因表达谱数据。利用基因表达谱数据进行生物信息挖掘是生物信息领域的研究重点。如何从海量的基因表达谱数据中挑选冗余度小,分类能力好的特征基因,挖掘出有用的信息、更加清楚的认识肿瘤在基因层面的意义,对肿瘤的致病机理分析、临床诊断与治疗起到至关重要的作用。因此,寻找合适的数据处理方法来对基因表达谱进行数据挖掘成为一个亟待解决的难题。本文的研究工作主要包括两个方面:在特征选择方面,针对基因表达谱数据的高维、高噪声、高冗余的特点,从特征本身出发,提出了一种基于稀疏表示和最大相关最小冗余的基因选择方法。该算法分为两个层面:首先,利用稀疏表示系数来计算基因对于类别的重要程度,提取排名靠前的基因,删除不相关基因,降低数据维度;然后,稀疏表示系数用来计算在其余特征的影响之下,基因与基因之间的相关性。最后,使用改进的最大相关最小冗余的搜索策略对特征基因进行挑选,剔除冗余基因,获得最终的特征基因子集。这种方法不同于以往的将特征基因孤立看待的特征选择方法,充分考虑了在其他基因的影响之下,复杂的生物关系之中各特征之间的相互关系,能够有效的挑选特征基因,提高分类精度。在分类器方面,提出了一种基于加权元样本的核稀疏表示分类方法。在近几年,稀疏表示被证明具有良好的分类能力。针对稀疏表示分类方法不能很好的处理同方向分布的数据以及元样本提取过程中人为参数的设置影响实验结果这两个问题,本文提出一种基于加权元样本的核稀疏表示方法。首先,使用SVD分解每一个类的原始样本矩阵,通过矩阵变换的方式构造加权元样本矩阵,获得稀疏表示分类的字典。其次,用核稀疏表示的方法将其映射到多维空间,使得新的样本特征能够线性可分;最后,通过计算得到稀疏表示系数,使用残差比较来对样本进行分类。通过实验对比,与三种不同的分类方法相比较,证明了该方法的有效性。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:Q811.4;TP181

【参考文献】
中国期刊全文数据库 前5条
1 耿耀君;张军英;袁细国;;一种基于稀疏表示系数的特征相关性测度[J];模式识别与人工智能;2013年01期
2 石光明;刘丹华;高大化;刘哲;林杰;王良君;;压缩感知理论及其研究进展[J];电子学报;2009年05期
3 王树林;王戟;陈火旺;李树涛;张波云;;肿瘤信息基因启发式宽度优先搜索算法研究[J];计算机学报;2008年04期
4 李颖新,阮晓钢;基于支持向量机的肿瘤分类特征基因选取[J];计算机研究与发展;2005年10期
5 张丽新,王家廞,赵雁南,杨泽红;基于Relief的组合式特征选择[J];复旦学报(自然科学版);2004年05期
【共引文献】
中国期刊全文数据库 前10条
1 汤井田;李广;肖晓;李晋;周聪;朱会杰;;基于压缩感知重构算法的大地电磁强干扰分离[J];地球物理学报;2017年09期
2 韩哲;张霞;李鸥;张策;张大龙;;面向有损链路的传感网压缩感知数据收集算法[J];软件学报;2017年12期
3 程玉胜;胡飞;程百球;;面向高维数据PCA-ReliefF的EP模式分类算法[J];安庆师范学院学报(自然科学版);2015年04期
4 朴雪;吴昌明;;基于压缩感知的激光医学图像重建[J];激光杂志;2015年12期
5 谢昕;徐殷;熊焕东;李波;胡锋平;;基于压缩感知的SIFT图像匹配算法的研究[J];华东交通大学学报;2015年06期
6 包晓蕾;曲行根;王卓英;;基于压缩感知的稀疏重构DOA估计算法[J];武汉理工大学学报(信息与管理工程版);2015年06期
7 李廉林;周小阳;崔铁军;;结构化信号处理理论和方法的研究进展[J];雷达学报;2015年05期
8 李为峰;段晓君;;装备系统的回归试验设计与分析优化算法[J];数理统计与管理;2015年06期
9 于云;周伟栋;;基于稀疏表示的鲁棒性说话人识别系统[J];计算机技术与发展;2015年12期
10 周跃海;曹秀岭;吴燕艺;童峰;;时变信道下的被动时间反转扩频水声通信[J];应用声学;2015年06期
【二级参考文献】
中国期刊全文数据库 前10条
1 刘丹华;石光明;周佳社;;一种冗余字典下的信号稀疏分解新方法[J];西安电子科技大学学报;2008年02期
2 阮晓钢;晁浩;;肿瘤识别过程中特征基因的选取[J];控制工程;2007年04期
3 李建中;杨昆;高宏;骆吉洲;郭政;;考虑样本不平衡的模型无关的基因选择方法[J];软件学报;2006年07期
4 张春梅;尹忠科;肖明霞;;基于冗余字典的信号超完备表示与稀疏分解[J];科学通报;2006年06期
5 李颖新;李建更;阮晓钢;;肿瘤基因表达谱分类特征基因选取问题及分析方法研究[J];计算机学报;2006年02期
6 阮晓钢;李颖新;李建更;龚道雄;王金莲;;基于基因表达谱的肿瘤特异基因表达模式研究[J];中国科学C辑:生命科学;2006年01期
7 李颖新,阮晓钢;基于支持向量机的肿瘤分类特征基因选取[J];计算机研究与发展;2005年10期
8 王海芸,李霞,郭政,张瑞杰;四种模式分类方法应用于基因表达谱分析的比较研究[J];生物医学工程学杂志;2005年03期
9 朱云华,李颖新,阮晓钢;基于基因表达谱的SRBCT分类研究[J];计算机工程与应用;2005年01期
10 邓林,马尽文,裴健;秩和基因选取方法及其在肿瘤诊断中的应用[J];科学通报;2004年13期
【相似文献】
中国期刊全文数据库 前10条
1 豆玉凤;张国成;孙新;刘颖悦;王楠;黄娜;;基因表达谱技术:贵亦需有道[J];医学争鸣;2010年04期
2 潘海燕,朱军,韩丹夫;分析基因表达谱数据的新方法(英文)[J];浙江大学学报(农业与生命科学版);2004年05期
3 吴斌,黄信勇,王米渠,李常度;运用基因芯片研究骨关节炎虚寒证的基因表达谱述要[J];中医药学刊;2004年11期
4 韩光明,陈顺乐,沈南,王元;聚类分析在自身免疫病基因表达谱研究中的初步应用[J];中华检验医学杂志;2003年08期
5 孙德利,舒琦瑾;基因表达谱在中医药研究中的意义[J];中国中医药信息杂志;2002年01期
6 张渝;刘玉洁;郭丹妮;李惠敏;秦新民;;基于高通量测序的数字基因表达谱技术研究进展[J];北方园艺;2015年10期
7 刘先锋;卢学春;范利;高燕;马聪;罗芸;;奥美拉唑对人脐静脉内皮细胞全基因表达谱的影响及机制分析[J];南方医科大学学报;2012年04期
8 徐持华;张国良;夏颖;李玲;毕勇毅;;聚类分析在苯中毒患者肿瘤相关基因表达谱研究中的应用[J];数理医药学杂志;2006年02期
9 ;我国发现Ⅰ型糖尿病的多基因表达谱,有助于该病的预测[J];生物学教学;2014年09期
10 姜琳颖;余东海;石鑫;;基于加权极限学习机的肿瘤基因表达谱数据分类[J];东北大学学报(自然科学版);2017年06期
中国重要会议论文全文数据库 前10条
1 刘艳;李康;傅松滨;;基于小波分析理论的基因表达谱数据分析方法的研究[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
2 韦朝领;高香凤;江昌俊;;茶树对茶尺蠖取食诱导的基因表达谱差异初探[A];第四届海峡两岸茶业学术研讨会论文集[C];2006年
3 赵丽婷;郭长江;吴健全;杨继军;韦京豫;王宇平;高蔚娜;;槲皮素对大鼠肝脏基因表达谱的影响[A];中国营养学会特殊营养第七届学术会议会议资料汇编[C];2009年
4 张岩;张亮;周一鸣;安爽;果德安;周玉祥;曾令文;程京;;抗真菌物质与酵母细胞作用后全基因表达谱的聚类法分析[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
5 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第八届全国中西医结合血液病学术会议论文集[C];2007年
6 文志宁;张娟;张丽芳;蒋丽娜;李益洲;李梦龙;;癌症样本基因表达谱数据的解析与建模[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
7 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第三届海峡两岸中西医结合学术研讨会论文集[C];2005年
8 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2005年华东六省一市血液病学学术会议暨浙江省血液病学学术年会论文汇编[C];2005年
9 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];全国中西医结合血液病学术研讨会、浙江省中西医结合学会血液病专业委员会成立大会首次学术年会暨继续教育学习班论文汇编[C];2006年
10 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2006年浙江省血液病学学术年会论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 群芳;科学家发现幽门螺杆菌运动及致病基础[N];科学时报;2010年
2 记者 张晔 通讯员 周伟;我学者发现多基因表达谱[N];科技日报;2014年
3 余志平;寻找遗传学线索 提高化疗效果[N];中国医药报;2003年
4 记者 衣晓峰 通讯员 李小莲;探寻“证”的基因表达谱[N];中国中医药报;2009年
5 王雪飞 吴志军;我国建立大规模人胎肝基因表达谱[N];健康报;2006年
6 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
7 赵绍华;给孩子减肥必须“饿一饿”[N];健康时报;2007年
8 小依;回首 只因骄傲[N];医药经济报;2001年
9 本报记者 耿挺;生物节律紊乱基因编辑猕猴克隆成功[N];上海科技报;2019年
10 周艳萍;寻求肿瘤个体化治疗方案[N];健康报;2006年
中国博士学位论文全文数据库 前10条
1 刘健;基于机器学习的肿瘤基因表达谱数据分析方法研究[D];中国矿业大学;2018年
2 张菊红;自身免疫性内耳疾病相关的分子机制研究[D];山东大学;2018年
3 杨希林;EMP1基因在头颈部鳞癌中的作用及机制研究[D];武汉大学;2016年
4 陈涛;基因表达谱的数据挖掘方法研究[D];西北工业大学;2016年
5 张宝刚;铜离子激发拟南芥免疫机制的研究[D];山东农业大学;2018年
6 王士奇;先天性肛门直肠畸形发病的基因网络调控机制研究[D];重庆医科大学;2016年
7 王全顺;白血病细胞WT1基因的表达机理[D];中国人民解放军军医进修学院;2004年
8 段瑞峰;Pten基因敲除小鼠转录上调新基因pdd87的功能研究及Pten缺失的胚胎成纤维细胞的蛋白质组分析[D];中国人民解放军军事医学科学院;2004年
9 张金强;两条新的肺癌转移相关基因的获取、鉴定与功能研究[D];中国人民解放军军事医学科学院;2004年
10 钱军;骨髓增生异常综合征患者的基因表达谱研究[D];苏州大学;2004年
中国硕士学位论文全文数据库 前10条
1 刘娜;家蚕茧丝性状相关性分析及部分基因的功能研究[D];江苏科技大学;2018年
2 舒梦;基于基因表达谱数据的肿瘤分类算法研究[D];湖南大学;2016年
3 曹丹;基于肿瘤基因表达谱数据的分类算法研究[D];湖南大学;2015年
4 黄秋凤;番茄渐渗系IL9-1耐旱基因的定位和候选[D];华中农业大学;2016年
5 陈龙;崇明拟异小杆线虫与嗜线虫沙雷氏菌共生的基因表达谱及共生相关基因富集通路的研究[D];南京农业大学;2015年
6 何晓明;基因表达谱数据的特征选择与分类算法研究[D];湖南大学;2016年
7 姜露熙;灵芝细胞中参与灵芝酸生物合成细胞色素P450基因的筛选与分析[D];昆明理工大学;2018年
8 洪浩;基于度量学习的生物数据分析方法研究[D];国防科学技术大学;2017年
9 杜翠;基于基因表达谱的前列腺癌人种差异性的生物信息学研究[D];苏州大学;2018年
10 吴伟;基于基因表达谱数据的肿瘤分类研究[D];湖南大学;2016年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026