收藏本站
《武汉理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

支持向量机在基因表达数据分类中的研究

詹超  
【摘要】:基因芯片技术作为一种新的分子生物学技术,是影响深远的重大科技成就,它的出现对生物信息学产生一场革命,为生物信息学研究提供重要手段。通过基因芯片技术可以方便快捷的产生大量的基因表达数据,这些数据可以表现任何给定条件下的基因表达模式,从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。 支持向量机(Support Vector Machine,SVM)是一类基于统计学习理论的新型机器学习方法。由于它采用了结构风险最小化原则,能较好的解决小样本学习的问题,还采用核函数思想,把非线性空间的问题转换到线性空间,降低了算法的复杂度。正因为SVM有较完备的理论基础和较好的学习性能,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势,所以成为当前国际机器学习领域的研究热点,并在很多领域都得到了成功的应用。微阵列基因表达数据具有维数高、样本小、非线性的特点,这对一些传统的机器学习方法提出了新的挑战,对其数据的分析已成为生物信息学研究的焦点。 通过支持向量机训练算法对基因表达数据进行分类训练,为分析基因数据提供有效的手段。本文主要研究基于基因表达数据的支持向量机分类方法,并对已有的算法与模型当中存在的问题提出改进。针对基于基因表达数据的分类,本文从特征基因选择和支持向量机分类算法两个方面进行了改进。针对基因表达数据集具有“样本数目少,基因数目庞大”的特点,本文通过特征基因选择提高分类精度,采用基于相关性的递归特征消除方法。该方法通过计算基因间的相关性,在寻求数据最小冗余的同时,考虑了如何避免过度删除与目标表现型相关的基因。使用这种方法选择特征基因子集可度提高分类性能,特征选择效率也较高。在分析传统的SVM算法的基础上,本文对贯序最小优化算法作适当改进,以提高分类精度和训练速度。该算法采用径向基核函数,通过调整参数,优化支持向量机分类性能。实验结果表明新算法的分类准确率与传统的SVM算法相比有所提高。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王鑫;蒋华;;基于改进Multi-Agent系统的基因表达数据的分析与研究[J];计算机工程与设计;2008年09期
2 王加阳;吴祖剑;;基于粗糙信息熵的基因分析与选择研究[J];计算机应用研究;2008年06期
3 李小梅;郭红;;基因表达数据的模糊聚类技术研究[J];信息系统工程;2010年11期
4 周晓彦;郑文明;;基于模糊核判别分析的基因表达数据分析方法[J];华中科技大学学报(自然科学版);2007年S1期
5 石金龙;骆志刚;;非负矩阵分解算法及其在生物信息学中的应用研究[J];计算机工程与科学;2010年08期
6 李春涛;陈锋;白英龙;;一种反映数据生物特性的ART2神经网络[J];大众科技;2006年05期
7 曹晖;席斌;米红;;一种新聚类算法在基因表达数据分析中的应用[J];计算机工程与应用;2007年18期
8 孙丽君;苗夺谦;;基于粗糙集的基因表达数据分类研究[J];计算机工程;2007年16期
9 韩利;祁云嵩;王俊;;基于粗糙集的支持向量机微阵列数据分类方法[J];科学技术与工程;2009年01期
10 伍亚舟;张玲;罗万春;易东;;基因表达数据的多尺度特征提取与分类研究[J];计算机工程与应用;2009年13期
11 邓建钢;潘丽敏;罗森林;张铁梅;韩怡文;;不同胰岛素敏感状态下大鼠基因数据处理[J];计算机工程与设计;2007年10期
12 于宁;;创建标准化的生物信息互联网[J];国外医学情报;2003年02期
13 陈春燕;张久彪;;双层结构的基因表达数据聚类算法[J];福建电脑;2009年04期
14 郑国清,高亮之;农业生物信息学[J];计算机与农业;2002年09期
15 马相如,陈焕春;优秀的基因组数据库管理软件——ACEDB[J];生物信息学;2004年03期
16 吕玉龙;沈青松;石铁流;王翼飞;;基于禁忌搜索和遗传算法的智能化双聚类方法[J];应用科学学报;2009年03期
17 周海廷;;生物信息智能化处理的进展[J];模式识别与人工智能;2004年03期
18 崔光照,曹祥红,王延峰,张勋才;生物信息学中的数字信号处理方法研究[J];科学技术与工程;2005年20期
19 李东晖,萧浪涛,洪彬,洪亚辉;专业化生物学文献检索系统的设计与开发[J];湖南农业大学学报;2001年02期
20 周海廷;机器学习与生物信息学[J];信息与控制;2003年04期
中国重要会议论文全文数据库 前10条
1 卢学春;杨波;于力;朱宏丽;范辉;姚善谦;楼方定;;靶向上调ID4基因表达药物及其抗白血病作用的生物信息学预测、分析和验证[A];中国科协海峡两岸学术研讨会——2008血液肿瘤论坛会议会编[C];2008年
2 李媛;崔尚金;李建伟;于康震;;分子生态学与生物信息学[A];中国畜牧兽医学会禽病学分会第十一次学术研讨会论文集[C];2002年
3 孙瑞祥;付岩;张京芬;李德泉;王海鹏;蔡津津;王晓彪;曾嵘;贺思敏;高文;;蛋白质组质谱信息处理的关键算法研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
4 陆文聪;钮冰;;基于数据挖掘的生物信息学研究进展[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
5 陈婷婷;郭婷婷;李林;安冬;;基于生物信息学的功能蛋白基因序列分类研究[A];2011年全国通信安全学术会议论文集[C];2011年
6 卢学春;杨波;朱宏丽;姚善谦;;采用生物信息学方法优化依硫磷酸联合方案治疗MDS的应用研究[A];中国科协海峡两岸学术研讨会——2008血液肿瘤论坛会议会编[C];2008年
7 杨波;卢学春;于力;朱宏丽;范辉;姚善谦;楼方定;;靶向上调ID4基因表达药物的生物信息学预测、分析和初步验证[A];第12届全国实验血液学会议论文摘要[C];2009年
8 阮林;何颖;邹泽红;傅意玲;陈惠芳;陶爱林;;外源蛋白过敏原性生物信息学评价[A];中华医学会2010年全国变态反应学术会议暨中欧变态反应高峰论坛参会指南/论文汇编[C];2010年
9 冯文龙;赵清杰;;基于遗传算法的DNA多序列比对问题[A];2007年中国智能自动化会议论文集[C];2007年
10 康晓东;;生物信息学及其研究对象[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
中国重要报纸全文数据库 前10条
1 本报记者 李恩青;生物信息学:促动BT与IT双赢[N];中国高新技术产业导报;2001年
2 刘义;生物信息学产业浮出水面[N];中国高新技术产业导报;2000年
3 英潮;生物信息学演绎“变脸”[N];中药报;2002年
4 中科院院士 强伯勤;生物信息学蕴有巨大效益[N];光明日报;2002年
5 白毅;加强生物信息学建设推动人类基因组研究[N];中国医药报;2002年
6 周颖;李梢:生物信息学为证候研究提供新视角[N];中国中医药报;2006年
7 中国科学院院士 张春霆 郝柏林;生物信息学孕育大产业[N];经济日报;2000年
8 刘丽丽;高性能计算为生物信息学加速[N];计算机世界;2007年
9 严飞;生物信息学 新世纪的新科学[N];大众科技报;2002年
10 张亚东;“交点”上的舞蹈[N];计算机世界;2002年
中国博士学位论文全文数据库 前10条
1 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年
2 王岩;生物信息学和生物信号识别领域的机器学习算法研究[D];吉林大学;2007年
3 张敏;生物信息学中多序列比对等算法的研究[D];大连理工大学;2005年
4 曾智勇;猪呼肠孤病毒SC-A株的分离鉴定及全基因组cDNA文库的构建和分子遗传特征分析[D];四川农业大学;2006年
5 肖庆;硬粒小麦硒蛋白的生物信息学研究[D];华中科技大学;2008年
6 张革新;α-淀粉酶性能与结构关系的生物信息学研究[D];江南大学;2005年
7 李艳芸;HLA-DRB1基因编码区SNPs的分析及其与宫颈癌的相关性研究[D];天津医科大学;2006年
8 童庆;面向基因预测的信息处理方法研究[D];中国科学技术大学;2006年
9 刘立芳;生物信息学中的多序列比对与模体识别问题研究[D];西安电子科技大学;2006年
10 郭雨珍;蛋白质结构预测和比较的优化研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 詹超;支持向量机在基因表达数据分类中的研究[D];武汉理工大学;2006年
2 李萍;基于基因表达数据的胃癌特征基因选取研究[D];北京工业大学;2009年
3 黄金;聚类和分类技术在生物信息学中的应用[D];黑龙江大学;2005年
4 杨小涛;支持向量机算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
5 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
6 张秋水;支持向量机在基因表达数据中的研究[D];厦门大学;2007年
7 张小丹;基于支持向量机的基因表达数据特征选取方法研究[D];苏州大学;2008年
8 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年
9 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年
10 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978