收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

机器学习方法在生物信息学中的应用

刘太岗  
【摘要】: 近年来,随着基因组测序技术和物质结构解析技术的发展,生物序列和结构的数据呈指数形式增长.传统的生物实验方法已不能满足目前处理这些海量生物数据的需要.在这种情况下,生物信息学应运而生,其目的在于通过对生物数据的获取、加工、存储、检索与分析,揭示数据所蕴含的生物学意义.从信息科学技术的角度来看,生物信息学的研究是一个从“数据”到“发现”的过程.基于机器学习的数据挖掘技术在生物信息学研究中正发挥着越来越重要的作用,并取得了丰硕的成果.本文针对机器学习方法在生物信息学中的若干应用进行了研究,主要成果如下: (1)在第二章,提出了两种蛋白质结构类预测的新方法.第一种方法利用基于符号序列复杂度的距离度量构造k-近邻分类器,避免了蛋白质序列特征提取过程中的信息丢失.在标准数据集上的测试结果验证了该方法的有效性.第二种方法把传统的氨基酸组分和双肽组分推广到基于蛋白质序列PSI-BLAST profile(即PSSM矩阵)的情形,并利用支持向量机进行预测.该方法在具有较低序列相似性的数据集上取得了比较满意的预测结果. (2)在第三章,提出了一种改进的伪氨基酸组分模型预测凋亡蛋白的亚细胞定位.该模型利用自协方差变换从PSSM矩阵中提出序列特征,并使用支持向量机作为预测器.测试实验表明该模型具有良好的预测性能. (3)在第四章,首先利用ATTED-Ⅱ数据库提供的基因共表达数据构建了拟南芥全基因组的共表达网络,然后提出一种子图诱导的策略和基于最大团的图聚类算法改进了共表达基因的聚类,最后利用四种经典的模体搜索算法从每一组共表达基因中预测转录因子结合位点.实验结果验证了该方法的有效性和实用性. (4)在第五章,以模式植物拟南芥为研究对象,利用支持向量机预测转录因子和靶基因之间的调控关系.该方法利用基因表达谱数据构造特征向量,并在我们自己构建的数据集上取得了较高的预测准确度.


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吕建;徐家福;;软件自动化的智能化途径[J];科学通报;1993年02期
2 许程;;机器学习的主要策略与基本结构[J];科技资讯;2010年03期
3 苏剑波;;第3届IEEE机器学习与控制论国际会议[J];国际学术动态;2005年02期
4 张家重,段会川,范绍军,江志超;机器学习与问题求解[J];山东师大学报(自然科学版);1995年01期
5 蒋培;基于共同进化遗传算法的机器学习[J];湖南师范大学自然科学学报;2004年03期
6 李凡长,康宇;基于Lie群的机器学习理论框架[J];云南民族大学学报(自然科学版);2004年04期
7 张祖勇;孙龙清;;基于支持向量机的miRNA预测方法研究[J];中国科技信息;2008年20期
8 罗芳;李志亮;;基于分类的机器学习方法中的决策树算法[J];宁德师专学报(自然科学版);2009年01期
9 宋婉娟;张剑;;基于机器学习的网络入侵检测[J];科技信息;2009年23期
10 刘日仙;袁利永;谷文祥;;智能规划学习和学习型智能规划系统架构研究[J];东北师大学报(自然科学版);2010年02期
11 刘弘,孙文星,刘希玉;一个多Agent设计概念学习系统[J];西南师范大学学报(自然科学版);2001年04期
12 承向军,贺振欢,杨肇夏;基于遗传算法的交通信号机器学习控制方法[J];系统工程理论与实践;2004年08期
13 谢承泮;;神经网络发展综述[J];科技情报开发与经济;2006年12期
14 赵志升;罗德林;李海英;;数据挖掘技术与应用[J];河北北方学院学报(自然科学版);2006年06期
15 郭雪松;孙林岩;徐晟;;基于超球结构的支持向量机增量学习算法[J];运筹与管理;2007年04期
16 李时卓;阎满富;;基于数据的机器学习问题[J];唐山师范学院学报;2007年05期
17 孙霞;董乐红;;基于监督学习的同义关系自动抽取方法[J];西北大学学报(自然科学版);2008年01期
18 胡亮;金刚;于漫;任斐;任维武;;基于异常检测的入侵检测技术[J];吉林大学学报(理学版);2009年06期
19 陈祎荻;秦玉平;;基于机器学习的文本分类方法综述[J];渤海大学学报(自然科学版);2010年02期
20 赵致琢;;专家系统研究[J];贵州大学学报(自然科学版);1990年02期
中国重要会议论文全文数据库 前10条
1 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
2 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
5 张郴;;基于神经网络集成的旅游需求预测模型[A];中国地理学会百年庆典学术论文摘要集[C];2009年
6 吴宪祥;于培松;万旻;倪伟;郭宝龙;;RoboCup中智能体的参数优化和学习[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
7 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
8 杨磊;黎志成;胡斌;;基于人工神经网络的调度规则确定专家系统[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
9 张燕;张付志;;跨系统个性化服务方法和用户模型研究[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
10 陈时敏;韩心慧;;基于机器学习的网页木马识别方法研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 何斌;基于可拓逻辑的机器学习理论与方法[D];华南理工大学;2005年
2 王国胜;支持向量机的理论与算法研究[D];北京邮电大学;2008年
3 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
4 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
5 刘长安;基于实例归纳的工艺规划方法及集成CAPP系统研究[D];山东大学;2003年
6 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
7 钟志;基于异常行为辨识的智能监控技术研究[D];上海交通大学;2008年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
10 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
2 向光;基于机器学习和数据挖掘的入侵检测技术研究[D];东北大学;2005年
3 亢华爱;入侵检测系统中基于代价敏感分类算法的研究[D];太原理工大学;2005年
4 张金伟;基于Agent网络答疑系统的设计与实现[D];华东师范大学;2006年
5 王晶;支持向量机及其在癌症诊断中的应用研究[D];东北师范大学;2006年
6 万辉;自主载体语义级环境建模和规划的研究与实现[D];沈阳工业大学;2006年
7 黄际洲;聊天机器人知识库自动抽取算法的研究与实现[D];重庆大学;2006年
8 孟祥山;工作流流程优化技术的应用研究[D];国防科学技术大学;2004年
9 芦明;语义网服务中基于机器学习的本体映射研究[D];大连海事大学;2008年
10 马波;支持向量机多类分类算法的分析与设计[D];扬州大学;2008年
中国重要报纸全文数据库 前10条
1 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
2 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
3 记者 何边;网络化激活人工智能[N];计算机世界;2001年
4 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 傅秋瑛;默默耕耘数十载 自主创新结硕果[N];科技日报;2006年
7 王育昕吴红梅;高水平原创性科技成果大量涌现[N];新华日报;2008年
8 冯卫东;科技将这样改变我们的生活[N];科技日报;2008年
9 杰逊;微软的第一个搜索技术掌门[N];中国计算机报;2006年
10 记者 刘垠;首届中美视觉夏令营开营[N];大众科技报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978