收藏本站
《吉林大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

模糊积分在蛋白质功能预测上的应用

赵研  
【摘要】:随着人类基因组计划的完成,人类步入后基因时代,生物信息学的研究重点也由基因开始逐步转向蛋白质。蛋白质是完成生命体各种活动必不可少的物质,对蛋白质功能进行预测对探究生命奥秘有着十分重要的意义。 海量性是生物信息数据的一个基本特点,而各种实验和计算手段的进步则带来的生物信息数据的多样。随着国内外对蛋白质功能预测研究的进展,同时结合生物信息数据海量多源的天然属性,人们发现使用异源生物数据融合方法能有效提高预测效果。多种数据源之间不仅能形成信息互补,而且蕴含的信息总量也更大。模糊测度能同时反映对象的重要程度和对象间的交互信息,能挖掘出更多对象中包含的信息。因此本文从异源生物数据角度出发,使用基于模糊测度的模糊积分融合多种异源生物数据对蛋白质功能进行预测,其中模糊测度的确定本文使用粒子群算法,基础分类器使用支持向量机。为防止过拟合,本文所有实验均使用5折交叉验证。实验表明基于模糊积分的异源生物数据融合方法能有效提高预测效果,同时该方法优于ADD融合和SVM数据层融合;与一些基于单数据源的预测方法相比,本文的异源生物数据融合方法表现出了明显的优势,在对酵母蛋白质的15个FunCat功能类预测中明显优于基于单数据源的K近邻方法和多分类器集成方法;实验还表明数据源之间的交互信息大小对本文基于模糊积分的异源生物数据融合方法有很大影响。
【关键词】:模糊测度 粒子群算法 模糊积分 数据融合 蛋白质功能预测
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:Q51
【目录】:
  • 提要4-5
  • 摘要5-7
  • Abstract7-11
  • 第1章 绪论11-22
  • 1.1 课题背景及意义11-17
  • 1.2 蛋白质功能预测国内外研究现状17-20
  • 1.3 论文组织结构20-22
  • 第2章 蛋白质功能预测的机器学习与融合方法22-40
  • 2.1 FunCat 和 GO 蛋白质功能注释系统22-24
  • 2.1.1 FunCat 注释系统22-23
  • 2.1.2 GO 注释系统23-24
  • 2.2 常用蛋白质功能预测机器学习方法24-30
  • 2.2.1 支持向量机24-26
  • 2.2.2 决策树26-27
  • 2.2.3 贝叶斯分类27-29
  • 2.2.4 K 均值聚类29-30
  • 2.3 数据融合30-35
  • 2.3.1 数据融合层次30-32
  • 2.3.2 数据融合模型32-34
  • 2.3.3 数据融合与生物信息学34-35
  • 2.4 多分类器集成35-39
  • 2.4.1 多分类器集成方法36-37
  • 2.4.2 分类器多样性的度量37-39
  • 2.4 本章小结39-40
  • 第3章 基于模糊积分的蛋白质功能预测40-49
  • 3.1 预备知识40-44
  • 3.1.1 模糊测度40-41
  • 3.1.2 模糊积分41-42
  • 3.1.3 粒子群算法42-44
  • 3.2 基于模糊积分的蛋白质功能预测44-47
  • 3.2.1 gλ模糊测度的确定44
  • 3.2.2 算法实现流程44-46
  • 3.2.3 预测效果的验证和评价46-47
  • 3.3 本章小结47-49
  • 第4章 实验和结果分析49-61
  • 4.1 数据源收集和处理49-52
  • 4.1.1 PPI 数据49-50
  • 4.1.2 Blast 数据50-51
  • 4.1.3 Domain 和 HMM_logE 数据51
  • 4.1.4 Exp 数据51-52
  • 4.1.5 融合数据集52
  • 4.1.6 标准样本集的选取52
  • 4.2 预测功能类52-53
  • 4.3 参数设定53-54
  • 4.4 实验结果分析54-59
  • 4.4.1 基于模糊积分的异源生物数据融合的蛋白质功能预测54-56
  • 4.4.2 Choquet 异源生物数据融合与基于单数据源方法的比较56-58
  • 4.4.3 交互信息对 Choquet 异源生物数据融合效果的影响58-59
  • 4.5 本章小结59-61
  • 第5章 总结与展望61-63
  • 5.1 总结61-62
  • 5.2 下一步工作展望62-63
  • 参考文献63-67
  • 作者简介及在学期间所取得的科研成果67-68
  • 致谢68

【相似文献】
中国期刊全文数据库 前10条
1 田凤权;朱庆华;;基于模糊积分的中小物流企业成长软因素评价研究[J];科技管理研究;2011年14期
2 夏俊士;杜培军;张伟;;遥感影像多分类器集成的关键技术与系统实现[J];科技导报;2011年21期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 夏俊士;杜培军;张伟;;遥感影像多分类器集成系统的设计与实现[A];中国测绘学会2010年学术年会论文集[C];2010年
2 张黔荣;陈世权;吴今培;;交通环境质量的模糊积分模式[A];模糊集理论与模糊应用专辑——中国系统工程学会模糊数学与模糊系统委员会第十届年会论文选集[C];2000年
3 于文爽;李晓奇;;基于Choquet积分与(N)积分的(Y)模糊积分[A];第七届中国不确定系统年会论文集[C];2009年
4 关菁华;刘大有;贾海洋;;自适应多分类器集成学习算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 贾旭光;刘晋;;基于模糊积分的供应商风险评价[A];2005年中国智能自动化会议论文集[C];2005年
6 张强;高自友;李军;;交通运输系统综合评价的模糊积分法[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
7 俞强;陆佶人;方世良;;模糊积分在多传感器信息融合中的应用[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
8 朱小燕;史一凡;马少平;;脱机手写体字符识别研究[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
9 王熙照;邢红杰;;利用模糊积分处理模糊规则中的交互影响[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年
10 郭丽珍;李晓奇;;基于三种模糊积分的分类器方法及其改进[A];第四届中国智能计算大会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 易正俊;多源信息智能融合算法[D];重庆大学;2002年
2 梁继民;多传感器决策融合方法研究[D];西安电子科技大学;1999年
3 付耀文;雷达目标融合识别研究[D];中国人民解放军国防科学技术大学;2003年
4 曲盛恩;供应链绩效评价的系统研究[D];哈尔滨工程大学;2006年
5 孟琦;战略联盟竞争优势获取的协同机制研究[D];哈尔滨工程大学;2007年
6 查敦林;供应链绩效评价系统研究[D];南京航空航天大学;2003年
7 林剑;基于模糊理论的遥感图像分割方法研究[D];中南大学;2003年
8 罗红霞;地学知识辅助遥感进行山地丘陵区基于系统分类标准的土壤自动分类方法研究[D];武汉大学;2005年
9 吴丹;通信信号调制方式分类识别算法研究[D];哈尔滨工业大学;2007年
10 胡学海;机载多传感器目标信号属性融合研究[D];电子科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 潘翔;基于多分类器集成的模式识别研究[D];浙江工业大学;2002年
2 赵研;模糊积分在蛋白质功能预测上的应用[D];吉林大学;2012年
3 黄亦男;复模糊积分及其应用[D];海南师范大学;2011年
4 赵春广;模糊积分在多元分析中的应用研究[D];东北大学;2008年
5 张彩坡;模糊积分及多分类器融合在医疗诊断中的应用[D];天津理工大学;2010年
6 康恒政;多分类器集成技术研究[D];西南交通大学;2011年
7 张小爱;模糊集上的k-拟可加模糊积分的性质及结构特性[D];东北大学;2009年
8 郭丽珍;Choquet-like模糊积分及其收敛定理[D];东北大学;2010年
9 李春江;集合划分上的模糊积分与ID3算法[D];河北大学;2010年
10 孙琳娜;基于模糊积分的图像处理的研究[D];东北大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026