收藏本站
收藏 | 论文排版

基于改进朴素贝叶斯的蛋白质提纯方法选择

李忠波  
【摘要】:蛋白质提纯是蛋白质工程中一个重要的研究课题,提纯方法主要与蛋白质属性相关,但并非简单的一一对应。现有提纯方法主要依靠试验人员根据蛋白质属性按照历史经验选择,且提纯试验过程复杂,成本较高。考虑到目前已有大量成功的提纯经验文献,可以根据提纯方法与蛋白质属性的相关性,利用数据挖掘中的分类方法来取代传统的工艺摸索方式,实现蛋白质提纯方法的快速摸索。 在分类准确率相同的条件下,朴素贝叶斯算法(Naive Bayes,NB)与神经网络、K-means等分类算法相比较,具有快速性、高效性、简洁性。为了减少计算的复杂度,传统朴素贝叶斯算法默认有两个假设,即:样本全部属性均为相互独立分布;数值型连续属性均满足正态分布。这种假设在一定范围内简化了问题,并达到很好的分类效果。但是,朴素贝叶斯算法的分类精度主要由样本数据的完整性和样本属性的性质综合决定。而在蛋白质提纯过程中,经验文献的表述不尽相同,在获取蛋白质样本数据的过程由于各种无法预测的原因总会出现数据的缺失,蛋白质样本属性也无法始终满足上述两条假设,从而导致分类精度降低。因此直接使用传统朴素贝叶斯方法,并不能有效实现提纯方法的快速摸索。 据此,本文在朴素贝叶斯分类算法基础上,建立了一种新算法——EM-KDNB。首先构建属性贝叶斯网络,引入EM算法利用不完整的数据进行参数学习,通过初始化缺失参数,并为每个潜在的初始值赋予权值,建立临权样本,利用新样本迭代收敛至局部最优,填补缺失的参数;然后,基于核密度估计(Kernel Density Estimation),利用分布密度函数(Distribution Density)和选取的局部数据来分析计算最大后验概率,完成分类。通过实验验证,新算法对缺失数据有一定程度的填补效果,对样本不满足正态分布的连续属性具有更好的适应性,分类精度较传统朴素贝叶斯算法也有所提高。 本文将改进的新算法应用到蛋白质提纯方法选择中,设计了完整的算法流程,并开发了蛋白质提纯方法选择应用系统,该系统实际应用效果良好,所得方案基本符合专家经验。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 钱颖能;胡运发;;用朴素贝叶斯分类法选股[J];计算机应用与软件;2007年06期
2 欧阳泽华;郭华平;范明;;在逐渐缩小的空间上渐进学习朴素贝叶斯参数[J];计算机应用;2012年01期
3 裴亚辉;熊盛武;;朴素贝叶斯及其扩展模型[J];网络安全技术与应用;2007年08期
4 赵彦琦;谢小西;荀宇畅;;朴素贝叶斯分类法的应用[J];电子制作;2013年07期
5 菅小艳;崔彩霞;;基于朴素贝叶斯的文本分类[J];电脑开发与应用;2013年12期
6 王实;高文;;增强型朴素贝叶斯学习[J];计算机科学;2000年04期
7 杨忠强;秦亮曦;;一种基于属性加权的朴素贝叶斯改进算法[J];广西大学学报(自然科学版);2013年05期
8 张彩丽;杨帆;张玉杰;;柴油机供油系统状态的朴素贝叶斯诊断方法研究[J];计算机测量与控制;2008年08期
9 白耀辉;陈明;王举群;;利用朴素贝叶斯方法实现异常检测[J];计算机工程与应用;2005年34期
10 王双成;冷翠平;侯彩虹;;操作风险等级预测的朴素贝叶斯方法研究[J];计算机工程与应用;2008年12期
11 谭小球;;基于朴素贝叶斯方法的数字化学习过程评价[J];现代计算机(专业版);2008年07期
12 安艳辉;董五洲;游自英;;基于改进的朴素贝叶斯文本分类研究[J];河北省科学院学报;2007年01期
13 李柏生;林亚平;鄢喜爱;;基于朴素贝叶斯网络的入侵检测分析[J];网络安全技术与应用;2007年09期
14 姜立标;马乐;余建伟;刘永花;;多阶段聚类—朴素贝叶斯的异常检测[J];重庆大学学报;2009年08期
15 周文刚;金鑫;;基于树扩展朴素贝叶斯的高效网络入侵检测系统[J];北京师范大学学报(自然科学版);2007年01期
16 杨光祖;王国军;;一种新的朴素贝叶斯属性选择算法[J];科学技术与工程;2009年04期
17 王小丽;远俊红;;基于加权朴素贝叶斯分类法的成绩预测模型[J];电子技术与软件工程;2013年19期
18 曾文赋;;样本-属性加权的朴素贝叶斯改进算法[J];微型机与应用;2014年06期
19 林国;;基于朴素贝叶斯的农业土地适宜性评价算法设计[J];杭州师范大学学报(自然科学版);2010年02期
20 江小平;李成华;向文;张新访;;云计算环境下朴素贝叶斯文本分类算法的实现[J];计算机应用;2011年09期
中国重要会议论文全文数据库 前3条
1 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 李海军;王钲旋;王利民;苑森淼;;基于主成分分析提升朴素贝叶斯[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
3 李毅;顾健;顾铁军;;基于朴素贝叶斯方法的邮件样本预筛选[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
中国硕士学位论文全文数据库 前7条
1 胡为成;基于遗传算法的朴素贝叶斯分类研究[D];合肥工业大学;2006年
2 周龙;基于朴素贝叶斯的分类方法研究[D];安徽大学;2006年
3 王翔;基于朴素贝叶斯和One-R的入侵检测问题研究[D];合肥工业大学;2008年
4 周远阳;基于朴素贝叶斯方法的新闻分类系统的实现[D];暨南大学;2012年
5 李忠波;基于改进朴素贝叶斯的蛋白质提纯方法选择[D];大连理工大学;2014年
6 孙秀亮;基于属性加权的选择性朴素贝叶斯分类研究[D];哈尔滨工程大学;2013年
7 华林森;中文文本情感分类研究[D];重庆大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978