收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于小生境遗传算法的增量贝叶斯算法

董喜双  
【摘要】: 随着数字技术的飞速发展,数据量不断激增,导致海量数据的出现。然而这些浩繁的数据背后蕴藏着许多重要的信息,因此人们希望能够对其进行统计分析,以便更加方便地利用这些数据完成诸如天气预报、专家诊断等工作。数据分类由此应运而生。 朴素贝叶斯算法是一种普遍应用的经典数据分类算法。该算法基于属性间独立性假设,即样本空间中元素之间的属性相互独立,以及贝叶斯后验概率定理。朴素贝叶斯算法的显著优点是相对于其它分类方法,朴素贝叶斯分类算法不需要搜索,只需简单地计算训练样本中各个属性值发生的概率,以此可以估计出每个属性的概率估计值,因而朴素贝叶斯分类算法的效率较高。但是,朴素贝叶斯算法同时也存在一些问题:其一,朴素贝叶斯算法不具有增量分类能力;其二,当大量样本需要分类时,计算比较复杂,没有充分利用分类信息;其三,该算法没有充分利用一次分类后遗留的分类信息。 针对上述三方面问题,本文提出了一种基于小生境遗传算法的增量贝叶斯算法,同时引入向量空间概念,根据向量空间将样本量化,并应用小生境遗传算法在向量空间局部抽取出特征向量,作为不同类别的增量分类标准,进而简化了分类的计算量,提高了算法的分类精度。在使该算法具有增量分类能力的同时,在充分利用样本分类后产生的类别信息基础上降低了系统的时空开销。最后采用UCI数据集进行本算法的验证实验,实验表明基于小生境遗传算法的增量贝叶斯算法在一定程度上降低了时空复杂度并且具有了增量能力。


知网文化
【相似文献】
中国期刊全文数据库 前10条
1 黄燚;数据挖掘初探[J];福建电脑;2005年03期
2 杨光;浅析数据挖掘在CRM中的应用[J];情报科学;2005年02期
3 李玉梅;数据挖掘初探[J];现代管理科学;2005年04期
4 李锁花;孙志挥;周晓云;;基于特征向量的分布式聚类算法[J];计算机应用;2006年02期
5 冼进,甄艳玲;数据挖掘浅析[J];金卡工程;2004年12期
6 谢斌;;朴素贝叶斯分类在数据挖掘中的应用[J];甘肃联合大学学报(自然科学版);2007年04期
7 香丽芸;浅谈数据挖掘及其应用[J];昌吉学院学报;2001年02期
8 栾世武;数据挖掘给企业应用带来什么?[J];微电脑世界;2000年23期
9 梅强,张冬茉;数据挖掘在保险分析中的应用[J];计算机工程;2004年S1期
10 朱世武 ,崔嵬 ,张尧庭 ,谢邦昌;数据挖掘运用的理论与技术[J];统计研究;2003年08期
中国重要会议论文全文数据库 前10条
1 毛定祥;;数据挖掘与实证经济学[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
2 张敏;陆向艳;周敏;潘林琳;农冬冬;王彬彬;陈晓江;;数据挖掘在智能题库系统中的应用[A];广西计算机学会——2004年学术年会论文集[C];2004年
3 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
4 李海军;王钲旋;王利民;苑森淼;;基于主成分分析提升朴素贝叶斯[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
5 郝亚雷;王晓妍;;基于Denclas模式的一种新数据挖掘分类方法[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
6 汪加才;文巨峰;;基于Internet的数据挖掘服务研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
7 戴琦;;Web上的数据挖掘[A];全国计算机网络应用年会论文集(2001)[C];2001年
8 孟大为;;数据挖掘及其在电厂中的应用[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
9 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
10 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
中国博士学位论文全文数据库 前10条
1 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
2 麦永浩;数据仓库和数据挖掘方法研究及其在公安信息建设中的应用[D];华东理工大学;2000年
3 王达;时间序列数据挖掘研究与应用[D];浙江大学;2004年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 邵国晨;基于数据挖掘的决策支持系统及应用研究[D];辽宁工程技术大学;2005年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
9 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
10 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
中国硕士学位论文全文数据库 前10条
1 胡为成;基于遗传算法的朴素贝叶斯分类研究[D];合肥工业大学;2006年
2 刘毅辉;保持隐私的数据挖掘研究[D];中国人民解放军信息工程大学;2003年
3 汪传建;基于混合模型的文本分类的研究[D];东北大学;2005年
4 郭林;面向XML文档的数据挖掘技术研究[D];大连理工大学;2005年
5 王评;人工免疫算法研究及其在数据挖掘上的应用[D];福州大学;2005年
6 段练军;数据挖掘在WWW上的实现技术[D];郑州大学;2001年
7 关宏伟;基于数据挖掘技术的实时大容量数据分析的研究[D];哈尔滨工程大学;2004年
8 李欣;基于神经网络的数据挖掘方法研究[D];大庆石油学院;2003年
9 杨雪梅;数据挖掘在汽车销售决策支持系统中的应用[D];山东大学;2005年
10 瞿继合;基于Web的数据挖掘技术研究[D];东北财经大学;2005年
中国重要报纸全文数据库 前10条
1 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
2 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
3 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
4 ;数据挖掘流程[N];人民邮电;2001年
5 赵纪元;数据挖掘在CRM中的应用[N];人民邮电;2001年
6 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
7 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
8 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
9 北京联通宽带业务中心 杨雪艳;数据挖掘成挽留客户利器[N];通信产业报;2009年
10 聂亚林;承钢数据挖掘系统近日开通运行[N];中国冶金报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978