收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于混合遗传算法的分类规则挖掘方法及其并行实现

张磊  
【摘要】:数据分类是按照一组数据对象的特征给出数据对象数学划分的过程,已经在统计学、机器学习、神经网络以及专家系统中被广泛研究。近来,它又成为数据挖掘的一个重要研究方面。实际上,分类是一个两步过程,第一步,建立一个模型,描述指定的数据类集或概念集;第二步,评估模型的预测准确率,如果模型的准确率可以接受,使用模型进行分类。通常,模型可以用分类规则、判定树或数学公式表示。目前常用的分类规则挖掘方法有遗传算法、决策树方法、神经网络等。 基于传统遗传算法的分类规则挖掘方法通常存在以下问题:(1)对每个类只能产生一条分类规则;(2)挖掘出的规则质量不高;(3)优化后种群中冗余规则太多;(4)分类准确率不高。本文提出的基于混合遗传算法的分类规则挖掘方法能够有效克服上述缺点,提高分类规则挖掘的准确性。 本文首先介绍了数据挖掘的产生背景、定义和功能,指出预测准确度、计算复杂度和模型描述的简洁度是评价分类模型的三个尺度,并对一些常用的分类规则挖掘方法进行了分析和比较。 介绍了遗传算法和局部搜索算法的基本原理,并分析了遗传算法和局部搜索算法的优缺点。遗传算法虽然具有很强的全局搜索能力但局部搜索能力较差,另一方面,局部搜索算法具有较强的局部搜索能力,因此可以将两种算法相结合,构成混合遗传算法。 分析了分类规则挖掘原理,指出标准遗传算法并不太适合分类问题,因此提出了一种基于混合遗传算法的分类规则挖掘方法。混合遗传算法采用了Michigan方法,每个染色体代表一条分类规则。为了使混合遗传算法能够产生多条高质量的规则,设计了针对分类问题的编码方案、适应度函数、个体生成函数、遗传算子和局部搜索算子,并在适应度函数中提出了简洁度因子。另外,在优化后的种群中存在一些冗余规则,考虑到规则集的简洁性,提出了一种规则提取方法。实验表明,基于混合遗传算法的分类规则挖掘方法能够从数据集中发现一个简洁、准确、易理解的规则集。 最后,分析了分类算法的并行性,并在基于Windows 2000的PVM并行计算平台上实现了并行分类算法。此算法采用粗粒度的主/从模型,特别适合在PC机群上运行。实验表明,所设计的并行分类算法具有良好的加速比。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵瑞艳;李树荣;;基于混合遗传算法的时间最优控制问题求解[J];控制工程;2011年03期
2 刘红军;赵帅;;一种基于混合遗传算法的车间生产调度的研究[J];制造业自动化;2011年17期
3 崔雪丽;;基于混合遗传算法的车间生产计划调度[J];计算机工程与设计;2011年07期
4 杨珺;刘舒佶;王玲;;考虑最坏中断损失下的P-中位设施选址问题的模型与算法研究[J];中国管理科学;2011年04期
5 王旭坪;张凯;胡祥培;;基于模糊时间窗的车辆调度问题研究[J];管理工程学报;2011年03期
6 黄郡;单洪;满毅;;基于区域覆盖的协同干扰任务分配模型及算法[J];兵工学报;2011年06期
7 张佳佳;张亚平;孙济洲;;基于猴群算法的入侵检测技术[J];计算机工程;2011年14期
8 李玲俐;;数据挖掘中分类算法综述[J];重庆师范大学学报(自然科学版);2011年04期
9 汤彩霞;;善用《中图法》(第五版)改善图书文献归类准确性[J];图书馆杂志;2011年08期
10 黄晓斌;谭颖骞;;网络信息挖掘方法的效果评价[J];情报理论与实践;2011年06期
11 殷振瑾;王阳;暴宏伶;;数据挖掘技术在中医医案研究中的应用[J];承德医学院学报;2011年03期
12 刘艳青;;数据挖掘技术在网络课程管理中的应用研究[J];电脑知识与技术;2011年23期
13 马洋;;恒星光谱数据分类规则挖掘系统研究[J];太原科技大学学报;2011年04期
14 朱沿旭;王怀民;史殿习;尹刚;袁霖;李翔;;基于缩进轮廓的HTML文档重复模式挖掘方法[J];计算机科学;2011年08期
15 范广玲;李春生;高雅田;;数据挖掘模型选择的通用建模研究[J];科学技术与工程;2011年19期
16 戎翔;李玲娟;;基于MapReduce的频繁项集挖掘方法[J];西安邮电学院学报;2011年04期
17 王凌;王圣尧;方晨;;一种求解多维背包问题的混合分布估计算法[J];控制与决策;2011年08期
18 李帆;夏士雄;张磊;;基于模糊理论的不确定轨迹模式挖掘[J];微电子学与计算机;2011年08期
19 张连育;吕立;;基于策略模式的中医数据挖掘平台的设计与研究[J];小型微型计算机系统;2011年07期
20 李琳;邵峰晶;杨厚俊;孙仁诚;;基于类FP-tree的多层关联分类器[J];计算机科学;2011年08期
中国重要会议论文全文数据库 前10条
1 侯志祥;;基于混合遗传算法的连续系统参数辨识[A];第二十六届中国控制会议论文集[C];2007年
2 赵瑞艳;李树荣;张晓东;苗荣;;基于混合遗传算法的热传导系统最优控制问题求解[A];第二十七届中国控制会议论文集[C];2008年
3 杨智;戴一帆;;混合遗传算法在二元光学元件设计中的应用[A];全球化、信息化、绿色化提升中国制造业——2003年中国机械工程学会年会论文集(微纳制造技术应用专题)[C];2003年
4 姜封国;;基于小生境技术的混合遗传算法[A];第二十九届中国控制会议论文集[C];2010年
5 王旭阳;王彤;李明;;基于粗糙集理论的分类规则挖掘方法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 马垣;张小平;白雪;王旭;刘杨;杨鸿雁;;函数依赖作用域及分类规则的挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 孙燕;孙峥;黄鹍;;基于模拟退火机制的隔离小生境混合遗传算法[A];第二十六届中国控制会议论文集[C];2007年
8 赵文兵;尤定华;;基于图形理解框架的地理信息挖掘方法[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
9 王奇珍;汤志钢;胡学钢;简宋全;;基于相对约简格的分类规则挖掘[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
10 顿毅杰;张小峰;张永;;基于不可分辨关系的分类规则算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 余远;基于形式概念分析分类规则挖掘的关键问题研究[D];中国矿业大学(北京);2009年
2 刘晓霞;基于OCTPN和混合遗传算法的JSP多目标优化调度[D];东北大学;2008年
3 邹凌;基于非线性优化及独立分量分析的脑电源定位研究[D];浙江大学;2005年
4 周春英;超数据集成挖掘方法与技术研究[D];浙江大学;2012年
5 周远成;网络计划优化与资源平衡的智能交互模式的研究和应用[D];华北电力大学(北京);2005年
6 张建乔;可膨胀预充填防砂筛管及防砂机理研究[D];中国石油大学;2007年
7 李新利;一类非线性多变量系统的神经网络在线解耦控制[D];华北电力大学(北京);2008年
8 李万庆;基于智能优化算法的施工项目风险预测与网络计划优化研究[D];天津大学;2004年
9 王庆;知识型企业知识员工任务指派及调度决策问题研究[D];天津大学;2006年
10 朱志国;Web用户使用模式与兴趣挖掘方法研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 张磊;基于混合遗传算法的分类规则挖掘方法及其并行实现[D];重庆大学;2004年
2 卢雪云;基于混合遗传算法的SOC测试集成优化方法研究[D];桂林电子科技大学;2010年
3 尹晓娜;基于混合遗传算法的FlexRay总线静态段实时调度研究[D];东北大学;2009年
4 钟旭;基于混合遗传算法的异构网格任务调度[D];山东大学;2010年
5 王新华;基于混合遗传算法的智能组卷问题研究[D];吉林大学;2010年
6 宋玉林;混合遗传算法在配送车辆调度问题中的研究和应用[D];华中科技大学;2004年
7 杨光达;基于混合遗传算法的MIMO-OFDM系统多用户检测技术研究[D];吉林大学;2011年
8 凌仲权;基于混合遗传算法的园区网络优化设计研究[D];西安电子科技大学;2004年
9 王亮;基于混合遗传算法的多约束QoS组播算法的研究[D];哈尔滨工业大学;2009年
10 刘辙;基于混合遗传算法的分布式车间作业计划调度的算法研究[D];长春理工大学;2004年
中国重要报纸全文数据库 前10条
1 本报通讯员 卢兆敏 刘志先 刘涛;农家书屋惠农家[N];济宁日报;2009年
2 肖意;谈会议新闻“富矿”的挖掘方法[N];中华新闻报;2007年
3 本报综合;美国科学家拟造月球土壤挖掘机[N];中国工业报;2008年
4 特约记者 孙现富 本报记者 付毅飞;任辉启 铸造和平之盾[N];科技日报;2002年
5 本报记者  姜恒;产业快速发展 法规相对滞后——医用软件期待管理到位[N];中国医药报;2006年
6 左克平;从类别划分看高类低审问题[N];中国医药报;2008年
7 张瑜;严格监管从分类开始[N];中国医药报;2002年
8 上海市食品药品监督管理局医疗器械注册处 孙勤 严梁;在对比中走向完善[N];中国医药报;2006年
9 左克平;杜绝“高类低审”[N];医药经济报;2008年
10 本版编辑安徽省南陵县食品药品监管局 吴问胜 山西大学法学院 赵银翠;擅自更换器械部件并销售的行为如何处理[N];中国医药报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978