收藏本站
《重庆大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

并行遗传算法在K-中心数据挖掘的应用研究

刘波  
【摘要】:数据挖掘是随着信息技术不断发展而形成的一门新学科。它帮助人们在信息海洋中发现有用的知识和信息。数据挖掘按照其任务主要可以分为4种:聚类、分类、关联规则、序列-模式。其中聚类是最重要的一种。在数据挖掘中,效率和准确性一直是人们所关注的问题。为了提高数据挖掘的准确性和效率,人们将许多的算法应用到数据挖掘当中来。这些算法包括:遗传算法,神经网络,模糊理论,粗糙集理论等等。本论文将并行遗传算法应用到K-中心聚类数据挖掘中,从而来提高K-中心数据挖掘的效率和聚类的准确性。 遗传算法是一种解决组合优化的一种有效方法,它是基于自然选择和自然进化的搜索算法。但大量模拟实验表明,对于中小规模的应用问题,遗传一般能够在许可的时间范围内获得满意解。对于大规模或超大规模的求解任务,简单的串行遗传算法则力不从心。另外,简单串行遗传算法在应用过程中一个比较突出的问题是它容易产生早熟现象,这将严重地影响遗传算法的应用。因此,人们利用遗传算法固有的并行特性,将并行技术与传统的遗传算法相结合,从而来提高遗传算法的效率和减少遗传算法早熟现象的产生。K-中心方法是基于划分的聚类方法。它在目前的聚类分析中应用很广泛。但是该算法的缺点是易陷入局部最优,效率不高。而且中心点个数K的确定,在一般的情况下,是依据经验来确定的,但是这样做往往是不准确的。针对K-中心聚类的这些不足,将遗传算法应用到K-中心聚类数据挖掘中,必然会使K-中心聚类的效率和准确性得以提高。本论文为了将遗传算法应用到K-中心聚类中去,提出了相应的编码方案和适度函数以及并行计算模型和相应的迁移策略。实验证明,用并行遗传算法来求解K-中心聚类问题,其效率和准确性都得到了提高。 本论文用PVM将PC机组织在一起,构成了一个并行计算环境,所用的操作系统为Linux。并行计算时所选用的模型为粗粒度的主/从模型。在计算过程中,将初始个体分别分配得各台slave机器上,然后slave机就开始计算,在slave机计算到一定的时间以后,依据一定的迁移策略,向master迁移个体,然后再从master机上取回其它机器的个体继续运算,直到满足中止条件为止。 最后,对实验得到的数据进行了比较,分析,并得出了相应的加速比。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 黄明,王武龙,梁旭;基于遗传算法的高效聚类挖掘新算法[J];大连铁道学院学报;2002年04期
2 林铿,黄元石;基于遗传算法的ERP生产计划排单模型[J];福州大学学报(自然科学版);2002年04期
3 钟求喜,谢涛,陈火旺;基于遗传算法的任务分配与调度[J];计算机研究与发展;2000年10期
4 邹晓峰,陆建江,宋自林;基于模糊分类关联规则的分类系统[J];计算机研究与发展;2003年05期
5 陈前,李星;并行遗传算法在非均衡负载节点并行机上的实现[J];计算机工程与应用;2000年09期
6 王敞;陈增强;袁著祉;;基于遗传算法的K均值聚类分析[J];计算机科学;2003年02期
7 许国艳,史宇清;遗传算法在关联规则挖掘中的应用[J];计算机工程;2002年07期
8 王敞,陈增强,孙青林,袁著祉;基于K中心方法的氨基酸序列聚类分析[J];计算机工程;2003年08期
9 武金瑛,王希诚;一种粗粒度并行遗传算法及其应用[J];计算力学学报;2002年02期
10 郭绚,郭平,郑守淇;ParaGA:一个并行遗传算法的C++类库[J];计算机学报;1999年06期
【共引文献】
中国期刊全文数据库 前10条
1 翟剑锋;;基于遗传算法的模糊聚类在考试成绩分析中的应用[J];信息安全与技术;2012年04期
2 刘科研;李运华;盛万兴;;基于分布式并行遗传算法的电力系统无功优化[J];北京航空航天大学学报;2008年01期
3 陈超武;董绍华;丁文英;;ERW钢管多阶段生产计划的编制及优化[J];北京科技大学学报;2006年07期
4 穆艳玲;李学武;高润泉;;遗传算法解TSP问题的并行实现[J];北京联合大学学报(自然科学版);2006年02期
5 魏超;李小凡;郑晓东;;基于群体搜索的串行蒙特卡罗反演方法的并行算法(英文)[J];Applied Geophysics;2010年02期
6 王利;张喜平;郭林;;增量式知识获取算法综述[J];重庆邮电大学学报(自然科学版);2007年S1期
7 孙年芳;;遗传算法求解TSP问题[J];长春理工大学学报(高教版);2009年02期
8 王成双;丁勇;;基于遗传算法的生产调度研究[J];长春理工大学学报(高教版);2009年08期
9 孙如祥;黄柏雄;谢祥宏;夏曼;;多核CPU下基因库的多种群遗传算法[J];传感器与微系统;2011年08期
10 王树良;;空间数据挖掘进展[J];地理信息世界;2009年02期
中国重要会议论文全文数据库 前9条
1 刘怀;曹弋;黄建新;;一类网络控制系统中混合任务的优化调度[A];第二十七届中国控制会议论文集[C];2008年
2 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七届中国控制会议论文集[C];2008年
3 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
4 胥永康;岳筱玲;;浅谈网络信息挖掘应用技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
5 王雪峰;陈志祥;;一种多级分布式制造系统生产计划问题研究[A];中国企业运筹学[2010(1)][C];2010年
6 冯化强;万麟瑞;;嵌入式数据库(EDB)任务执行器模型及其查询优化算法研究[A];第四届中国智能计算大会论文集[C];2010年
7 贺晓丽;;一种用于解决并行任务分布问题的广义遗传算法[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
8 冯化强;万麟瑞;;嵌入式数据库(EDB)任务执行器及优化算法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
9 李晓薇;;基于GPS与GPRS的车辆动态监测软件的研究[A];煤矿自动化与信息化——第20届全国煤矿自动化与信息化学术会议暨第2届中国煤矿信息化与自动化高层论坛论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 许凌飞;基于炉口火焰光谱信息的转炉炼钢终点在线碳含量测量方法研究[D];南京理工大学;2011年
2 罗建宏;粒计算分类知识发现算法及其应用[D];浙江大学;2010年
3 李军华;基于知识和多种群进化的遗传算法研究[D];南京航空航天大学;2009年
4 蒋建春;异构多核嵌入式软件关键问题研究[D];重庆大学;2011年
5 苏木亚;谱聚类方法研究及其在金融时间序列数据挖掘中的应用[D];大连理工大学;2011年
6 脱凌;云南检验检疫档案信息数据库构建研究[D];云南大学;2012年
7 李艳君;拟生态系统算法及其在工业过程控制中的应用[D];浙江大学;2001年
8 骆正虎;移动Agent系统若干关键技术问题研究[D];合肥工业大学;2002年
9 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
10 许兆新;基于元知识的数据挖掘系统研究[D];哈尔滨工程大学;2003年
中国硕士学位论文全文数据库 前10条
1 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
2 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
3 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年
4 刘莹;不一致决策表的属性约简与规则获取研究[D];大连理工大学;2010年
5 董立国;遗传算法和投影寻踪分类模型在工程评标中的应用[D];河北工程大学;2010年
6 柳建芳;基于小波消噪的聚类模式挖掘在股票收益率预测中的应用[D];武汉理工大学;2010年
7 于晓丽;蛋白质结构分类研究[D];华北电力大学(北京);2011年
8 苏亚丁;基于决策树的数据挖掘技术在口腔诊疗中的应用[D];河北科技大学;2010年
9 魏佳;CLARANS改进算法在音乐网站智能推荐系统中的应用[D];吉林大学;2011年
10 张铖;汽车零部件企业供应链采购订单任务优化调度研究[D];武汉理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 张长水,沈刚,阎平凡;解Job-Shop调度问题的一个遗传算法[J];电子学报;1995年07期
2 戴绍利,谭跃进,汪浩;生产调度方法的系统研究[J];系统工程;1999年01期
3 童刚,李光泉 ,刘宝坤;用遗传算法解决在并行机上带有不同交货期窗口的Job-Shop调度问题[J];系统工程;2000年03期
4 杨红红,吴智铭;遗传算法在Job-Shop调度中的应用[J];系统工程;2000年05期
5 周泓,冯允成;一种启发式混合遗传算法及其在车间作业排序问题中的应用[J];航空学报;1998年01期
6 陈兵兵;ERP──企业资源计划[J];计算机辅助设计与制造;1998年07期
7 曾国荪,丁春玲;并行遗传算法分析[J];计算机工程;2001年09期
8 钟求喜,谢涛,陈火旺;遗传算法中解个体的生存策略[J];计算机工程与科学;2000年01期
9 姚新,陈国良,徐惠敏,刘勇;进化算法研究进展[J];计算机学报;1995年09期
10 陈长征,徐玉秀,杨璐;遗传算法改进及其在机械故障诊断中的应用研究[J];机械科学与技术;2000年03期
【相似文献】
中国期刊全文数据库 前10条
1 许向勇,杨启文,范新南;基于Internet的并行遗传算法及其关键实现技术[J];系统工程与电子技术;2004年08期
2 刘波,王洪建;并行遗传算法的迁移策略对K-中心聚类的影响[J];重庆工商大学学报(自然科学版);2005年03期
3 梁旭,黄明;禁忌-并行遗传算法在作业车间调度中的应用[J];计算机集成制造系统-CIMS;2005年05期
4 朱长武;戴上平;刘智;;并行遗传算法在并行多机调度中的应用[J];微计算机信息;2007年06期
5 曾国荪,丁春玲;并行遗传算法分析[J];计算机工程;2001年09期
6 侯建花,杨长青;一种求解TSP问题的并行遗传算法[J];计算机仿真;2005年02期
7 陈海英,郭巧,徐力;基于网格和Hamming距离的伪并行遗传算法[J];计算机工程;2004年15期
8 刘灿文,刘婕;基于求解非线性方程组的并行遗传算法的设计[J];华东师范大学学报(自然科学版);2004年01期
9 段沛沛;张严;;一种粗粒度并行遗传算法的设计与实现[J];福建电脑;2008年10期
10 张智海;吴星玮;;带时间窗车辆路径问题的并行遗传算法[J];工业工程;2007年03期
中国重要会议论文全文数据库 前10条
1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
3 穆向禹;浦剑涛;张树武;徐波;;基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
5 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
6 冯又层;蔡勖;;基于自组织特征映射的证券市场聚类[A];第二届全国复杂动态网络学术论坛论文集[C];2005年
7 张刚;刘悦;;基于查询空间的分布式文档集合划分算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 文健;李舟军;;基于聚类语言模型的生物文献检索技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 高阳;赵瑞娜;赵志强;阿杉;;基于自组织特征映射网络的全国地级市城市地价区域分类研究[A];地理学与生态文明建设——中国地理学会2008年学术年会论文摘要集[C];2008年
10 刘哲;唐雁;陈强;;三维模型有意义分割技术现状及应用[A];2008年计算机应用技术交流会论文集[C];2008年
中国重要报纸全文数据库 前10条
1 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
2 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
3 张秋;突破聚类市场的信息化盲区[N];中国计算机报;2007年
4 轶嘉;英特尔全球首个并行计算中心落户无锡[N];人民邮电;2009年
5 江锡民;英特尔并行计算中心落户无锡[N];新华日报;2009年
6 刘琦;伯克利专家展望未来并行计算[N];中国计算机报;2008年
7 均儿;通用计算核动力[N];电脑报;2009年
8 本报记者 马文方;英特尔为何要牵头并行计算[N];中国计算机报;2009年
9 英特尔并行计算实验室研究员 TimothyMattson;并行计算:减少串行软件[N];中国计算机报;2007年
10 英特尔 赵军(Jun Zhao);PC机并行计算革命尚未成功[N];中国计算机报;2009年
中国博士学位论文全文数据库 前10条
1 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
2 王琦;MDO优化算法研究[D];南京航空航天大学;2008年
3 陈军;分布式存储环境下并行计算可扩展性的研究与应用[D];中国人民解放军国防科学技术大学;2000年
4 邹琳;基于遗传算法的挤压模具多目标优化设计与研究[D];华中科技大学;2004年
5 马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;2004年
6 尹欣;三维弹性问题边界元法并行计算及其工程应用[D];清华大学;2000年
7 陈晓春;基于并行计算的大涡模拟方法及其工程应用基础研究[D];西安建筑科技大学;2004年
8 王开健;基于特大增量步算法的网络并行计算[D];清华大学;2005年
9 张理论;面向气象预报数值模式的高效并行计算研究[D];中国人民解放军国防科学技术大学;2002年
10 寇哲君;可扩展冲击—接触并行计算及其在汽车碰撞模拟中的应用[D];清华大学;2003年
中国硕士学位论文全文数据库 前10条
1 刘波;并行遗传算法在K-中心数据挖掘的应用研究[D];重庆大学;2004年
2 袁倩倩;并行遗传算法在DNA杂交测序中的应用研究[D];太原理工大学;2010年
3 闫蓉;基于并行计算负载均衡算法的研究[D];中国地质大学(北京);2008年
4 王斌;双层数据流聚类框架的设计与实现[D];吉林大学;2004年
5 申鼎才;并行遗传算法在热传导反问题中的应用[D];武汉理工大学;2005年
6 蔡博文;高维数据集中离群数据挖掘方法的研究[D];合肥工业大学;2006年
7 刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;2006年
8 于世东;多维数据可视化技术的研究及应用[D];沈阳工业大学;2006年
9 吕小巧;一种基于FPGA的改进遗传算法硬件设计研究[D];江西理工大学;2010年
10 戴金;改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用[D];北京交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026