收藏本站
《山东师范大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于遗传算法的聚类方法研究

武兆慧  
【摘要】:近年来数据挖掘引起了信息产业界的广泛关注,其主要原因是存在大量的可用数据,并且迫切需要将这些数据转换成有用的信息和知识。通过数据挖掘,可以将知识发现的研究成果应用于实际数据处理中,为科学决策提供支持。聚类分析是数据挖掘的一项基本任务,是一个无监督的学习过程,聚类的目标是在没有任何先验知识的前提下,将数据聚集成不同的簇,使得相同簇中的元素尽可能相似,不同簇中的元素差别尽可能大。通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间有趣的相互关系。 在聚类分析中,K-means算法可以说是应用较为广泛的一种算法,但它的一个致命弱点是对初始化非常敏感而容易陷入局部极小值,而遗传算法是一种通过模拟自然进化过程搜索最优解的方法,其显著特点是隐含并行性和对全局信息的有效利用能力,因此,借鉴K-means算法,用遗传算法来解决聚类问题,既能发挥遗传算法的全局寻优能力,又能兼顾K-means算法的局部搜索能力,从而更好地解决聚类问题。本文就是提出了新的混合遗传算法,并以此来解决聚类问题。 本文对遗传算法和经典的聚类算法做了深刻地分析、研究,提出了一种改进的基于模拟退火机制的多种群并行遗传算法,利用该混合遗传算法解决聚类问题,并通过实验验证算法的有效性。主要工作包括: 1.介绍分析了聚类算法以及遗传算法。介绍了数据挖掘的相关概念、任务、方法,然后介绍了聚类分析的概念、常见算法以及遗传算法的基本概念、研究现状等,并进行了相应的分析。 2.提出了一种改进的基于模拟退火机制的多种群并行遗传算法。提出的混合遗传算法利用模拟退火遗传算法,并对其进行了改进(采用动态调节近邻子集大小的方式),再结合多种群并行遗传算法的思想,同时加入小生境技术,从而有效地克服基本遗传算法的早熟收敛等缺陷。 3.将改进的基于模拟退火机制的多种群并行遗传算法用于聚类分析。借鉴了K-means算法,并采用基于聚类中心的浮点编码方式,同时考虑到聚类数目k的值通常在事前不能很好地确定,往往根据经验来定,所以本文分别提出了固定聚类数目k值的聚类算法以及可以动态确定恰当的聚类数目k值的相应算法,使得聚类算法具有更普遍的意义。 4.测试本文提出算法的有效性。 为了测试本文提出的聚类算法的性能,本文采用两组实验数据,分别针对固定聚类数目k的聚类算法以及动态确定聚类数目k的聚类算法进行实验,并与其它的聚类算法,即K-means算法以及基于遗传算法的聚类算法进行效果比较,实验结果显示本文算法有效地解决了聚类问题。 由于人们面对的数据是海量的,所以要求聚类算法能够快速准确地解决实际问题。本
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP18

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 彭宏玉;柴旭光;陈晓纪;;基于层次迭代思想的聚类算法的研究[J];唐山学院学报;2011年03期
2 赵向梅;王艳君;刘林;;聚类算法及聚类融合算法研究[J];电子设计工程;2011年15期
3 王家胜;;聚类分析在高校图书馆读者群体细分中的应用[J];农业图书情报学刊;2011年09期
4 王颖;刘建平;;基于改进遗传算法的K-means聚类分析[J];工业控制计算机;2011年08期
5 刘文军;游兴中;;一种改进的凝聚层次聚类法[J];吉首大学学报(自然科学版);2011年04期
6 秦福高;孙悦娟;;聚类与关联规则挖掘进行结合的研究[J];电脑知识与技术;2011年14期
7 李丹实;;使用SQL Server2005构建数据挖掘应用程序[J];煤炭技术;2011年07期
8 张俊溪;吴晓军;;一种新的基于进化计算的聚类算法[J];计算机工程与应用;2011年24期
9 佟泽华;姚伟;陈全平;;基于DW+DM融合模式的企业竞争情报系统(E-CIS)研究[J];情报杂志;2011年07期
10 薛调;;近六年国内图书馆学情报学研究论文热点分析[J];情报科学;2011年07期
中国重要会议论文全文数据库 前10条
1 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 潘玉奇;石冰;周劲;袁宁;;基于多维数据模型的聚类分析的研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
4 田小丽;郑康锋;钮心忻;;一种基于改进K-Medoids算法的网络攻击检测技术[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
5 王静;汪晓刚;;一种新的保护原始数据隐私性的聚类算法[A];第十届中国科协年会论文集(三)[C];2008年
6 张昕;彭宏;郑启伦;;基于微粒群算法的聚类分析[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
7 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
8 刘剑;;基于数据挖掘聚类的节理统计分析方法[A];中国水力发电工程学会第四届地质及勘探专业委员会第一次学术交流会论文集[C];2008年
9 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
10 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
中国重要报纸全文数据库 前10条
1 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
2 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
3 刘光强;靠数据挖掘抓住客户的心[N];中国计算机报;2009年
4 本报记者 郭白岩;大众点评网向数据挖掘要收益[N];中国经营报;2011年
5 赵骏飞;数据挖掘在金融行业的应用[N];中国保险报;2011年
6 本报记者 黎宇文;博时基金王德英: 数据挖掘促进基金精细化管理[N];中国证券报;2011年
7 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
8 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
9 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
10 ;数据挖掘流程[N];人民邮电;2001年
中国博士学位论文全文数据库 前10条
1 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
2 张瑀;基于实验数据挖掘与细胞自动机的结构分析方法[D];哈尔滨工业大学;2010年
3 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
7 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 王天真;基于神经网络的智能数据挖掘方法及应用研究[D];上海海事大学;2003年
2 于泓漪;道路交通事故原因的聚类分析[D];吉林大学;2005年
3 侯雪波;关联规则挖掘技术在电力市场营销分析中的应用[D];天津大学;2005年
4 武兆慧;基于遗传算法的聚类方法研究[D];山东师范大学;2006年
5 张兆中;WEB文本挖掘的聚类分析[D];山东科技大学;2005年
6 唐艺军;基于蚁群算法的数据挖掘应用研究[D];辽宁工程技术大学;2007年
7 罗贤缙;聚类分析在电力营销中的应用研究[D];华北电力大学(河北);2005年
8 王石;进化神经网络聚类技术及其在数据挖掘中的应用[D];山东大学;2005年
9 王煜;基于模式相似的子空间聚类算法研究[D];河海大学;2006年
10 叶炼炼;基于数据挖掘的网络流量采集模型研究[D];福州大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026