收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

K-均值聚类算法的研究与改进

刘莉莉  
【摘要】:伴随着信息技术的飞速发展,当今的生活、生产以及科研的各个领域都正在实现信息的数字化处理,由此产生了数量极其庞大的文本、图像、音频、视频等各种形式的数据。怎样从海量数据中准确高效的提取出隐含未知且有潜在价值的信息,是人们面临解决的重要课题。数据挖掘技术的诞生为这一问题的解决带来了许多行之有效的方法和工具,作为一种新兴的交叉科学的技术,数据挖掘包含多个热门的研究方向,其中聚类分析(简称为“聚类”)是应用最广泛最成熟的数据挖掘技术之一,它的主要功能是根据一定的规则把数据集划分成若干个不同的组,使得同一个组中的数据对象尽可能相似,不同组中的数据对象尽可能相异,数据对象间的相似度的计算是通过描述对象的属性来实现的。目前聚类已经被广泛的应用于数据的预处理过程,在机器学习、空间数据分析、模式识别、商业决策、图像处理、web文档分类和数据压缩等方面也有重要应用。根据构造思想和研究现状的不同,聚类算法大致可以分为以下几类:基于划分的算法、基于层次的算法、基于网格的算法、基于密度的算法、基于模型的算法。K-均值聚类算法是一种基于划分的算法中的经典算法,本文深入研究和分析了K-均值聚类算法的优缺点,同时还针对算法的聚类数目K值依赖用户指定、算法的聚类结果容易受初始中心值的选取影响的缺陷,对K-均值聚类算法进行了研究和改进。本文所做的主要工作包括:(1)介绍了数据挖掘的研究现状和聚类分析的研究背景和相关概念。(2)研究了K-均值聚类算法的基本思想和原理,并分析了K-均值聚类算法的优缺点,对现有的改进K-均值聚类算法的措施进行了分析比较,为得到最佳聚类数目而提出了一种K值的优化算法,实验结果表明算法成功改善了K-均值聚类算法对用户输入K值的依赖性问题。(3)针对K-均值聚类算法对初始聚类中心值的选取敏感并且容易陷入局部最优解的缺点,提出了将全局寻优能力较强的差分进化算法引入算法的思想,用交叉、变异、选择操作来取代聚类中心不断更新的过程。同时对标准差分进化算法进行改进,提出了基于改进的差分进化算法的K-均值聚类算法。最后通过实验验证了改进方案的有效性和可行性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 谢娟英;蒋帅;王春霞;张琰;谢维信;;一种改进的全局K-均值聚类算法[J];陕西师范大学学报(自然科学版);2010年02期
2 曹易;张宁;;一种改进的模糊C-均值聚类算法[J];上海理工大学学报;2012年04期
3 王圆妹;;一种改进的K-均值聚类算法的研究[J];长江大学学报(自科版);2006年10期
4 王圆妹;;一种改进的K-均值聚类算法的研究[J];长江大学学报(自科版)理工卷;2006年04期
5 刘韬;蔡淑琴;曹丰文;崔志磊;;基于距离浓度的K-均值聚类算法[J];华中科技大学学报(自然科学版);2007年10期
6 查成东;王长松;巩宪锋;周家新;;基于改进K-均值聚类算法的背景提取方法[J];计算机工程与设计;2007年21期
7 王丹丹;李彬;陈武凡;;基于多目标规划的模糊C均值聚类算法[J];中国图象图形学报;2008年08期
8 刘坤朋;罗可;;改进的模糊C均值聚类算法[J];计算机工程与应用;2009年21期
9 俞云霞;王士同;朱嵬鹏;;具有数据容错能力的模糊C均值聚类算法[J];计算机工程与设计;2010年03期
10 李翠霞;谭营军;;一种新的模糊C均值聚类算法[J];河南大学学报(自然科学版);2011年02期
11 关庆;邓赵红;王士同;;改进的模糊C-均值聚类算法[J];计算机工程与应用;2011年10期
12 庞淑敬;彭建;;一种改进的模糊C均值聚类算法[J];微计算机信息;2012年01期
13 孙卓;;k-均值聚类算法及其应用[J];农业网络信息;2013年07期
14 陈宗海;文锋;聂建斌;吴晓曙;;基于节点生长k-均值聚类算法的强化学习方法[J];计算机研究与发展;2006年04期
15 王威娜;陈巨龙;温宇鹏;;自适应的模糊C均值聚类算法[J];吉林化工学院学报;2008年02期
16 李雷;罗红旗;丁亚丽;;一种改进的模糊C均值聚类算法[J];计算机技术与发展;2009年12期
17 李彬;陈武凡;;非局部降噪快速模糊C-均值聚类算法[J];计算机工程与应用;2009年35期
18 刘颖;胡智鹏;;模糊C-均值聚类算法改进研究[J];吉林化工学院学报;2012年11期
19 王晓飞;聂生东;王远军;;改进的K-均值聚类算法及其在脑组织分割中的应用[J];中国医学物理学杂志;2014年02期
20 李泽军;曾利军;;交通流量的局部区间模糊C均值聚类算法[J];微型机与应用;2010年09期
中国重要会议论文全文数据库 前9条
1 孙广玲;唐降龙;;一种快速k-均值聚类算法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
2 陈晓山;朱建冲;翁辉;;一种改进的模糊C均值聚类算法及其应用[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
3 葛继科;余建桥;张帆;张蕊;;改进的K-均值聚类算法[A];’2004计算机应用技术交流会议论文集[C];2004年
4 刘健庄;谢维信;;一种改进的快速模糊C均值聚类算法[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年
5 汪民乐;高晓光;李勇;;新型遗传模糊C-均值聚类算法及其在导弹目标选择中的应用[A];2007年中国智能自动化会议论文集[C];2007年
6 赵爽;李晓奇;沙秀艳;;特征加权模糊C均值聚类算法在划分劳动报酬中的应用[A];第三届中国智能计算大会论文集[C];2009年
7 黄建军;杨勋;谢维信;;基于类云模型的C均值聚类算法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
8 罗小刚;彭承琳;刘婷;侯长军;霍丹群;文利;;基于模糊C均值聚类算法的心脏扭转运动中心室壁轮廓的自动提取[A];中国仪器仪表学会医疗仪器分会第四次全国会员代表大会暨2009年学术年会论文集[C];2009年
9 刘靖明;韩丽川;;粒子群优化k均值的混合聚类算法研究[A];2004年中国管理科学学术会议论文集[C];2004年
中国硕士学位论文全文数据库 前10条
1 刘莉莉;K-均值聚类算法的研究与改进[D];曲阜师范大学;2015年
2 蒋帅;K-均值聚类算法研究[D];陕西师范大学;2010年
3 吴晓蓉;K-均值聚类算法初始中心选取相关问题的研究[D];湖南大学;2008年
4 赵爽;改进的模糊C均值聚类算法及其应用[D];东北大学;2010年
5 欧陈委;K-均值聚类算法的研究与改进[D];长沙理工大学;2011年
6 王威娜;改进的模糊C-均值聚类算法[D];大连海事大学;2007年
7 梁烨炜;K-均值聚类算法的改进及其应用[D];湖南大学;2012年
8 赵丽;全局K-均值聚类算法研究与改进[D];西安电子科技大学;2013年
9 徐再花;基于正则化方法的模糊C-均值聚类算法的研究[D];辽宁科技大学;2012年
10 刘方;数据挖掘中半监督K-均值聚类算法的研究与改进[D];吉林大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978