收藏本站
《哈尔滨工程大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

一种改进的k_means聚类算法研究

刘振广  
【摘要】:随着网络的快速发展和信息化技术的不断进步,各种数据以惊人的速度膨胀,如何从这些数据中找到有用信息,并对这些数据和信息进行分类,变得日益迫切。数据挖掘技术的出现,使得大量数据处理成为可能。聚类是一项重要数据挖掘技术,已成为研究热点之一。 本文主要针对k_means算法对孤立点敏感和对初始点选择敏感的局限性,对k_means算法的聚类过程提出两点改进。首先,对k_means算法中孤立点检测问题进行深入研究,提出了基于网格的数据预处理算法。该方法对数据集网格划分之后,进行孤立点的检测。其次,分析k_means算法的初始点选择,提出了基于平均点的初始点选择算法。该方法是在基于网格的数据预处理算法基础之上,直接在网格中进行初始点的选择,使初始点更加合理和接近实际的聚类中心。最后,在k_means算法的聚类过程中,应用两个算法进行孤立点处理和初始点选择,给出了改进的k_means算法。 本文通过实验对改进的k_means进行验证和分析,实验结果表明改进的k_means算法在一定程度上提高了聚类的准确率。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 乔小妮;张明新;史变霞;;一种基于密度的K-means算法[J];电脑开发与应用;2008年10期
2 连凤娜;吴锦林;唐琦;;一种改进的K-means聚类算法[J];电脑与信息技术;2008年01期
3 刘强;吴京慧;;优化初始聚类中心的K-means算法[J];信息技术;2009年02期
4 孙秀娟;刘希玉;;基于初始中心优化的遗传K-means聚类新算法[J];计算机工程与应用;2008年23期
5 张忠平;王爱杰;陈丽萍;;一种基于广度优先搜索的K-means初始化算法[J];计算机工程与应用;2008年27期
6 程昳;苗夺谦;冯琴荣;;基于模糊粗糙集的粒度计算[J];计算机科学;2007年07期
7 孙士保;秦克云;;改进的k-平均聚类算法研究[J];计算机工程;2007年13期
8 陆声链,林士敏;基于距离的孤立点检测及其应用[J];计算机与数字工程;2004年05期
9 郭明;丁华福;;基于SOM网和K-means的聚类算法[J];计算机与数字工程;2008年09期
10 李伟;黄颖;;文本聚类算法的比较[J];科技情报开发与经济;2006年22期
【共引文献】
中国期刊全文数据库 前10条
1 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
2 高志明,关岩,于洪梅,吴秀红,李井会;人工神经网络在化学中的应用进展[J];鞍山钢铁学院学报;2000年03期
3 万春红;邵超;;一种新的基于自组织映射的流形学习算法[J];北京交通大学学报;2009年06期
4 王新军;卿华;姚娇艳;;流水线加工调度问题的神经网络算法[J];兵工自动化;2011年10期
5 陶兰;;Kohonen神经网络模型在柑桔区域规划专家系统中的应用[J];北京农业工程大学学报;1993年01期
6 杜大鹏;穆志纯;陈静;方新;;一种用于模拟汉字认知过程的多层自组织神经网络[J];北京科技大学学报;2007年01期
7 许俊刚,柯有安;自组织神经网络雷达目标识别的研究[J];北京理工大学学报;1992年03期
8 黄儒乐;吴江;韩宁;;林火烟雾图像自动识别中的模式分类器选择[J];北京林业大学学报;2012年01期
9 黄美璇;;基于聚类分析的网络舆情监控系统的设计[J];宝鸡文理学院学报(自然科学版);2011年04期
10 宋殿霞;王艳;邹光辉;;空间数据挖掘聚类算法研究[J];滨州学院学报;2006年06期
中国重要会议论文全文数据库 前10条
1 贾允毅;胥布工;王世华;刘步春;;端对端网络时钟漂移补偿算法研究及其实现[A];第二十六届中国控制会议论文集[C];2007年
2 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
3 ;A Neural Network Algorithm for the (m,d)-Coloring Problem of a Graph[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
4 ;A Semi-supervised Clustering Algorithm Based on Rough Reduction[A];2009中国控制与决策会议论文集(3)[C];2009年
5 孙祥;庆承松;;大学生就业区域流向成因研究[A];中国企业运筹学[C];2009年
6 蔡中华;;自组织映射(SOM)在研究地区产业结构聚类分析的应用[A];第九届中国青年信息与管理学者大会论文集[C];2007年
7 房伟;逄玉俊;路爽;;基于相异度系数和的孤立点挖掘应用与研究[A];2006“数学技术应用科学”[C];2006年
8 ;A hybrid of fuzzy-link clustering and classification for seismic data[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
9 王洪波;刘长滨;;基于聚类分析的中国建筑节能区域划分研究[A];第四届中国科学学与科技政策研究会学术年会论文集(Ⅰ)[C];2008年
10 梁霞;梁循;;互联网金融文本信息关键词形态挖掘[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
2 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
3 李曼荔;求解组合优化问题的神经计算方法[D];电子科技大学;2010年
4 桑永胜;空间数据分析的神经计算方法[D];电子科技大学;2010年
5 吕琳;天然气水合物(地球物理属性)的神经网络识别方法及软件开发[D];吉林大学;2011年
6 雷迎科;流形学习算法及其应用研究[D];中国科学技术大学;2011年
7 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
8 梁涛;批处理过程生产调度自组织优化方法[D];山东大学;2011年
9 王飞;入侵检测分类器设计及其融合技术研究[D];南京理工大学;2011年
10 姜建华;虚拟企业环境下订单驱动的任务管理机制研究与实践[D];武汉理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 高兆梓;基于专利分析的竞争对手分类系统研究[D];山东科技大学;2010年
2 张书春;数据挖掘技术在SMS系统中的应用研究[D];郑州大学;2010年
3 赵慧杰;面向论坛的话题发现、跟踪及传播技术研究[D];哈尔滨工程大学;2010年
4 Rojanakat Payomrat;基于神经网络的双目视差估计[D];哈尔滨工程大学;2010年
5 骆永健;基于聚类的数据流异常检测算法的研究[D];哈尔滨工程大学;2010年
6 辛涛;基于混合神经网络的视频序列压缩与加密算法研究[D];大连理工大学;2010年
7 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
8 孙红艳;改进的小生境遗传聚类算法应用研究[D];辽宁工程技术大学;2010年
9 钟晓旭;基于Web招聘信息的文本挖掘系统研究[D];合肥工业大学;2010年
10 王冬秀;基于衰减窗口与剪枝链表树的高维数据流聚类算法研究[D];华东师范大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 王红睿;赵黎明;裴剑;;均衡化的改进K均值聚类法[J];吉林大学学报(信息科学版);2006年02期
2 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期
3 金微;陈慧萍;;基于分层聚类的k-means算法[J];河海大学常州分校学报;2007年01期
4 赵锋;薛惠锋;王伟;;基于复合形遗传算法的K-means优化聚类方法[J];航空计算技术;2006年05期
5 田地;张西芝;刘小航;;一种基于扩展的K-means聚类算法[J];河南教育学院学报(自然科学版);2007年02期
6 周水庚,周傲英,曹晶;基于数据分区的DBSCAN算法[J];计算机研究与发展;2000年10期
7 王国胤;Rough集理论在不完备信息系统中的扩充[J];计算机研究与发展;2002年10期
8 刘少辉,胡斐,贾自艳,史忠植;一种基于Rough集的层次聚类算法[J];计算机研究与发展;2004年04期
9 张猛,王大玲,于戈;一种基于自动阈值发现的文本聚类方法[J];计算机研究与发展;2004年10期
10 刘立平,孟志青;一种选取初始聚类中心的方法[J];计算机工程与应用;2004年08期
中国博士学位论文全文数据库 前1条
1 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
中国硕士学位论文全文数据库 前1条
1 金微;基于遗传算法的k-means聚类方法的研究[D];河海大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 王纪川;刘宇;齐勇;侯迪;;一种摄像机采集图像的二值化算法[J];计算机工程与应用;2007年30期
2 练在中;三维隐藏线消除法综述[J];计算机研究与发展;1987年10期
3 刘伯强,曹景森,胡咏梅;浓碱液测量过程中算法的探讨[J];基础自动化;1995年04期
4 杨正瓴;排序问题串行算法复杂性下界关系讨论[J];天津大学学报;1993年06期
5 孙杨模;;操作系统常见的几种算法举例分析[J];湖北三峡职业技术学院学报;2010年02期
6 刘伯强,刘忠国;张力同步系统微机控制算法的实现[J];机械与电子;2000年04期
7 马后永;张守川;靖旭;吴毅;;测量大气相干长度的数据处理算法比对研究[J];大气与环境光学学报;2010年06期
8 杨锦宣;;重复数据统计算法及在商务网站中的应用[J];科技信息;2011年20期
9 刘伯强;曹景森;;单片机控制系统中算法的处理和应用[J];电气自动化;1995年02期
10 杜玉兰;赵磊;;基于C#的HASH算法探析[J];计算机安全;2007年08期
中国重要会议论文全文数据库 前10条
1 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 黄友锐;赵娜娜;;一种基于小波分析的焊缝识别算法[A];煤矿自动化与信息化——第20届全国煤矿自动化与信息化学术会议暨第2届中国煤矿信息化与自动化高层论坛论文集[C];2010年
3 李易;管庆;;基于DM642的智能视频监控系统[A];2008年中国西部青年通信学术会议论文集[C];2008年
4 张明慧;;基于模糊蒙片算法的CR图像边缘增强[A];第六届全国信息获取与处理学术会议论文集(1)[C];2008年
5 侯艳芳;冯红梅;;基于神经网络的调制识别算法的研究[A];武汉(南方九省)电工理论学会第22届学术年会、河南省电工技术学会年会论文集[C];2010年
6 程勇新;朱清新;;一种基于边折叠LOD技术的蒙皮动画算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
7 宁佐贵;;模糊控制算法的等价关系[A];中国工程物理研究院科技年报(1999)[C];1999年
8 刘田军;唐友喜;孙德福;;基于预修正ACE的OFDM系统峰平比抑制方法[A];2008年中国西部青年通信学术会议论文集[C];2008年
9 孙岚;刘雁春;陆秀平;欧阳永忠;李明叁;许家琨;;利用CUBE算法处理多波束测深数据研究[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
10 孙岚;刘雁春;陆秀平;欧阳永忠;李明叁;许家琨;;利用CUBE算法处理多波束测深数据研究[A];第二十一届海洋测绘综合性学术研讨会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 张韵萍苏小兰 李宾;对抗“震魔”的科技武器[N];中国经营报;2008年
2 赵艳秋李映;DSP核供应商灵活应对潜力应用[N];中国电子报;2007年
3 韩霁;高新技术在抗震救灾中得到应用[N];经济日报;2008年
4 ;系统加密防破解[N];中国计算机报;2008年
5 李晓萍;探测生命的“四种武器”[N];人民公安报;2008年
6 张显峰;机载干涉SAR系统掀起测绘革命[N];中国矿业报;2004年
7 ;22寸宽屏典范[N];电子资讯时报;2007年
8 本报记者 王繁泓;定华:破解储罐液位测量难题[N];中国化工报;2006年
9 记者 董映璧;人类活动影响全球气温[N];科技日报;2007年
10 苗得雨;挺进图像搜索时代[N];电脑报;2008年
中国博士学位论文全文数据库 前10条
1 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
2 黄亮;社会网络中的社区发现与链接预测算法研究[D];华中科技大学;2012年
3 石斌斌;高自由度GNSS抗干扰技术研究[D];国防科学技术大学;2011年
4 李一明;基于传导闭包图结构的布图算法研究[D];电子科技大学;2011年
5 樊玲;微弱目标检测前跟踪算法研究[D];电子科技大学;2013年
6 郭玉坤;某些正反散射问题的快速算法研究[D];吉林大学;2010年
7 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
8 张琦;基于聚合场模型的数据竞争算法及其应用研究[D];哈尔滨工程大学;2013年
9 周玉宇;基于Memetic算法的套料与切割优化方法研究[D];华中科技大学;2012年
10 杨春宇;数据流上的聚类与分类算法[D];清华大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈志强;基于经验模态分解算法的列车超偏载检测[D];中南大学;2010年
2 戴金;改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用[D];北京交通大学;2011年
3 余港;改进PSO算法及其应用[D];成都理工大学;2010年
4 余兵;基于枝条相关性的人工植物算法[D];太原科技大学;2013年
5 李亚龙;改进量子蚁群算法的研究及应用[D];安徽大学;2014年
6 段奇志;元器件光学检测系统的算法研究与实现[D];哈尔滨工业大学;2011年
7 庞秀立;基于色散算法的超宽带微波肿瘤检测技术研究[D];西安电子科技大学;2013年
8 史世泽;局部敏感哈希算法的研究[D];西安电子科技大学;2013年
9 石丽红;基于SOM算法的高维数据可视化[D];燕山大学;2013年
10 葛军;一种重叠社区发现算法及其在MapReduce上的实现[D];西安电子科技大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026