收藏本站
《哈尔滨工程大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

聚类分析中k-均值方法的研究

于翔  
【摘要】: 数据挖掘是从庞大的数据集或数据库中提炼有用信息的科学。它汇集了统计学、机器学习、数据库、模式识别、人工智能等学科的内容,是一门新兴的交叉学科。 聚类分析是数据挖掘中的一个重要研究领域,是一种数据划分或分组处理的重要手段和方法。聚类的应用是非常广泛的,无论是在商务上、还是在市场分析生物学、WEB文档分类等领域中都得到了充分的应用。目前,聚类算法大体上分为划分的方法、层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。这些算法存在如下的问题:符号属性问题、算法的效率问题、初值的选择问题、对输入顺序的敏感性问题、最优解问题、算法对输入参数的依赖性问题。 本文研究基于划分的聚类方法中有效选取初值的问题。主要工作如下: 首先,概括介绍了聚类分析的基本原理,并对聚类分析中的基本数据类型进行了描述。 其次,在对各种聚类算法进行简单描述后,提出了本文所涉及到的基于划分的聚类算法,并提出了本文中的算法对聚类分析中普遍存在的初始中心选择问题的处理方式。 最后,给出了改进的基于划分的聚类方法,以及其中涉及到的最小生成树算法的基本思想。并通过实验有效验证了算法的可行性。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13;TP18

手机知网App
【引证文献】
中国期刊全文数据库 前3条
1 黄远顺;;矫直机的自动故障预报技术[J];安徽冶金;2012年01期
2 董新婉;顾丹;;城市轨道交通建设时序分析[J];地下空间与工程学报;2012年S2期
3 李薇;陈瑾;左建国;;基于聚类的短波异构网动态频率选择[J];通信技术;2011年11期
中国硕士学位论文全文数据库 前10条
1 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
2 李玲玲;基于K-means的企业基础信息挖掘模型的设计与应用[D];东北财经大学;2010年
3 王敏;基于遗传算法的改进K均值聚类[D];中北大学;2011年
4 吴文亮;聚类分析中K-均值与K-中心点算法的研究[D];华南理工大学;2011年
5 牟善玲;动态心电波形聚类策略的有效性分析[D];天津理工大学;2011年
6 张永健;无线传感器网络系统虚拟空间技术研究[D];东华大学;2012年
7 魏艳;基于eMule文件名的英语词语聚类和相似度分析[D];北京交通大学;2008年
8 陶晓华;聚类分析在企业固定资产管理中的应用[D];山东师范大学;2008年
9 刘高文;基于隐马尔可夫模型的视觉行为分析和异常检测研究[D];南京理工大学;2008年
10 王梦萍;模糊聚类算法在学科建设中的应用[D];哈尔滨工程大学;2009年
【参考文献】
中国期刊全文数据库 前8条
1 范九伦,裴继红,谢维信;基于可能性分布的聚类有效性[J];电子学报;1998年04期
2 李建中;一种并行数据库的动态多维数据分布方法[J];软件学报;1999年09期
3 陈宁,陈安,周龙骧;基于密度的增量式网格聚类算法(英文)[J];软件学报;2002年01期
4 苏中,马少平,杨强,张宏江;基于Web-Log Mining的Web文档聚类[J];软件学报;2002年01期
5 马帅,王腾蛟,唐世渭,杨冬青,高军;一种基于参考点和密度的快速聚类算法[J];软件学报;2003年06期
6 李昕,郑宇,江芳泽;用改进的RPCL算法提取聚类的最佳数目[J];上海大学学报(自然科学版);1999年05期
7 唐立新,杨自厚,王梦光;用遗传算法改进聚类分析中的K-平均算法[J];数理统计与应用概率;1997年04期
8 周水庚,范晔,周傲英;基于数据取样的DBSCAN算法[J];小型微型计算机系统;2000年12期
【共引文献】
中国期刊全文数据库 前10条
1 叶良艳;;基于改进后的K-means聚类算法的网吧用户行为聚类[J];安徽科技学院学报;2009年04期
2 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期
3 李玉鑑;;基于最小树切割的自适应聚类方法[J];北京工业大学学报;2007年03期
4 左国才;周荣华;符开耀;;基于DBSCAN算法的电信客户分类的应用研究[J];北京联合大学学报(自然科学版);2012年03期
5 陈久梅;模糊聚类分析法在专有技术评估中的应用[J];商业研究;2005年03期
6 宋殿霞;王艳;邹光辉;;空间数据挖掘聚类算法研究[J];滨州学院学报;2006年06期
7 田彦山;;基于山峰聚类的聚类上限确定方法[J];江西师范大学学报(自然科学版);2007年02期
8 张栒;邓辉文;;基于减法聚类与聚类有效性评判的FCM聚类[J];重庆工学院学报;2006年05期
9 王秋芬;黄方林;马广;;Fisher最优分割在桥梁健康监测门槛值分级中的应用[J];铁道科学与工程学报;2009年02期
10 霍亮;杨柳;张俊芝;;数据挖掘及其发展方向探索[J];产业与科技论坛;2011年20期
中国重要会议论文全文数据库 前10条
1 ;A Hybrid Clustering Algorithm Based on Grid Density and Rough Sets[A];第二十七届中国控制会议论文集[C];2008年
2 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
3 任鸿;郑岩;曲昭伟;邓芳;;聚类有效性研究[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
4 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 ;A Semi-supervised Clustering Algorithm Based on Rough Reduction[A];2009中国控制与决策会议论文集(3)[C];2009年
6 毛政元;;高空间分辨率光学卫星影像数据挖掘的策略[A];2007年福建省土地学会年会征文集[C];2007年
7 秦朗;;基于二叉树多层分类SVM的脱机手写体汉字识别[A];第十九届测控、计量、仪器仪表学术年会(MCMI'2009)论文集[C];2009年
8 朵春红;王翠茹;;基于取样的DBSCAN聚类算法及其遗传优化[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
9 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 刘彤;孙永香;张振洪;;一种有效的基于密度和层次的聚类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
中国硕士学位论文全文数据库 前10条
1 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
2 高兆梓;基于专利分析的竞争对手分类系统研究[D];山东科技大学;2010年
3 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
4 赵慧杰;面向论坛的话题发现、跟踪及传播技术研究[D];哈尔滨工程大学;2010年
5 刘振广;一种改进的k_means聚类算法研究[D];哈尔滨工程大学;2010年
6 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
7 卢加磊;半监督学习中协同训练与多视图方法的比较及改进[D];中国海洋大学;2010年
8 王祎;物业管理中数据挖掘技术的应用[D];中国海洋大学;2010年
9 张鑫;基于支持向量机的能源管理系统短期负荷预测[D];长春工业大学;2010年
10 杨建红;基于密度的聚类算法研究[D];长春工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 杨尚达;李世平;;遗传算法研究[J];兵工自动化;2008年09期
2 程乾生;属性识别理论模型及其应用[J];北京大学学报(自然科学版);1997年01期
3 贾克斌;信息系统设计中聚类分析方法的研究[J];北京工业大学学报;1999年03期
4 臧铁飞,沈庭芝,陈建军,顾建军;改进的Hausdorff距离和遗传算法在图像匹配中的应用[J];北京理工大学学报;2000年06期
5 薄雪峰;全海英;刘志成;谭国庆;何玉;;被动式立体视觉研究进展[J];北京生物医学工程;2008年05期
6 雷霖;代传龙;王厚军;;基于Rough set理论的无线传感器网络节点故障诊断[J];北京邮电大学学报;2007年04期
7 李业丽;秦臻;;一种改进的k-means算法[J];北京印刷学院学报;2007年02期
8 田彦山;;基于山峰聚类的聚类上限确定方法[J];江西师范大学学报(自然科学版);2007年02期
9 王文发;马燕;李宏达;;回溯法求解多约束分配问题[J];江西师范大学学报(自然科学版);2008年06期
10 党育民;;序列模式挖掘算法研究[J];江西师范大学学报(自然科学版);2009年05期
中国硕士学位论文全文数据库 前10条
1 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
2 董西国;支持向量机在数据挖掘中的应用[D];哈尔滨工程大学;2002年
3 朱红琛;短波组网及其相关技术[D];电子科技大学;2003年
4 张兴兰;税源监控问题研究[D];西南财经大学;2004年
5 余洪山;主动立体视觉关键技术及其应用研究[D];湖南大学;2004年
6 李伟;我国工程项目的生产率研究[D];清华大学;2004年
7 李春华;基于改进截集FCM算法灰度图像分割方法研究[D];西安科技大学;2005年
8 戴涛;聚类分析算法研究[D];清华大学;2005年
9 李驰宇;高速公路造价快速估算模型与方法的研究[D];西南交通大学;2006年
10 陈旭;城市轨道交通外部性研究[D];华中科技大学;2005年
【二级引证文献】
中国期刊全文数据库 前7条
1 林春丽;齐欣;王克成;;SVM-KNN分类器在异常行为检测中的应用[J];辽宁科技大学学报;2010年05期
2 王晟;赵壁芳;;面向云计算的数据管理技术研究[J];电脑知识与技术;2012年13期
3 董新婉;顾丹;;城市轨道交通建设时序分析[J];地下空间与工程学报;2012年S2期
4 吕燕;刘椿枫;肖政;李泽钧;;云计算在电力信息化建设中的研究与应用[J];电力信息化;2012年07期
5 辛大欣;屈伟;;基于Hadoop的云计算算法研究[J];电子设计工程;2013年03期
6 邓静;方绍正;;基于云计算的校园应用服务器虚拟化技术研究[J];宿州学院学报;2012年11期
7 刘娜;;基于混合高斯背景模型的运动目标检测[J];无线互联科技;2012年09期
中国重要会议论文全文数据库 前1条
1 徐焜耀;谢兵;杨蕴华;彭光金;曹端;孟卫东;;聚类改进算法在电力工程造价估算中的应用[A];电网工程造价管理优秀论文[C];2011年
中国硕士学位论文全文数据库 前10条
1 李艳生;分布式并行计算智能调度策略的研究与实现[D];湖北师范学院;2011年
2 王照青;支持异常行为检测的物理访问控制系统的设计与实现[D];复旦大学;2010年
3 崔晶婧;因子分析在白车身装焊误差监控方面的应用研究[D];沈阳理工大学;2011年
4 刘强;基于聚类分析的变点识别方法研究[D];天津大学;2012年
5 高艳;改进的主成分分析方法在学科建设中的应用[D];哈尔滨工程大学;2011年
6 吴琳;基于最小二乘支持向量机的时态数据预测研究及应用[D];东北财经大学;2011年
7 刘晓丽;基于机器视觉的异常行为检测[D];辽宁科技大学;2012年
8 王春;基于Baosteel电子商务的CRM研究及应用[D];东华大学;2012年
9 史琳琳;车牌识别中车牌定位技术的研究[D];东华大学;2012年
10 丛学斌;基于云形态数据中心的设计及数据访问的实现[D];吉林大学;2012年
【二级参考文献】
中国期刊全文数据库 前3条
1 李建中;并行数据库的查询处理并行化技术和物理设计方法[J];软件学报;1994年10期
2 李建中,都薇;并行数据库上的并行CMD-Join算法[J];软件学报;1998年04期
3 胡山鹰,陈丙珍,何小荣;连续变量问题全局优化的模拟退火法[J];系统工程理论与实践;1995年09期
【相似文献】
中国期刊全文数据库 前10条
1 石云平;;使用平均误差准则函数E的K-means算法分析[J];计算机与信息技术;2008年08期
2 石云平;;聚类K-means算法的应用研究[J];国外电子测量技术;2009年08期
3 郭家义;个性化检索系统中的数据挖掘技术分析[J];图书情报工作;2003年08期
4 蒋正君;;南京移动客户流失分析[J];江苏通信技术;2005年06期
5 张效娟;;k-means算法的改进和在保险业CRM中的应用[J];大连交通大学学报;2008年01期
6 李米娜;朱玉全;陈耿;郝洪星;;一种基于局部密度的核K-means算法[J];计算机应用研究;2011年01期
7 王银辉;熊忠阳;;使用BP网络改进K-means聚类效果[J];计算机科学;2006年03期
8 忻凌;倪志伟;黄玲;;基于数据流的BIRCH改进聚类算法[J];计算机工程与应用;2007年05期
9 赵大伟;肖周芳;;一种改进的基于密度和样本数量的K-means算法[J];科技信息;2008年28期
10 石云平;辛大欣;;基于K-means聚类算法的分析及应用[J];西安工业大学学报;2006年01期
中国重要会议论文全文数据库 前10条
1 蔡江辉;张继福;赵旭俊;;一种基于距离支持度的离群数据挖掘算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 田小丽;郑康锋;钮心忻;;一种基于改进K-Medoids算法的网络攻击检测技术[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
4 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
5 张昕;彭宏;郑启伦;;基于微粒群算法的聚类分析[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
6 樊建聪;梁永全;唐雷雨;曾庆田;;一种新的令牌群模型及其在数据挖掘中的应用[A];2007'仪表,自动化及先进集成技术大会论文集(二)[C];2007年
7 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
8 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
9 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
4 张立明;数据挖掘之道[N];网络世界;2003年
5 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
6 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
7 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
8 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
9 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
10 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
2 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
7 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 于翔;聚类分析中k-均值方法的研究[D];哈尔滨工程大学;2007年
2 孙思;利用遗传思想进行数据划分的DBSCAN算法研究[D];重庆大学;2005年
3 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
4 晏璐;基于划分的聚类算法及其在Web挖掘中的应用[D];大连理工大学;2007年
5 姜亚南;数据挖掘在校园网用户网络行为分析的应用研究[D];河南理工大学;2009年
6 徐辰冠;基于数据挖掘聚类技术的我国高校分类研究[D];华中科技大学;2011年
7 刘志才;基于最小生成树思想改进后的KK-MEANS聚类方法研究及其在地震数据集中的应用[D];四川师范大学;2009年
8 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
9 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
10 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026