收藏本站
《内蒙古科技大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于密度聚类算法及其模式评估方法的研究与实现

宋飞燕  
【摘要】: 数据挖掘技术是目前计算机领域的研究热点之一,聚类分析作为数据挖掘技术的一个重要分支同样引起了大量研究人员的重视。目前在各个领域,针对不同的应用类型,已经开发了多种聚类算法。但是这些算法中没有一种算法能够适应所有的数据类型、簇和应用。所以,对于更加有效或者更适合复杂数据类型、簇或应用的新的聚类算法,总有一定的开发空间。同时,虽然目前已经存在了一些聚类评估的技术来判断什么是一个好的簇集,但是当使用客观度量精确地定义簇时,如何实现最优聚类往往在计算方面比较困难。 论文在对聚类算法做了详尽的分析之后,就课题两个方面的工作——聚类算法的改进和模式评估方法的提出做了深入的研究,并且辅以大量的可视化散点图和实例数据集实验结果图。由于传统聚类算法在聚类初始条件的确定、输入参数对领域知识的依赖程度、噪声数据的影响处理和变密度簇聚类等问题上面,存在着一定缺陷,故本课题提出了改进算法——基于密度和密度可达聚类算法(Clustering Algorithm Based on Density and Density reachable,CADD),该算法引入三个概念:第一,间接密度可达概念,深化算法挖掘复杂形状簇能力;第二,将簇密度的差异性引入邻域半径计算中,提出动态邻域半径的概念,使算法可以处理变密度簇;第三,提出了局部密度的概念,避免全局密度算法在某些参数下核心点落入数据稀疏区域的问题。实验结果表明,算法的设计和实现是成功的。 其次,文章对课题提出的基于数据点K-最近邻图的评估个体数据实例典型性的方法,进行了细致的讲述。在不同维度的数据集上进行的实验结果表明,课题提出的评估方法是切实可行的,是对聚类模式的一种有力的评估工具,增强了无指导聚类算法结果的可解释性和算法的可用性。同时,文章对比K均值、层次算法和神经网络考察了CADD算法处理实例数据集的有效性,实验表明,本文的密度算法和模式评估方法对处理现实数据集是有效的,可用性较高,聚类结果的可解释性良好。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 石陆魁,何丕廉;一种基于密度的高效聚类算法[J];计算机应用;2005年08期
2 于勇前;赵相国;王国仁;陈衡岳;;一种基于密度单元的自扩展聚类算法[J];控制与决策;2006年09期
3 张晓伟,杨育标;数据挖掘中的聚类浅析[J];电脑知识与技术;2005年23期
4 张春早;会议评判与聚类分析[J];中国机械工程;1988年02期
5 曾蒙福;马亨冰;;一种自适应网格聚类算法的研究[J];福建电脑;2006年03期
6 胡瑞飞;殷国富;谭颖;;一种混合聚类算法及其应用[J];四川大学学报(工程科学版);2006年05期
7 高德军,卢新春;基于聚类分析的简单高校分类方法[J];泰山学院学报;2004年03期
8 陈华英,董唯元;MPSA:数据集中新选择[J];微电脑世界;2002年23期
9 华玉培,袁光明;计算机在机械加工聚类分析中的应用研究[J];机械制造;1996年10期
10 刘合兵;尚俊平;;聚类分析算法研究[J];济源职业技术学院学报;2006年04期
中国重要会议论文全文数据库 前10条
1 聂承启;喻云峰;;聚类分析中Chameleon算法的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
2 刘亚丽;;数据集中—我国银行业竞争的核心手段[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
3 李均立;傅国华;;海南各县(市)经济实力的聚类分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
4 杨存丰;夏增海;田勇;张伟斌;程思亮;唐兴;;炸药部件γ射线局部密度的无损检测[A];中国工程物理研究院科技年报[C];2005年
5 张昕;彭宏;郑启伦;;基于微粒群算法的聚类分析[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
6 许建妹;袁卫军;檀璐;;如何运用Orem处理模式评估舌癌患者的自理能力[A];全国口腔科护理学术交流暨专题讲座会议论文汇编[C];2005年
7 梁祥;;甘肃中国人寿数据集中面临的问题与对策[A];甘肃保险论文集[C];2004年
8 李双虎;赵会民;;聚类有效性分析[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
9 杨欣斌;黄道;;一种新的聚类算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
10 高娟;罗东;臧雷;茆榆;;通光藤的NIRDRS聚类分析鉴别法摘要[A];2004年中国西部药学论坛论文汇编(上册)[C];2004年
中国重要报纸全文数据库 前10条
1 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
2 记者 阎红玉;数据点亮吉林“三农”[N];农民日报;2006年
3 苏畅;重炮还有差距 双塔接近完美[N];中国体育报;2008年
4 国泰君安 姜超;经济减速趋势明显[N];中国证券报;2007年
5 本报特派记者  苏畅;拦防压灭美国重炮[N];中国体育报;2006年
6 国泰君安证券研究所 姜超;货币信贷紧缩效果明显[N];中国证券报;2008年
7 高兴;从鱼腩身上找不足[N];中国体育报;2007年
8 本报特派记者  苏畅;发球是胜利的钥匙[N];中国体育报;2006年
9 本报记者 郭茹;数据点燃加息预期 债市“苦日子”熬不到头[N];第一财经日报;2007年
10 苏畅;一传成功率比对手低11%[N];中国体育报;2008年
中国博士学位论文全文数据库 前10条
1 李海民;遗传算法性能及其在聚类分析中应用的研究[D];西安电子科技大学;1999年
2 曹锋;数据流聚类分析算法[D];复旦大学;2006年
3 戴维迪;非监督知识发现过程中若干关键问题研究[D];天津大学;2005年
4 孙焕良;基于空间划分的优化聚类算法及相关技术研究[D];东北大学;2005年
5 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
6 杨春梅;基因表达数据聚类分析算法研究和应用[D];天津大学;2006年
7 李成安;分布式环境下聚类分析新方法的研究[D];浙江大学;2006年
8 苏薇薇;沙田柚指纹图谱特征与其药效学关系的研究[D];第一军医大学;2005年
9 吕俊萍;运用基因芯片技术研究复方丹参及其有效单体的内皮保护作用机理[D];四川大学;2004年
10 宋彦麟;辽宁省文化产业竞争力研究[D];哈尔滨工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 陶双;基于密度和网格的聚类分析在数据挖掘中的应用[D];大连海事大学;2005年
2 马煜;微阵列数据的聚类算法研究[D];西北大学;2006年
3 刘俊岭;聚类与孤立点检测算法的研究和实现[D];中国科学院研究生院(沈阳计算技术研究所);2006年
4 李斌;聚类分析在客户关系管理中的研究与应用[D];昆明理工大学;2004年
5 赵法信;基于密度的流数据聚类算法[D];东北大学;2005年
6 陈衡岳;聚类分析及聚类结果评估算法研究[D];东北大学;2006年
7 叶剑;基于聚类分析的港口集装箱吞吐量预测方法的研究[D];大连理工大学;2005年
8 袁凯;核心—外围格局的演化对我国居民收入的影响[D];对外经济贸易大学;2005年
9 涂进;基于模拟退火算法的聚类分析在数据挖掘中的应用[D];重庆大学;2003年
10 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978