收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

高属性维稀疏数据动态抽象聚类方法研究

尹松  
【摘要】:随着现代数据库和网络技术的迅速发展,人们必须面对大量的数据,为了从这些原始数据中发现隐含的,有价值的信息,我们需要高效的数据处理方法,数据挖掘正是为了迎合这种需要而产生并迅速发展起来的一种新的数据处理技术。聚类分析是数据挖掘的一个重要组成部分,随着数据挖掘得到越来越多的应用,聚类分析也得到了越来越多的关注,目前已有许多成熟的聚类算法,这些算法被广泛应用于各个相关领域中,如商业市场分析、生物工程研究、图形图像处理、模式识别、Web检索领域等等。 文中首先介绍了数据挖掘和聚类分析的一些相关理论以及国内外的研究现状,指出了聚类分析中急待解决的问题,然后分析了聚类方法中基于划分的、基于层次的、基于密度的、基于网格的和基于模型的方法,并对其中的一些典型算法进行了分析。本文主要是针对高维稀疏数据聚类中的异常值处理问题,目前这方面的研究还是比较少的,由于一般聚类方法很难处理高维稀疏数据中的异常值,所以对于高维稀疏数据聚类往往很难有高质量的聚类结果。针对这一问题文中首先提出了一种用二态属性值和最小生成树结合的动态聚类方法,该方法可根据阀值动态聚类,并能够在聚类时考虑对象属性的重要性,使聚类结果更加合理。由于自然界中的事物存在着各种关系,很多关系都是界限不明显的模糊关系,我们需要用模糊理论来描述,因此本文提出了另一种基于多元相似度和模糊相似矩阵的高


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王小乐;刘青宝;陆昌辉;侯东风;;一种最小生成树聚类算法[J];小型微型计算机系统;2009年05期
2 李朝健;李朝鹏;李肯立;;基于最小生成树的并行分层聚类算法[J];微电子学与计算机;2008年09期
3 庞春江;程伟想;牛为华;;基于优化网格的最小生成树聚类算法[J];计算机应用与软件;2009年08期
4 金欣;王晶;沈奇威;;分布式最小生成树聚类的设计与实现[J];计算机系统应用;2011年07期
5 欧阳浩;肖建华;;基于网格的最小生成树聚类算法[J];计算机与现代化;2006年12期
6 汪军;王传玉;周鸣争;;半监督的改进K-均值聚类算法[J];计算机工程与应用;2009年28期
7 叶青;唐鹏举;;一种改进的基于MST的聚类算法[J];计算机与现代化;2011年08期
8 王小乐;刘青宝;陆昌辉;陈文凯;;一种处理障碍约束的聚类算法[J];计算机应用;2009年02期
9 俞智君;张凤斌;;基于网格和MST的混合属性流数据聚类算法[J];电脑知识与技术;2010年19期
10 张爱华;;基于遗传算法的图论聚类方法[J];武汉大学学报(理学版);2005年S2期
11 刘勇国;张伟;陈克非;廖晓峰;;基于禁忌搜索的聚类簇数目估算算法[J];计算机科学;2005年01期
12 崔光照;曹玲芝;张勋才;王延峰;;基于密度的最小生成树聚类算法研究[J];计算机工程与应用;2006年05期
13 林甲祥;刘丰富;;基于MST聚类的离群检测算法研究[J];福建电脑;2007年09期
14 张丽霞;;如何在Web挖掘中使用聚类算法[J];牡丹江大学学报;2007年09期
15 王海波;王宪鹏;王芳;陈志国;;一种基于网格和最小生成树的数据流聚类算法[J];计算机系统应用;2011年02期
16 张艳;宦飞;;一种应用遗传算法的彩色图像分割方法[J];计算机应用与软件;2011年03期
17 闫德勤;迟忠先;;MAX-t_1范数聚类算法的改进[J];计算机科学;2004年06期
18 毛韶阳;李肯立;王志和;;最小生成树聚类方法研究[J];怀化学院学报(自然科学);2007年02期
19 栾绍峻;陈敏;崔巍;;基于Vague集的时间序列聚类算法[J];计算机应用;2010年S2期
20 梁伍七,江克勤;数据挖掘中的模糊聚类分析及其应用[J];安庆师范学院学报(自然科学版);2004年02期
中国重要会议论文全文数据库 前10条
1 李朝健;李朝鹏;李肯立;;基于最小生成树的并行分层聚类算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
2 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
5 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
6 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
7 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
9 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
3 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
4 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
5 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
6 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
7 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
8 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
9 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
10 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
中国硕士学位论文全文数据库 前10条
1 尹松;高属性维稀疏数据动态抽象聚类方法研究[D];广西大学;2005年
2 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
3 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
4 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
5 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
6 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
7 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
8 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
9 张立;基于新闻评论数据的K-means聚类算法的研究[D];太原理工大学;2010年
10 毕晋芝;遗传优化的K均值聚类算法[D];太原理工大学;2010年
中国重要报纸全文数据库 前5条
1 ;视频数据中挖“宝”[N];计算机世界;2002年
2 本报记者 赵凤华 通讯员 戴世勇 陶春明;本科生登上全国学术会议讲坛[N];科技日报;2008年
3 本报记者 段佳;提高未来智能电网自愈能力[N];大众科技报;2009年
4 本报记者 于翔;多元管理防范金融风险[N];网络世界;2010年
5 邳州市新世纪中学 王丽;浅谈数学在计算机科学及应用中的作用[N];学知报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978