收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

不确定数据聚类研究

李雪  
【摘要】: 不确定数据是近年来在传感器网络(WSN)、无线射频识别(RFID)等领域中涌现出来的一类新数据,对不确定数据聚类分析已经成为数据挖掘领域研究的新热点。本文阐述了数据不确定性形成的原因和表现形式,列举已有的不确定数据聚类算法的基本思想和优缺点,通过这些分析了解到,现有不确定数据聚类算法主要是对传统的聚类算法进行扩展而形成的,算法的流程也都是基于经典的确定对象聚类算法流程。 由于数值型数据的聚类问题已经被证实了是NP-难解的组合优化问题,而骨架作为全局最优解的共同部分是获得NP-难解问题启发式算法的有利工具。但是在很多问题中骨架很难获得,近似骨架可以很好的模拟全局最优解,所以对于很多NP-难解问题都采用近似骨架进行算法优化。本文提出了一种基于近似骨架的不确定数据聚类算法框架ABAUDC,主要分为初始聚类产生局部最优解、构造近似骨架和二次聚类三个模块。它采用已有的CKMeans算法作为生成局部最优解的初始聚类算法,简化了对不确定数据对象期望距离的计算。在获得近似骨架后,将约束条件加入到不确定数据集中,并调用SS-UKMeans作为二次聚类算法进行半监督学习。 ABAUDC算法特点:一是具有很好的灵活性,它提供的是一个算法框架,任何现有不确定聚类算法都可以作为它的模块;二是实现简单,利用近似骨架作为约束条件,只需进行简单的相交操作就能缩小二次聚类过程中解的搜索空间,实现算法的快速收敛。为了验证新算法的聚类效果,首先构造了以UCI机器学习库中四个经典数据集为原始点的不确定数据集,然后在各个数据集上进行算法比较。通过平均质量标准对ABAUDC算法和无监督的UKMeans算法的聚类效果进行评估。实验证明,新算法的聚类准确度得到了显著的改善。 新算法的提出,将两个不同领域知识进行了有效的结合,为不确定数据聚类研究工作拓展了思路,同时也为骨架研究找到了新的应用领域。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈世亮;赵雪璐;刘卫江;;一种快速识别长流的方法[J];软件导刊;2009年03期
2 许元红;吴扬扬;;基于聚类方法的ATM交易量分析[J];华南金融电脑;2006年01期
3 周淑娟;阮晓钢;;一种简单有效的算法在肿瘤亚型发现中的应用[J];微计算机信息;2006年12期
4 王新;马万青;潘文林;;基于Web日志的用户访问模式挖掘[J];计算机工程与应用;2006年21期
5 苏令华;吕韶昱;万建伟;;基于多预测器的高光谱图像无损压缩[J];国防科技大学学报;2007年01期
6 连玮;梁彦;潘泉;程咏梅;张洪才;;用于特征点配准的快速聚类凸集投影算法[J];自动化学报;2007年03期
7 唐槐璐;须文波;龙海侠;;基于AQPSO的数据聚类[J];计算机工程与应用;2007年10期
8 姚婷婷;;卫星遥感图像的聚类分析研究[J];软件导刊;2007年15期
9 洪联系;董绍华;;MDVRPTW问题多阶段迭代启发式算法[J];计算机工程与应用;2007年26期
10 程舒通;徐从富;但红卫;;频繁模式聚类算法改进研究[J];计算机工程与应用;2008年01期
11 张琼;张莹;白清源;谢丽聪;谢伙生;;一种新的基于粗糙集的leader聚类算法[J];计算机科学;2008年03期
12 李云;田素方;李拓;徐涛;;基于概念格的Web文本聚类[J];计算机工程与应用;2008年23期
13 刘怀强;;视频序列中运动目标影子去除方法[J];科技信息;2008年30期
14 徐玮;张茂军;王炜;熊志辉;;基于群体智能的基础矩阵估计算法[J];系统仿真学报;2008年22期
15 范建平;李常洪;吴美琴;梁嘉骅;侯丽萍;;贝叶斯网络在中医诊断中的应用研究[J];管理科学学报;2008年06期
16 张维东;朱宏明;周闻钧;;聚类方法在图像识别中的应用[J];微型电脑应用;2009年02期
17 罗晓丽;郭绍忠;陈新;;采用服务聚类的语义服务发现[J];信息工程大学学报;2009年03期
18 吴东洋;业宁;沈丽容;张倩倩;赖正文;;基于颜色矩的木材缺陷聚类识别[J];江南大学学报(自然科学版);2009年05期
19 巩敦卫;蒋余庆;张勇;周勇;;基于微粒群优化聚类数目的K-均值算法[J];控制理论与应用;2009年10期
20 柳佳刚;曾利军;;基于PAT-tree的中文搜索引擎结果聚类算法[J];情报杂志;2009年12期
中国重要会议论文全文数据库 前10条
1 杨勰;刘群;吴渝;;基于聚类算法的粒子系统模拟实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
2 樊迪;刘振明;金宏威;张亮仁;张礼和;;基于配体结合模式的辅酶A结合蛋白的分类方法研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
3 高冠东;贾克斌;肖珂;;一种新的基于特征点匹配的图像拼接方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
4 马垣;张红云;李晓瑞;刘刚;张小平;马文胜;;关系数据库中基于拓扑空间的聚类方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 秦龙;吴义坚;王仁华;;基于HMM的说话人转换中MLLR回归矩阵绑定方法的研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 谢毓湘;栾悉道;吴玲达;文军;老松杨;;一种基于聚类的播音员镜头探测方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 赵晓煜;康锦江;;基于客户价值的客户聚类及特征分析方法[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年
8 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 王云龙;李逊;;基于数据场的数据挖掘方法在入侵检测中的应用[A];第十九次全国计算机安全学术交流会论文集[C];2004年
10 李涵;;一种改进的聚类方法在异常检测中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王勇;基于流形学习的分类与聚类方法及其应用研究[D];国防科学技术大学;2011年
2 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
3 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
4 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年
5 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年
6 刘建伟;流数据查询系统结构及模式查询算法的研究[D];东华大学;2005年
7 吴瑞;模糊和粗糙环境下的网络用户浏览模式研究[D];天津大学;2006年
8 殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年
9 王昱;考虑特征变量异质性的分类方法及其在风险决策中的应用研究[D];中国科学技术大学;2009年
10 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
中国硕士学位论文全文数据库 前10条
1 李雪;不确定数据聚类研究[D];大连理工大学;2009年
2 盛文峰;面向数据挖掘的遗传算法的研究与应用[D];上海交通大学;2007年
3 倪乐央;基于非参数方法的我国城市化水平聚类分析[D];浙江工商大学;2007年
4 伊莉娜;基于Agent的移动查询技术研究[D];哈尔滨理工大学;2008年
5 李国宇;基于J2EE的数据挖掘系统的构建及聚类技术研究[D];天津大学;2007年
6 吴孙丹;基于聚类的入侵检测方法的研究[D];华中科技大学;2007年
7 金燕;多时间序列数据流聚类算法研究[D];国防科学技术大学;2007年
8 李敏;基于网格和密度的数据流聚类算法研究[D];武汉理工大学;2009年
9 司学锋;基于聚类的BP神经网络在织物染色计算机配色中的应用研究[D];青岛大学;2009年
10 梁敏君;分形聚类分析在证券客户细分中的应用研究[D];合肥工业大学;2009年
中国重要报纸全文数据库 前5条
1 本刊特稿 陈岩;鲁西南村名的文化解读[N];济宁日报;2007年
2 王国定 宋瑞卿 王永亮;山西上市公司综合实力谁强?[N];山西日报;2001年
3 王宇乔;减肥品男性消费群不容忽视[N];民营经济报;2005年
4 李海峰;优化无功管理 实现电网安全运行[N];国家电网报;2008年
5 本报实习生 庞仕影;权威榜单不能让数字牵着走[N];国际金融报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978