收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

属性加权及不完备数据的模糊聚类方法研究

李丹  
【摘要】:模糊聚类是模式识别领域的研究热点之一,主要用于识别数据内在结构。相似性度量是模糊聚类算法中的一个关键问题,常用方法,如欧氏距离、海明距离等,隐含假定样本的属性对聚类的贡献均匀,具有一定的局限性;另外,由于获取数据的限制、随机噪音等原因,往往造成样本属性缺失,而多数聚类方法无法直接对这类数据集进行聚类分析。因此,本文研究属性加权及不完备数据的模糊聚类方法。本文的主要工作概述如下: 1.针对属性加权模糊聚类问题,提出了基于属性权重区间监督的模糊聚类算法,解决了权重确定的合理性问题,进而提高算法聚类性能。首先,从认知和数据集信息复杂性的角度出发,提出在聚类问题中采用区间数描述属性权重,由区间层次分析法获得属性对聚类的贡献度,相对于数值型属性权重更能提高权重表示的鲁棒性;其次,通过对属性权重与隶属度、聚类中心的迭代优化进行聚类分析,提出若权重计算结果超出区间约束,将其强制为区间中心值后再参与迭代计算,并设定最大强制次数以保证算法收敛。仿真实验表明,算法能够避免迭代计算陷入不必要的局部极小解,得到了更为准确的聚类结果。 2.针对不完备数据模糊聚类问题,提出了基于最近邻区间的不完备数据聚类算法。首先,鉴于缺失属性的不确定性,本文依据不完备样本的近邻信息提出了缺失属性的最近邻区间描述;其次,基于最近邻区间描述,提出了两种不完备数据聚类算法。第一,将不完备数据集转化为区间型数据集进行聚类分析,算法所得聚类中心为属性空间中的超凸多面体,能够在一定程度上反映数据集子类形态,有利于得到更切实际的聚类结果;第二,鉴于最近邻区间描述能够将缺失属性估算限定在合理范围内,提出了遗传算法—模糊C均值的混杂框架,利用遗传算法在区间范围内搜索缺失属性的优化估算值,进而通过模糊C均值算法对“还原”后的完整数据集进行聚类分析,该算法在合适的缺失属性估算值基础上能够获得更为满意的聚类结果。 3.针对现有不完备数据模糊聚类算法未考虑样本各属性对聚类贡献不同的问题,提出了基于属性加权的不完备数据模糊聚类算法。首先,利用经典算法对不完备数据集进行一次聚类,得到较为准确的缺失属性估算值和样本类别;其次,利用ReliefF算法对“还原”后的完整数据集进行属性评价;最后,通过加权欧式距离将属性权重引入聚类分析,实现缺失属性及聚类结果的一体化求解。仿真实验表明,所提算法通过强调重要属性的作用能够明显提高不完备数据的聚类效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 鄂旭,高学东,武森,张秋月;信息表中不完备数据的填补方法[J];北京科技大学学报;2005年03期
2 刘大有,王飞,卢奕南,薛万欣,王松昕;基于遗传算法的Bayesian网结构学习研究[J];计算机研究与发展;2001年08期
3 马莉;赵树升;朱磊;;基于有偏场的光栅图像模糊聚类分割算法[J];计算机应用研究;2006年04期
4 唐明珠;张远平;杨佳;;一种基于概念相似度的文本模糊聚类方法[J];科学技术与工程;2007年05期
5 田云飞;李训诰;;基于两种模糊聚类方法的噪声目标自动分类研究[J];仪器仪表用户;2005年06期
6 吴雪梅;李瑰贤;赵伟民;;基于模糊聚类的Kohonen神经网络三角网格曲面重建[J];中国工程机械学报;2006年04期
7 兰华;郝红艳;邓颖;刘宁;张智;;基于发电机同调性的相量测量单元优化配置[J];南方电网技术;2009年06期
8 甘惠;田哩;甘明;;模糊聚类法在数字参考服务质量评估中的应用[J];情报探索;2010年08期
9 孟晓琳;黎英;韩超;;基于模糊聚类的背景初始化方法[J];微型机与应用;2011年05期
10 刘雪梅;张树生;洪歧;黄绍林;;逆向工程中基于模糊聚类的点云数据分区[J];机械科学与技术;2007年04期
11 孟令奎;胡春春;;基于模糊划分测度的聚类有效性指标[J];计算机工程;2007年11期
12 叶德谦;马志强;李帼;姜皇普;;基于模糊神经网络的粗糙集在股市预测中的应用[J];计算机科学;2008年04期
13 冯海明;金龙哲;张春芝;;基于神经网络的煤炭自燃预测及在MATLAB上的实现[J];中国煤炭;2008年05期
14 张月琴;白雅彬;;用于图像分割的粗糙集改进模糊聚类方法[J];计算机工程与应用;2010年08期
15 姚磊;王红明;郑锋;侯飞;;空中目标威胁估计的模糊聚类方法研究[J];武汉理工大学学报(交通科学与工程版);2010年06期
16 李广明;;基于本体的知识资源模糊聚类分析[J];计算机应用研究;2011年02期
17 马壮,杨善林,胡小建;贝叶斯网结构学习的研究现状及发展趋势[J];合肥工业大学学报(自然科学版);2005年08期
18 刘建英;徐爱萍;;自组织神经网络在模糊聚类中的应用研究[J];微机发展;2005年12期
19 刘秋菊;王仲英;刘素华;;基于遗传模拟退火算法的模糊聚类方法[J];微计算机信息;2006年05期
20 魏斯民;欧阳春娟;欧阳迎春;杨群生;;基于小波变换模糊聚类的噪声消除算法[J];煤矿机械;2006年07期
中国重要会议论文全文数据库 前10条
1 武森;张桂琼;王莹;吴玲玉;;容差集合差异度高维不完备数据聚类[A];第十二届中国管理科学学术年会论文集[C];2010年
2 刘华;张建华;王娆芬;王行愚;;人机系统操作员功能状态的模糊聚类方法[A];第二十九届中国控制会议论文集[C];2010年
3 童占梅;;基于模糊聚类的语音识别[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
4 蒋佐升;;遗传育种上模糊聚类方法的改良及应用[A];模糊数学和系统成果会论文集[C];1991年
5 王英烈;周宗放;;基于模糊聚类的赊销客户信用风险研究[A];中国灾害防御协会风险分析专业委员会第二届年会论文集(二)[C];2006年
6 崔宝珍;王泽兵;潘宏侠;;小波包分析和模糊聚类方法在滚动轴承故障诊断中应用[A];第九届全国振动理论及应用学术会议论文集[C];2007年
7 黄桂田;;劳动密集型制造业:划分方法和产业规模度量——基于1993—2007年行业数据的模糊聚类方法[A];社会主义经济理论研究集萃——纪念新中国建国60周年(2009)[C];2009年
8 张晓峰;王丽珍;陆叶;;一种基于属性加权的不确定K-means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 王宏伟;孙志刚;;基于模糊模型化简的自适应辨识方法[A];2004中国控制与决策学术年会论文集[C];2004年
10 许美蓉;於春月;曹壮;;基于模糊聚类方法的炼钢-连铸紧急合同插入问题的研究[A];全国冶金自动化信息网2009年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 李丹;属性加权及不完备数据的模糊聚类方法研究[D];大连理工大学;2011年
2 贾海洋;贝叶斯网学习若干问题研究[D];吉林大学;2008年
3 赵佰亭;混合决策系统的粗集模型及在转台故障诊断中的应用[D];哈尔滨工业大学;2010年
4 周震虹;洞庭湖区农业产业化发展研究[D];中南大学;2005年
5 孙成敏;基于粗糙集的知识发现方法研究[D];吉林大学;2006年
6 郭东;基于应用偏好模糊聚类的网格资源选择[D];吉林大学;2009年
7 蒋红妍;高速公路路面养护管理系统研究[D];长安大学;2006年
8 李贻斌;ITS智能车辆关键技术研究[D];天津大学;2008年
9 方仍存;电力系统负荷区间预测[D];华中科技大学;2008年
10 白亮;聚类学习的理论分析与高效算法研究[D];山西大学;2012年
中国硕士学位论文全文数据库 前10条
1 张德栋;面向不完备数据的增量挖掘算法研究[D];鲁东大学;2010年
2 陈小慧;基于粗糙集和粒计算的不完备数据挖掘研究[D];鲁东大学;2012年
3 金成美;缺失数据填补方法研究[D];辽宁工业大学;2011年
4 黄应;基于张量分析的不完备图像修复研究[D];华中科技大学;2007年
5 刘继军;基于张量分析的不完备图像数据分类研究[D];华中科技大学;2007年
6 孙毅;基于灰色系统的CT不完备投影重建算法的研究[D];大连理工大学;2007年
7 李晓瑜;粗糙集理论下不完备决策表的属性约简算法研究[D];广西师范大学;2012年
8 许璞;模糊聚类方法生成本体的案例研究[D];中央民族大学;2010年
9 张志红;基于神经网络模糊聚类的研究[D];安徽大学;2004年
10 王炜;不完备决策表属性约简的矩阵算法研究[D];广西师范大学;2012年
中国重要报纸全文数据库 前1条
1 冯峰 黄河水利职业技术学院讲师,博士;控制黄河下游河型的可能性分析[N];黄河报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978