收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

模糊聚类集成算法及融合差异度分析研究

齐淼  
【摘要】: 数据挖掘(Data Mining)就是从海量的数据中,提取隐含在其中的人们事先不知道的、但又是潜在有用的信息和知识的过程。而作为数据挖掘技术之一的聚类分析,无论是在数据分析、模式识别,还是在市场分析和图像处理方面都有着广泛的应用,所以越来越受到研究者的关注。 聚类分析就是在没有任何可供学习的样本情况下,将对象集进行自动分组,使类间相似性尽量小,类内相似性尽量大的一种分析方法。传统的聚类分析是一种硬划分,它把每个待聚类的样本严格地划分到某个类中,具有非此及彼的性质,也就是说样本只能属于所有类别中的某一类别。而实际上大多数样本在类属和形态方面存在着模糊性,即属性并没有严格地限制,适合进行软划分。 模糊理论的提出为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析,它是聚类分析与模糊理论相结合的产物。模糊聚类能得到样本属于各个类别的不确定性程度,表达了样本类属的模糊性,从而能更客观地反映现实世界。 作为当前聚类分析的新兴研究热点,聚类集成是将不同算法或者同一算法使用不同参数得到的结果进行合并,从而改善聚类性能。当前大多数聚类集成方法都将硬聚类算法作为基本的聚类算法,而将模糊聚类用在集成方面的研究甚少。针对这种情况,本文紧紧围绕模糊聚类这一课题,旨在分析研究如何改进经典的模糊聚类算法以及应用模糊聚类的特性来提高分类器集成的性能,此外还考虑多个聚类成员的差异性,利用模糊聚类集成来获得比硬聚类更为丰富的信息,来改善聚类质量。本文的创新性研究成果主要有: 1、提出了一种改进的模糊C-均值聚类算法(SWFCM)。该算法是针对模糊C-均值(FCM)聚类算法对噪声和孤立点数据敏感、样本分布不均衡的问题所提出的。改进隶属度函数,以消除孤立点对聚类结果的影响;为每个样本点赋予一个定量的权值,以区分不同的样本点对于知识发现的不同作用,改善噪音和分布不均衡的样本集的聚类结果。实验结果表明该算法具有更好的健壮性和聚类效果。 2、提出了一种基于模糊聚类思想的两级集成分类器算法(EWFuzzyBagging)。该算法首先将数据集用Fuzzy C-Means算法进行聚类,得到每个实例对应于每个类别的模糊隶属度。一级集成根据Bagging算法获得成员分类器,分类器个数为数据集类别数且每个成员分类器对应一个类别标号,这些成员分类器的采样方式为通过其对应类别的模糊隶属度为每个实例加权后进行随机重采样。二级集成是将一级集成产生的针对类别的成员分类器通过动态加权多数投票法来组合,学习到最终的分类结果。实验结果表明该算法与Bagging和AdaBoost相比具有更好的健壮性。 3、提出了一种基于互信息的模糊聚类集成算法(Mi-WFCE)。该算法首先利用模糊C-均值聚类算法(Fuzzy C-Means)通过每次随机选取初始聚类中心的方式来获得相互具有差异性的聚类成员,并将这些聚类成员通过基于投票机制的集成算法进行粗融合,获得一个粗融合聚类结果;然后将聚类成员与粗融合结果进行比对,通过互信息值来确定聚类成员的稳定性,根据其稳定性来设置聚类成员的权值;最终将加权后的聚类成员通过基于投票策略的集成算法产生最终的聚类集成结果。实验结果表明,新的算法能考虑聚类成员间稳定性的不同,从而明显改善聚类质量,得到较好的聚类集成结果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 纪丰民;罗辽复;;核酸序列的模糊聚类与分子进化[J];内蒙古大学学报(自然科学版);1992年02期
2 李煜;工业色彩设计中的模糊聚类分析[J];工程图学学报;1998年01期
3 王宏伟,詹荣开,贺汉根;基于模糊聚类的改进模糊辨识方法[J];电子学报;2001年04期
4 董晨,方晓彤,陈国龙;模糊聚类在个性化搜索引擎中的应用[J];福建电脑;2004年12期
5 樊桂印;周永生;;基于模糊聚类-BP神经网络模型的战场目标识别[J];火力与指挥控制;2008年S1期
6 曾翎;王美玲;陈华富;;遗传模糊C-均值聚类算法应用于MRI分割[J];电子科技大学学报;2008年04期
7 王红霞;叶晓慧;刘双双;;测试性分析中基于模糊聚类的系统划分方法研究[J];微电子学与计算机;2010年07期
8 刘琪;王少辉;;分段线性隶属度函数确定的密度聚类方法[J];周口师范学院学报;2011年02期
9 韩捷;;齿轮故障的模糊聚类及其微机辅助诊断[J];郑州大学学报(工学版);1989年04期
10 赵金厚,朱尚凑;数据库技术在模糊聚类预测中的应用研究[J];计算机工程与设计;1997年04期
11 丁震,胡钟山,杨静宇,唐振民;一种基于模糊聚类的快速二值化方法[J];计算机学报;1998年S1期
12 黄凤岗,孙文彦,宋克欧;模糊聚类网中多对一映射的实现[J];哈尔滨工程大学学报;1998年02期
13 王培珍,陈维南;基于模糊聚类与二维阈值的图像分割[J];东南大学学报(自然科学版);1998年06期
14 王越,曹长修;模糊聚类在数量型关联规则提取中的应用[J];计算机仿真;2003年11期
15 王培峰,李青茹;模糊聚类在样品检测中的应用[J];组合机床与自动化加工技术;2004年06期
16 吴正龙,熊范纶,滕明贵;基于模糊聚类的模糊关联规则挖掘[J];小型微型计算机系统;2004年07期
17 袁静,冯前进,陈武凡;基于模糊聚类优化的分形图像压缩快速算法[J];计算机应用与软件;2005年05期
18 马莉,黄敏;一种基于多分辨率与模糊聚类技术的散焦图像分割算法[J];中国图象图形学报;2005年03期
19 冯宾;刘曙光;李小兵;;一种基于改进的FCNN网络模型的学习算法[J];微型机与应用;2005年10期
20 董义革;;模糊数学模型评价[J];电脑编程技巧与维护;2006年09期
中国重要会议论文全文数据库 前10条
1 章小平;范九伦;裴继红;;基于空间信息与模糊聚类的纹理分割方法[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年
2 田云飞;李训诰;;基于模糊聚类阈值λ的噪声目标自动分类研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
3 孟燕;贾利民;孙扬;;基于模糊聚类的铁路智能运输系统逻辑结构划分方法[A];2005年中国智能自动化会议论文集[C];2005年
4 王恒;贾民平;;一种基于递阶模糊聚类的T-S模型建模算法[A];第二十九届中国控制会议论文集[C];2010年
5 江宝钏;张森;胡兰清;;无指导的模糊聚类的多回波脑部磁共振图像分割[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
6 李小平;焦李成;;信息颗粒在数据模糊聚类中的应用与构造[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年
7 张平安;李人厚;;一种新的模糊神经元网络技术的研究[A];1998中国控制与决策学术年会论文集[C];1998年
8 郭海涛;杨志民;陈军锋;梁超;高小艳;韩辉;;利用模糊聚类的海底小目标声呐图像分割[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
9 黄兴德;于萍;罗运柏;;模糊聚类应用于循环冷却水系统的水质诊断模式[A];’2001全国工业用水与废水处理技术交流会论文集暨水处理技术汇编[C];2001年
10 徐文军;黄道;;一种基于遗传算法的模糊C-均值聚类算法[A];第二十三届中国控制会议论文集(下册)[C];2004年
中国博士学位论文全文数据库 前10条
1 李春生;模糊聚类的组合方法及其应用研究[D];湖南大学;2010年
2 王晓丹;基于模糊聚类及神经网络的纹理分割方法研究[D];西北工业大学;2000年
3 黄宪成;模糊多目标决策理论、方法及其应用研究[D];大连理工大学;2003年
4 施建中;基于模糊聚类的非线性系统辨识研究[D];华北电力大学;2012年
5 孟祥红;工业企业技术创新测度理论与实践研究[D];天津大学;2004年
6 纪则轩;基于模糊聚类的脑磁共振图像分割技术研究[D];南京理工大学;2012年
7 黄建华;港口群企业集团组建模式与权益结构研究[D];燕山大学;2006年
8 朱喜林;模糊神经网络选择机械加工参数的应用研究[D];吉林大学;2006年
9 陈舵;模糊聚类分析及其在电力变压器故障诊断中的应用研究[D];西安理工大学;2008年
10 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
中国硕士学位论文全文数据库 前10条
1 范莹;基于进化计算和模糊聚类技术的多分类器联合研究[D];山东师范大学;2008年
2 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
3 柏强;电压分级控制电气距离法的研究[D];华北电力大学(北京);2006年
4 牛波;建设性项目群风险管理方法研究[D];西安建筑科技大学;2006年
5 胡小松;模糊聚类在规则空间中的应用及补救策略的探讨[D];江西师范大学;2003年
6 隋星光;Web用户浏览模式模糊聚类算法的研究[D];哈尔滨工程大学;2005年
7 罗晓萍;基于区域模糊特征的图像检索研究和实现[D];长沙理工大学;2005年
8 高晓琴;基于粗糙集和模糊聚类的WEB使用挖掘的研究[D];西南交通大学;2006年
9 罗浩;粮食物流中心宏观布局规划问题研究[D];北京交通大学;2008年
10 刘文彬;模糊综合评价系统研究与实现[D];河北工业大学;2003年
中国重要报纸全文数据库 前2条
1 汪应洛;关注资本市场的壳资源[N];陕西日报;2003年
2 胡荣山;建上海国际航运中心 港口需提高综合竞争力[N];中国交通报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978