收藏本站
《辽宁师范大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

模糊c-均值算法的研究

蔡静颖  
【摘要】: 随着数据库技术的不断发展及数据库管理系统的广泛应用使得各组织机构积累了海量数据,为了从中提取有用信息,更好地利用这些数据资源,人们提出了数据挖掘技术。数据挖掘技术将传统的数据分析方法与处理大量数据的复杂算法相结合,是目前信息领域和数据库技术的前沿研究课题。 聚类分析技术是数据挖掘的主要方法,它将数据划分成有意义或有用的组(簇),在众多的聚类分析算法中,模糊聚类算法是当前研究的热点。本文对其中最经典的模糊c-均值(FCM)算法进行了深入研究,并对它加以改进和优化,实验验证了方法的可行性和有效性。 本文系统分析了FCM算法和马氏距离的基本原理,从而利用马氏距离的优点来弥补FCM算法中存在的缺陷,其次利用优化的KPCA进行特征提取,本文从三个方面对FCM算法进行了改进。 首先,经典的模糊c-均值(FCM)算法是基于欧氏距离的,它只适用于球型结构的聚类,且在处理属性高相关的数据集时,分错率增加。针对这个问题,提出了一种新的聚类算法(FCM-M),它将马氏距离替代模糊c-均值中的欧氏距离,并在目标函数中引进一个协方差矩阵的调节因子,利用马氏距离的优点,有效地解决了FCM算法中的缺陷,并利用特征值,特征矢量及伪逆运算来解决马氏距离中遇到的奇异问题。 其次,经典的模糊c-均值算法认为样本矢量各特征对聚类结果贡献均匀,没有考虑不同的属性特征对模式分类的不同影响,且在处理属性高相关的数据集时,该算法分错率增加。针对这些问题,提出了一种基于马氏距离特征加权的模糊聚类算法,利用自适应马氏距离的优点对特征加权处理,从而对高属性相关的数据集进行更有效的分类。 最后,利用核函数主元分析(KPCA)方法对大样本,高维数据进行特征提取预处理,并结合文化算法(CA)选择最优或接近最优的核函数,将其用于模糊c-均值(FCM)聚类中,不但有效地提取了样本的非线性信息,而且使样本维数得到约简。 利用MATLAB语言实现上述方法,并进行了UCI数据集聚类和图像分割两组实验,从实验结果看,均达到预期效果。
【学位授予单位】:辽宁师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前2条
1 田沛;温兴贤;;热工过程建模中的数据处理方法研究[J];计算机仿真;2013年08期
2 樊东红;曾彦;王明娟;;FCM算法在钦州湾不同时期水质预测中的应用[J];中南林业科技大学学报;2012年11期
中国硕士学位论文全文数据库 前3条
1 杨敏煜;基于改进聚类算法的数据挖掘系统的研究与实现[D];电子科技大学;2012年
2 马娜娜;基于密度的模糊聚类分析算法研究[D];内蒙古科技大学;2012年
3 温兴贤;炉内燃烧工况分析与诊断[D];华北电力大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 郭辉;王玲;刘贺平;;基于核主成分分析与最小二乘支持向量机结合处理时间序列预测问题[J];北京科技大学学报;2006年03期
2 纪宏金;地球化学背景与异常划分的多元方法[J];长春地质学院学报;1988年03期
3 范九伦,吴成茂;FCM算法中隶属度的新解释及其应用[J];电子学报;2004年02期
4 朱秋煜;王朔中;;图像特征检测和马氏距离中的数据融合与置信度[J];电子与信息学报;2008年03期
5 李昭阳,韩之俊;一种新的判别预测方法——马田系统(MTS)[J];管理工程学报;2000年02期
6 杨希;钱锋;张兵;;基于核函数主元分析的SVM建模方法及应用[J];华东理工大学学报(自然科学版);2007年02期
7 黄海燕;柳桂国;顾幸生;;基于文化算法的KPCA特征提取方法[J];华东理工大学学报(自然科学版);2008年02期
8 刘小芳,曾黄麟,吕炳朝;点密度函数加权模糊C-均值算法的聚类分析[J];计算机工程与应用;2004年24期
9 高丽丽;刘弘;李同喜;;基于模式学习的文化遗传算法研究[J];计算机工程与应用;2007年22期
10 王丽娟;关守义;王晓龙;王熙照;;基于属性权重的Fuzzy C Mean算法[J];计算机学报;2006年10期
中国硕士学位论文全文数据库 前2条
1 宁绍芬;基于FCM聚类的算法改进[D];中国海洋大学;2007年
2 付艳秋;数据挖掘中模糊聚类与聚类集成研究[D];西南交通大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
2 黄初龙;邓伟;卢晓宁;;区域农业水资源可持续利用模糊综合评价[J];安徽农业科学;2009年05期
3 郗伟东;石玉月;田巍;;基于风险模式提取的农户生猪饲养规制研究[J];安徽农业科学;2009年07期
4 吉奇;;利用模糊数学方法预测秋白菜适宜收获期[J];安徽农业科学;2010年18期
5 董玮;陈桂芬;;精准农业中管理区划分方法研究[J];安徽农业科学;2011年17期
6 李爱新;;基于产能核算的鄱阳湖生态经济区耕地整理区划[J];安徽农业科学;2012年16期
7 翟剑锋;;基于遗传算法的模糊聚类在考试成绩分析中的应用[J];信息安全与技术;2012年04期
8 黄焕宗;;灰色模糊聚类分析在经济适用房评价中的应用——以泉州市为例[J];安庆师范学院学报(自然科学版);2011年01期
9 张志红;;基于随机初始中心的FCM算法及其应用[J];安徽水利水电职业技术学院学报;2008年01期
10 胡韬;胡伟文;;基于置信区间的信号仿真决策分析模型[J];兵工自动化;2010年08期
中国重要会议论文全文数据库 前10条
1 赵建玉;贾磊;陈月辉;张勇;;基于粒子群优化的信号交叉口交通流预测模型[A];第二十六届中国控制会议论文集[C];2007年
2 陈宁;;基于模糊C均值聚类的路段平均行程时间估计方法[A];第二十九届中国控制会议论文集[C];2010年
3 王海荣;;石油化工企业的静电火灾隐患评估[A];节能环保 和谐发展——2007中国科协年会论文集(四)[C];2007年
4 ;Data Mining Based on Fuzzy C-Means Algorithm[A];Proceedings of the Second Conference on Fuzzy Information & Engineering[C];2005年
5 陈力超;;国际港澳台长途话务的智能化监控[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
6 顾峥;康晓文;孙熙杉;吴朝霞;王石;刘亚强;金永杰;;基于模糊聚类的MicroPET前端探测器晶体像素单元识别方法[A];第十四届全国核电子学与核探测技术学术年会论文集(2)[C];2008年
7 周尚明;贾利民;张锡第;;一种应用于复杂工业生产建模的图象信息获取和处理方法[A];1997中国控制与决策学术年会论文集[C];1997年
8 王坚强;;信息不完全确定的大群体多准则语言决策方法[A];2009中国控制与决策会议论文集(2)[C];2009年
9 赵爽;李晓奇;沙秀艳;;特征加权模糊C均值聚类算法在划分劳动报酬中的应用[A];第三届中国智能计算大会论文集[C];2009年
10 龚毅;何琳华;;企业技术扫描模式聚类分析[A];第十一届中国青年信息与管理学者大会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
2 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
3 王亚萍;需求驱动的个性化产品配置设计方法研究[D];哈尔滨理工大学;2010年
4 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
5 韩晓明;基于符号有向图和支持向量机的故障诊断方法的研究[D];太原理工大学;2011年
6 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
7 柴岳;铁路多元经营系统物流节点布局规划理论与方法和业务发展模式研究[D];北京交通大学;2011年
8 杨婷婷;基于数据的电站节能优化控制研究[D];华北电力大学(北京);2010年
9 张亚刚;基于广域信息的电力系统故障元件定位方法研究[D];华北电力大学(北京);2011年
10 冯玉良;聚合物驱动态预测及其评价研究[D];南京理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
2 李光远;基于在线聚类和最小二乘支持向量机的模糊建模方法研究[D];郑州大学;2010年
3 雷聪聪;一种基于数据聚类的信息粒化方法[D];郑州大学;2010年
4 王林吉;基于CIELAB均匀颜色空间和聚类算法的混纺测色研究[D];浙江理工大学;2010年
5 王文姝;基于模糊理论的关键词识别算法研究[D];哈尔滨工程大学;2010年
6 王颖芳;基于特定内容的敏感图像过滤技术的研究[D];哈尔滨工程大学;2010年
7 沈力华;基于智能优化算法的案例推理方法研究[D];大连理工大学;2010年
8 靳小川;模糊聚类算法在大学生心理健康分析中的应用研究[D];辽宁工程技术大学;2010年
9 杨芳;CBD停车行为模式与引导系统优化研究与实践[D];长沙理工大学;2010年
10 贺丽;基于改进ART2网络的变压器故障诊断方法[D];长沙理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 方健;李自品;彭辉;戴思初;吴晓文;;基于主成分分析法的BP神经网络的应用[J];变压器;2011年01期
2 彭英;;数据挖掘综述[J];德宏师范高等专科学校学报;2009年01期
3 张新波;两阶段模糊C-均值聚类算法[J];电路与系统学报;2005年02期
4 孙胜耀;聂利颖;;基于数据挖掘的高校学生信息海量数据处理[J];电脑知识与技术;2011年24期
5 付忠广;王丽平;戈志华;靳涛;张光;;采用主成分分析法综合评价电站机组的运行状态[J];动力工程;2008年04期
6 陈沛帅;琚春华;;基于密度与动态阈值的任意形状聚类挖掘算法研究[J];电信科学;2012年01期
7 高新波,李洁,姬红兵;基于加权模糊c均值聚类与统计检验指导的多阈值图像自动分割算法[J];电子学报;2004年04期
8 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
9 李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期
10 徐雪源;锅炉排烟温度分析[J];锅炉技术;1999年03期
中国博士学位论文全文数据库 前4条
1 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
2 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
3 杨婷婷;基于数据的电站节能优化控制研究[D];华北电力大学(北京);2010年
4 周斌;基于BP神经网络的内燃机排放性能建模与应用研究[D];西南交通大学;2004年
中国硕士学位论文全文数据库 前10条
1 王月;改进的模糊C-均值算法在文本聚类中的应用研究[D];辽宁工程技术大学;2009年
2 孔小江;基于特征权重的FCM算法研究及应用[D];武汉工业学院;2010年
3 王慧;C-均值聚类算法的改进研究[D];河南大学;2011年
4 李鑫;改进的模糊C均值聚类与连续属性离散化算法研究[D];太原科技大学;2011年
5 郝庆福;火电厂锅炉燃烧优化方法分析与研究[D];华北电力大学;2011年
6 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
7 金妮;基于数据仓库和OLAP技术的聚类挖掘系统的设计与实现[D];大连理工大学;2005年
8 严骏;模糊聚类算法应用研究[D];浙江大学;2006年
9 高大明;大型电站锅炉燃烧系统优化控制研究[D];华北电力大学(河北);2006年
10 吴文;长三角遥感水质分类技术研究[D];南京理工大学;2006年
【二级引证文献】
中国期刊全文数据库 前2条
1 陈嵩;张钢;;基于模糊聚类的海水水质监测技术研究[J];海洋通报;2013年05期
2 谢福鼎;张欢;;基于FCM算法的辽宁省降水量空间分布研究[J];徐州工程学院学报(自然科学版);2013年02期
【二级参考文献】
中国期刊全文数据库 前10条
1 吴萍;宋瀚涛;牛振东;张利萍;张聚礼;;基于SS/OSF实现高维稀疏数据对象的聚类[J];北京理工大学学报;2006年03期
2 王丽娜,费如纯,董晓梅,于戈;基于范数的多维数据模糊聚类方法[J];东北大学学报;2003年05期
3 行小帅,焦李成;数据挖掘的聚类方法[J];电路与系统学报;2003年01期
4 高新波,裴继红,谢维信;模糊c-均值聚类算法中加权指数m的研究[J];电子学报;2000年04期
5 魏立梅,谢维信;对手抑制式模糊C-均值算法[J];电子学报;2000年07期
6 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
7 于剑,程乾生;关于FCM算法中的权重指数m的一点注记[J];电子学报;2003年03期
8 李洁,高新波,焦李成;一种基于CSA的混和属性特征大数据集聚类算法[J];电子学报;2004年03期
9 李洁,高新波,焦李成;基于克隆算法的网络结构聚类新算法[J];电子学报;2004年07期
10 周永权,焦李成;高属性维稀疏数据聚类回归逻辑神经网络模型及学习算法[J];电子学报;2004年08期
中国博士学位论文全文数据库 前2条
1 吴涛;核函数的性质、方法及其在障碍检测中的应用[D];中国人民解放军国防科学技术大学;2003年
2 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
中国硕士学位论文全文数据库 前5条
1 江锋;支持向量机在分类及人脸检测应用中的研究[D];南京理工大学;2003年
2 许光;支持向量机在化工过程建模中的应用[D];浙江大学;2004年
3 张志红;基于神经网络模糊聚类的研究[D];安徽大学;2004年
4 张栒;FCM算法初始化方法研究[D];西南大学;2006年
5 陆云;聚类分析数据挖掘方法的研究与应用[D];安徽大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 路忠峰,安天瑜;基于运行模式的负荷状态描述研究[J];自动化技术与应用;2005年03期
2 王丹;吴孟达;;动态阈值粗糙C均值算法[J];计算机科学;2011年03期
3 李洁,高新波,焦李成;一种基于CSA的模糊聚类新算法(英文)[J];复旦学报(自然科学版);2004年05期
4 袁远,季星来,孙之荣,李衍达;Isomap在基因表达谱数据聚类分析中的应用[J];清华大学学报(自然科学版);2004年09期
5 姜代红;张三友;;基于基因表达式编程的K均值自动聚类算法[J];计算机仿真;2010年12期
6 关云鸿;;改进K-均值聚类算法在电信客户分类中的应用[J];计算机仿真;2011年08期
7 郭红艳;谷保平;;改进k均值算法在网络入侵检测中的应用研究[J];计算机安全;2008年05期
8 李金磊;朱晓莲;朱海燕;;一种基于投票策略的聚类融合算法[J];计算机仿真;2008年03期
9 陈森平;陈启买;;基于熵的K均值算法的改进[J];广东技术师范学院学报;2008年09期
10 李洁,高新波,焦李成;一种基于CSA的模糊聚类新算法[J];电子与信息学报;2005年02期
中国重要会议论文全文数据库 前10条
1 韩敏;范剑超;;基于半监督改进模糊C均值算法的遥感聚类研究[A];第二十七届中国控制会议论文集[C];2008年
2 杨保峰;沈越泓;;模拟信源标量量化的模糊c-均值算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
3 颜祥;俞一彪;戴志强;袁冬梅;;基于均值算法的男女声与情感的同步变换[A];2006’和谐开发中国西部声学学术交流会论文集[C];2006年
4 张新兵;王家林;陈冰;;一种基于改进K-均值算法的重磁局部异常圈定方法[A];中国地球物理学会第22届年会论文集[C];2006年
5 赵飞;周唯杰;;基于模拟退火K均值算法的民航发动机性能状态评估研究[A];中国航空学会第七届动力年会论文摘要集[C];2010年
6 严新革;张淳民;;ISODATA和模糊K均值算法在图像分割中的应用[A];大珩先生九十华诞文集暨中国光学学会2004年学术大会论文集[C];2004年
7 杨勋;王江晴;;求解聚类问题的混合PSO算法设计[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
8 方亮;唐劲松;;一种新的SAS图像自适应滤波算法[A];2007年全国水声学学术会议论文集[C];2007年
9 王家耀;张雪萍;;基于遗传算法和K-均值算法相结合的空间聚类分析[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 孙长银;李林峰;;基于模糊聚类方法的T-S模糊系统[A];2006中国控制与决策学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 李艳灵;基于聚类的图像分割算法研究[D];华中科技大学;2009年
2 刘路;基于改进支持向量机和纹理图像分析的旋转机械故障诊断[D];天津大学;2011年
3 田明浩;星载GPS相关干扰技术研究[D];南京理工大学;2008年
4 余学飞;基于模糊理论的医学图像分割算法研究[D];南方医科大学;2009年
5 谢耀华;海量影像存储与管理关键技术研究[D];国防科学技术大学;2009年
6 金健;委员会机器模型及其应用[D];华东师范大学;2008年
7 耿新青;基于模糊逻辑和神经网络的数据及文本挖掘的方法研究[D];天津大学;2005年
8 姜义;网络敏感的对等网络覆盖网的若干关键技术研究[D];上海交通大学;2007年
9 张长胜;求解规划、聚类和调度问题的混合粒子群算法研究[D];吉林大学;2009年
10 于昕;基于数据挖掘的供应商关系管理方法研究[D];北京科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 杜雷;一种改进的模糊C均值算法[D];华南理工大学;2013年
2 荣巧梅;基于信息熵蚁群聚类的模糊C-均值算法的研究[D];青岛理工大学;2010年
3 甄晓敏;改进K均值算法在数据挖掘中的研究应用[D];河北工业大学;2011年
4 上衍猛;基于模糊C均值算法在文本聚类中的研究与实现[D];东华大学;2013年
5 杨华;直觉模糊C-均值聚类算法的研究及应用[D];海南师范大学;2013年
6 李梅;改进的K均值算法在中文文本聚类中的研究[D];安徽大学;2010年
7 谷智明;基于模糊C均值算法的PS版瑕疵分类[D];长春理工大学;2012年
8 厉于行;聚类分析中基于投影的κ均值算法[D];浙江大学;2012年
9 朱建宇;K均值算法研究及其应用[D];大连理工大学;2013年
10 殷君伟;K-均值聚类算法改进及在服装生产的应用研究[D];苏州大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026