收藏本站
《华南理工大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

基于万有引力的模糊聚类方法研究

王世纬  
【摘要】:当今是个大数据的时代,如何从这些大数据中发现新的知识是一个迫切的任务,数据挖掘技术因此渐渐兴起并成为时代的主流技术。聚类分析是数据挖掘技术的一个重要领域,聚类算法属于无监督的学习,事先没有任何的先验知识。它的目的是把目标数据集划分到若干个类中,使得同一类内的数据对象的相似度尽可能的高,而不同类的数据对象的差异性尽可能的高。聚类分析已经比较成熟,在数据挖掘、图像分析和模式识别等领域都有很广泛的应用。本文首先对聚类算法的基础理论做了介绍,对传统的聚类算法做了研究总结。本文主要研究模糊C均值算法(FCM),FCM是聚类算法中最为基础的算法,它有着完善的理论和数学基础,虽然FCM算法已经相当的优秀,但也有一些缺点,本文针对FCM算法这些缺点进行了改进,提出了一种基于万有引力的模糊聚类算法GFCM。FCM算法对初始化比较的敏感,首先FCM算法的初始聚类中心是随机选择的,这些初始聚类中心跟最后收敛时的中心差距太大,使得聚类速度较慢,本文提出一种基于引力和最大最小距离的初始聚类中心选择方法,有效的减少了迭代次数,加快了聚类速度;FCM算法需要用户自己确定最佳聚类数目,这需要用户有足够的经验,本文提出一种聚类有效性指标能够自动确定最佳聚类数目,这种有效性指标仿照Xie-Beni指数,将距离度量标准修改为引力度量标准,能有效的确定最佳聚类数目;FCM算法的目标函数是基于距离的,本文基于第一宇宙速度来对目标函数作了修正,第一宇宙速度反映了数据脱离中心所需的速度,速度越大越难脱离,与聚类的隶属度非常相似,体现了聚类自发天然的聚散关系;最后通过实验验证了本文提出的GFCM算法能有效的减少迭代次数并且能够确定最佳聚类数目,说明GFCM算法是有效可行的。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前4条
1 于勇前;赵相国;陈衡岳;王国仁;;基于引力概念的聚类质量评估算法[J];东北大学学报(自然科学版);2007年08期
2 裴继红,范九伦,谢维信;聚类中心的初始化方法[J];电子科学学刊;1999年03期
3 张天伍;李卫平;;一种基于密度的引力聚类算法[J];河南科学;2008年11期
4 蒋盛益,李庆华;一种基于引力的聚类方法[J];计算机应用;2005年02期
【共引文献】
中国期刊全文数据库 前10条
1 冉志红;李乔;单德山;唐亮;;影响矩阵法在南京长江三桥状态识别中的应用[J];四川建筑科学研究;2008年04期
2 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
3 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
4 郇正军;赵国富;;基于土地利用的空间数据挖掘系统的设计与实现[J];安徽农业科学;2011年07期
5 郭有强;胡学钢;;基于项目增长法高效求解最大频繁项集[J];安徽科技学院学报;2006年06期
6 申明金;模湖K均值聚类分析用于染料的分类[J];安庆师范学院学报(自然科学版);2005年02期
7 张友志;钱萌;程玉胜;;基于关联规则web日志挖掘方法的研究[J];安庆师范学院学报(自然科学版);2006年01期
8 薛蕊;;一类线性混合模型中方差分量的估计[J];安庆师范学院学报(自然科学版);2010年02期
9 董明哲;充电电池容量预测的算法研究[J];鞍山师范学院学报;2000年03期
10 李新海;;双反对称矩阵的性质分析与推广[J];白城师范学院学报;2007年06期
中国重要会议论文全文数据库 前10条
1 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
2 魏立新;田学静;王洪瑞;宋阳;;基于改进型模糊聚类的模糊系统辨识方法[A];第二十七届中国控制会议论文集[C];2008年
3 姚智颖;刘冬;;基于Kazakov线性化的迭代滤波[A];第二十九届中国控制会议论文集[C];2010年
4 逄海萍;王璐萍;;一类不确定仿射非线性系统的鲁棒近似最优滑模控制[A];第二十九届中国控制会议论文集[C];2010年
5 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
6 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
7 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
8 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
9 沙志超;彭耿;徐神;黄知涛;;基于信号子空间维数估计的单通道盲信号检测[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
10 吴栋;张京华;王玉成;胡伍生;;前兆信息模型在地震预测中的应用[A];数字测绘与GIS技术应用研讨交流会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 范迪;沉渣厚度超声检测信号处理技术研究及应用[D];山东科技大学;2010年
2 殷复莲;同步CDMA系统NBI识别及抑制技术研究[D];哈尔滨工程大学;2010年
3 于志明;无线通信系统中的信号识别技术研究[D];哈尔滨工程大学;2010年
4 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
5 李关防;模态域信号处理在水声中的应用[D];哈尔滨工程大学;2009年
6 刘德铸;声学多普勒流速测量关键技术研究[D];哈尔滨工程大学;2010年
7 于蕾;OFDM系统的信道估计技术研究[D];哈尔滨工程大学;2009年
8 郭文卓;多天线多用户通信系统关键技术研究[D];哈尔滨工程大学;2009年
9 王文标;基于视觉测量的快速再制造成形系统关键技术研究[D];大连海事大学;2010年
10 张进;宽带阵列信号波达方向估计算法研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 王文栋;GEP及SVM融合的分类技术研究[D];广西师范学院;2010年
2 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
3 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
4 蒋静;基于子空间的二阶统计量盲信道辨识算法研究[D];郑州大学;2010年
5 赵金平;基于矩阵变换的MIMO-OFDM系统信号检测[D];郑州大学;2010年
6 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年
7 史文财;省级政务网安全检测系统的设计与实现[D];哈尔滨工程大学;2010年
8 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
9 刘维巍;语音信号基音周期检测算法研究[D];哈尔滨工程大学;2010年
10 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前2条
1 蒋盛益,李庆华;一种基于引力的聚类方法[J];计算机应用;2005年02期
2 于勇前;赵相国;王国仁;陈衡岳;;一种基于密度单元的自扩展聚类算法[J];控制与决策;2006年09期
中国博士学位论文全文数据库 前1条
1 裴继红;基于模糊信息处理的图像分割方法研究[D];西安电子科技大学;1998年
【相似文献】
中国期刊全文数据库 前10条
1 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
2 于慧娟;崔军;毋晓志;李伟;;一种改进的凝聚图聚类方法[J];山西煤炭管理干部学院学报;2010年03期
3 于剑,程乾生;模糊聚类方法中的最佳聚类数的搜索范围[J];中国科学E辑:技术科学;2002年02期
4 崔军;郭春艳;贾宗维;;一种连通非加权图的快速聚类方法[J];计算机工程与应用;2008年07期
5 岳清华;郑刚;;一种动态心电图波形聚类策略的研究[J];天津理工大学学报;2008年01期
6 王士同;陈晓峰;曹苏群;钟富礼;;基于力的类同传播聚类方法[J];江南大学学报(自然科学版);2009年04期
7 张逸清;刘文才;;聚类数的确定[J];计算机与数字工程;2007年02期
8 程慈;柴瑞敏;;聚类数的自动确定[J];科技信息(科学教研);2008年14期
9 刘燕驰;;基于密度的最佳聚类数确定方法[J];中国管理信息化;2011年09期
10 朱明;王俊普;;一种聚类学习的新方法[J];模式识别与人工智能;2000年03期
中国重要会议论文全文数据库 前9条
1 高翠芳;吴小俊;;基于二阶差分的聚类数自动确定方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 李浪波;傅彦;刘红;;基于范例推理的网格和密度聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
4 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 程尊平;周鼎;王晨;周皓峰;汪卫;施伯乐;;SDPHC——基于密度的分割和分层的自校聚类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 张晓峰;王丽珍;陆叶;;一种基于属性加权的不确定K-means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 胡仲义;郭超;王永炎;刘胜航;王宏安;;基于时间衰减和特征变量的数据流聚类算法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
中国博士学位论文全文数据库 前10条
1 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年
2 王纵虎;聚类分析优化关键技术研究[D];西安电子科技大学;2012年
3 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
4 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
5 冯永;基于计算智能的聚类技术及其应用研究[D];重庆大学;2006年
6 刘晨;高伸缩性聚类分析方法研究[D];哈尔滨工程大学;2013年
7 王强;局部叠加基因表达模式聚类分析方法研究[D];哈尔滨工业大学;2012年
8 尹学松;半监督聚类分析策略设计及其拓展性研究[D];南京航空航天大学;2009年
9 白亮;聚类学习的理论分析与高效算法研究[D];山西大学;2012年
10 姜磊;混合演化聚类算法研究及其应用[D];武汉大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈奇明;基于投票策略聚类融合算法的研究和实现[D];安徽工业大学;2010年
2 高昇;基于密度聚类算法的改进方法研究[D];大连理工大学;2007年
3 吴书;类属型数据的聚类算法研究[D];厦门大学;2007年
4 谢信喜;符号聚类新方法的研究及应用[D];江南大学;2008年
5 黄海超;基于领域知识的半监督聚类算法研究[D];北京化工大学;2009年
6 朱国红;基于特征点选择的聚类算法研究与应用[D];山东大学;2010年
7 晏寒冰;结构聚类分析方法及应用研究[D];江南大学;2014年
8 张斌;基于模糊核聚类的基因芯片数据的研究[D];燕山大学;2010年
9 盛荣芬;聚类融合算法及其在移动渠道管理中的应用[D];中南大学;2011年
10 何堃;基于聚类的用户特征分析[D];扬州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026