收藏本站
《昆明理工大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多核函数FCM算法在数据挖掘聚类中的应用研究

焦亚召  
【摘要】:数据挖掘技术作为数据间隐含信息提取、复杂关系发现及潜在价值评估的重要工具,近年来已经成为人工智能和数据库等领域研究的热点问题。通过数据挖掘提取和发现对人们有用的、对商业决策和未来规划发展具有支撑能力和指导作用的知识和规则。聚类算法作为通过将集中的数据人为的划成若干类从而揭示数据间的真实分布的一种统计学方法及数据挖掘数据预处理阶段的重要步骤,对于人们处理数据起着重要的作用。而模糊聚类分析作为使用数学方法研究数据分类的一种方法,近年来在数据挖掘领域得到了迅猛的发展,并在模式识别、决策分析、数据分类方面获得了广泛的应用。本文对应用最为广泛、最为灵敏的算法之一的模糊C均值算法(FCM)及基于核函数FCM算法(KFCM)进行了研究分析,针对KFCM算法在网络大数据挖掘中聚类密度、大小不均衡数据集上的缺陷,对其改进算法-MKFCM算法进行了详细介绍,并将其用于实际聚类分析中。针对KFCM算法使用单一固定高斯核函数对簇间变化不敏感,不能将密度、大小不均衡的几类簇分开的不足,MKFCM算法使用了更加灵活、适用的方法,在完全无监督的方式下,将一组被分配不同分辨率权重的核函数组合构成新的核函数代替单一核函数并通过核函数间的凸关系将数据点映射到高维特征空间,再利用核函数技术实现低维空间计算。重新组合的高斯核函数可以覆盖所有数据的频谱且不同的分辨率权重又可以反映出不同簇的分布,从而可以将密度、大小不均衡的几类簇很好的分开,具有明显的优势和可靠性。仿真结果表明,相对于使用单一核函数、平均核函数的KFCM算法不能将密度、大小不均衡的簇分开,使用由被分配不同分辨率权重的核函数构成的新核函数的MKFCM算法可以将其很好分开,而不会出现簇间重叠、交叉的现象,具有更好的聚类效果和聚类精度;将MKFCM算法应用到大学校园套餐定制中,为套餐变更提供理论支撑,仿真结果表明MKFCM算法可以将密度、大小差异很大的使用流量、短信数目及语音通话的三类簇很好的分开,从而与上季度指标对比分析出套餐侧重,为新套餐制定提供决策支持,从而证明了MKFCM算法在网络大数据挖掘实际应用中的的有效性和适用性,在决策支持及未来规划上的重要指导作用,在大数据时代数据挖掘领域有很好的发展前景。
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前5条
1 刘蕊洁;张金波;刘锐;;模糊c均值聚类算法[J];重庆工学院学报(自然科学版);2008年02期
2 陈娜;;数据挖掘技术的研究现状及发展方向[J];电脑与信息技术;2006年01期
3 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期
4 石云平;;聚类K-means算法的应用研究[J];国外电子测量技术;2009年08期
5 谢邦昌;李扬;;数据挖掘与商业智能的现况及未来发展[J];统计与信息论坛;2008年05期
【共引文献】
中国期刊全文数据库 前10条
1 王小妮;高学东;倪晓明;;基于云计算的分布式数据挖掘平台架构[J];北京信息科技大学学报(自然科学版);2011年05期
2 李扬;谢邦昌;彭茜茜;;统计学习的过去、现在和将来[J];数据;2009年07期
3 王崛;刘文杰;;小波聚类在多目标定位中的应用[J];四川兵工学报;2012年07期
4 徐克圣;王澜;;一种自动获得k值的聚类算法[J];大连交通大学学报;2007年04期
5 范瑛;;基于SQL Server 2005的企业商业智能模型研究[J];电脑编程技巧与维护;2012年12期
6 陈东;皮德常;;基于属性加权的改进K-Means算法[J];电脑知识与技术;2009年09期
7 黄志根;陈健;王珊;;一种基于包长和时间间隔的网络流量分类方法[J];电子测量技术;2011年11期
8 陈宇;;聚类算法研究[J];福建电脑;2007年07期
9 周妍;孔晓玲;张然;;数据挖掘中聚类算法研究[J];福建电脑;2007年08期
10 王真虎;;商业智能设计中的关键技术[J];硅谷;2011年19期
中国重要会议论文全文数据库 前3条
1 孙浩军;孔令俊;刘志辉;;利用高斯分布生成数据对聚类算法的比较[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
2 郝芸;田野;康辉;;分布式聚类算法的研究[A];第九届中国通信学会学术年会论文集[C];2012年
3 Donghua Yu;Shuangshuang Sun;Yan Shen;Wenlu Zhou;;The Application and Analysis of Data Mining in Clustering Data of Petroleum Pipeline[A];2012年计算机应用与系统建模国际会议论文集[C];2012年
中国博士学位论文全文数据库 前10条
1 侯新文;环胶州湾地区城市地质及工程建设适宜性研究[D];中国矿业大学(北京);2011年
2 王晓路;煤矿瓦斯监测数据发展趋势的智能预测方法研究[D];西安科技大学;2011年
3 李丹;属性加权及不完备数据的模糊聚类方法研究[D];大连理工大学;2011年
4 孙佳龙;近海雷达卫星测高数据质量改善及在南海海潮模型中的应用研究[D];山东科技大学;2011年
5 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
6 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
7 刘冀;径流分类组合预报方法及其应用研究[D];大连理工大学;2008年
8 段群杰;水下机器人实时路径规划方法研究[D];哈尔滨工程大学;2007年
9 胡宇舟;基于客户市场细分的电信服务产品设计及优惠规则研究[D];天津大学;2007年
10 李东方;Web 2.0环境下互联网信息过滤理论与方法研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 陈凤萍;寿光人才求职招聘网站中资源检索算法的研究[D];中国海洋大学;2010年
2 王静;基于关联规则的利润加权数据挖掘算法研究及在商业智能中的应用[D];中国海洋大学;2010年
3 况莉莉;关联规则在高校图书馆读者数据处理中的应用研究[D];合肥工业大学;2010年
4 邵帅;基于数据场的聚类可视化算法研究与应用[D];西北民族大学;2010年
5 张圆圆;数据挖掘技术在高校图书管理中的应用[D];电子科技大学;2010年
6 刘琨;遗传算法在数据挖掘聚类分析中的应用研究[D];中南林业科技大学;2008年
7 赵圣江;基于虚拟仪器的低压电力载波通信检测研究[D];浙江大学;2011年
8 鄂佳;数据挖掘技术在公安情报分析中的应用研究[D];沈阳大学;2010年
9 韩宏博;基于遗传算法的关联规则数据挖掘技术研究[D];西安电子科技大学;2010年
10 朱燕玲;崇明东滩海岸带生态系统管理平台的设计与开发[D];华东师范大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 李碧,雍正正;一种改进的基于遗传算法的聚类分析方法[J];电路与系统学报;2002年03期
2 宋爱国,陆佶人;基于进化规划的Kohonen网络用于被动声呐目标聚类研究[J];电子学报;1998年07期
3 高新波,裴继红,谢维信;模糊c-均值聚类算法中加权指数m的研究[J];电子学报;2000年04期
4 刘静,钟伟才,刘芳,焦李成;免疫进化聚类算法[J];电子学报;2001年S1期
5 张艳宁,赵荣椿,梁怡;一种有效的大规模数据的分类方法[J];电子学报;2002年10期
6 刘晓东,刘大有;数据挖掘专利综述[J];电子学报;2003年S1期
7 刘健庄,谢维信,黄建军,李文化;聚类分析的遗传算法方法[J];电子学报;1995年11期
8 高新波,裴继红,谢维信;基于统计检验指导的聚类分析方法[J];电子科学学刊;2000年01期
9 魏立梅,谢维信;聚类分析中竞争学习的一种新算法[J];电子科学学刊;2000年01期
10 沈越泓,益晓新,徐发强,李兴国;模糊聚类和模糊模式识别技术在通信设备抗干扰性能评估系统中的应用[J];电子科学学刊;2000年02期
中国硕士学位论文全文数据库 前2条
1 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
2 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 李业丽,常桂然,徐茜;神经网络在数据挖掘中的应用研究[J];计算机工程与应用;2000年08期
2 陈国萍,李巍,刘仲英;数据挖掘中概念树的标准、生成和实现[J];计算机工程;2000年12期
3 朱天翔,李力;相关案件的数据挖掘[J];计算机应用研究;2000年03期
4 赵丹群;数据挖掘:原理、方法及其应用[J];现代图书情报技术;2000年06期
5 余英泽,廖里,吴渝;一种新型数据分析技术——数据挖掘[J];计算机与现代化;2000年01期
6 邵华 ,万家华 ,金翔义;数据挖掘在证券行业中的应用[J];软件工程师;2000年11期
7 王宏;数据挖掘在网络营销中的应用[J];计算机应用与软件;2000年06期
8 何东峰;数据挖掘要适当[J];互联网周刊;2000年Z1期
9 康松林,费洪晓;数据挖掘的软分类方法[J];长沙铁道学院学报;2001年03期
10 邢平平,施鹏飞,赵奕;基于本体论的数据挖掘方法[J];计算机工程;2001年05期
中国重要会议论文全文数据库 前10条
1 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 李久丹;陈剑;覃涛;;数据挖掘技术理论研究[A];广西计算机学会2010年学术年会论文集[C];2010年
3 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
5 毛定祥;;数据挖掘与实证经济学[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
6 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
7 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
8 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
9 孙明;康红梅;莫一;;数据挖掘在科技奖励管理系统专家库中的应用[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
10 邵红全;杨菊梅;潘建雄;;数据挖掘的策略与实现技术[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
2 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
3 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
4 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
5 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
6 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
7 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
8 齐国涛;微软开始数据挖掘[N];中国计算机报;2003年
9 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
10 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
2 巩建光;面向电信领域的数据挖掘关键技术研究[D];哈尔滨工程大学;2012年
3 李建强;基于数据挖掘的电站运行优化理论研究与应用[D];华北电力大学(河北);2006年
4 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年
5 李国旗;本体辅助的先验知识融入生物信息数据挖掘的方法研究[D];上海交通大学;2007年
6 翟坤;基于数据挖掘的成本管理方法研究[D];大连理工大学;2012年
7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
8 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
9 朱廷劭;数据挖掘及其在汉语文语转换中应用的研究[D];中国科学院研究生院(计算技术研究所);1999年
10 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 杨毅超;基于Web数据挖掘的作物商务平台分析与研究[D];湖南农业大学;2008年
2 徐进华;基于灰色系统理论的数据挖掘及其模型研究[D];北京交通大学;2009年
3 俞驰;基于网络数据挖掘的客户获取系统研究[D];西安电子科技大学;2009年
4 冯军;数据挖掘在自动外呼系统中的应用[D];北京邮电大学;2009年
5 于宝华;基于数据挖掘的高考数据分析[D];天津大学;2009年
6 王仁彦;数据挖掘与网站运营管理[D];华东师范大学;2010年
7 彭智军;数据挖掘的若干新方法及其在我国证券市场中应用[D];重庆大学;2005年
8 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
9 贾治国;数据挖掘在高考填报志愿上的应用[D];内蒙古大学;2005年
10 马飞;基于数据挖掘的航运市场预测系统设计及研究[D];大连海事大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026