收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于模糊理论的EM算法在聚类分析的应用研究

冯雪冰  
【摘要】:聚类分析是数据挖掘、机器学习等领域的重要内容,各种聚类算法五花八门,各有利弊。如何让聚类算法适应复杂的应用场景,让聚类结果更加正确、稳定都显得至关重要,除了根据实际问题选择合适的聚类算法之外,还需要对算法进行适当改进,扬长避短。另一方面,随着评价与决策方法越来越科学化,在很多实际问题的原始数据中都存在着以自然语言为主的评价性语言数据,这种无法被计算机和传统算法处理的数据给聚类的实施带来了困难。本文对较为常见的有限多分量多维度高斯混合概率分布模型进行研究,选择对该模型有着较好处理能力、简单稳定的EM聚类算法作为核心,分析EM算法的思想和本质,针对实际应用中样本可能会大量存在异常数据的情况,结合模糊数学理论改进EM算法,使算法能够更好地剔除样本中的异常数据,提高聚类精确性,还可以通过阈值参数来控制对异常数据的敏感程度,提高算法的实用性。针对原始数据中存在评价性自然语言的情况,本文根据模糊理论,采用三角模糊数对评价语言进行模糊处理,通过介绍三角模糊数的模糊化方法,在保留原始评价数据语义特性的同时,将其转换为模糊数据,引入可用模糊数学研究的范畴,最后通过一种去模糊化的方法,将模糊数据转换为非模糊的精确数值,从而能够通过改进后的EM算法进行聚类,给人们在实际问题中的决策提供帮助。本文依据由模糊理论改进的EM算法编写算法程序,分别采用三个实例验证算法剔除异常数据的能力、处理精确数据和模糊数据的能力。对模型采用相同的参数初始化方法,对存在异常数据的实例,通过将模糊EM算法与单纯EM算法的结果作对比,发现模糊EM算法对样本中异常数据的分辨能力更好,异常数据对改进算法的影响得到削弱;对存在评价语言数据的实例,采用相同的三角模糊数模糊化方法,将模糊EM算法与模糊聚类方法的结果作对比,发现模糊EM算法聚类结果正确,证明了其拥有对模糊数据的处理能力。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李斌,郭剑毅;聚类分析在客户关系管理中的研究与应用[J];计算机工程与设计;2005年02期
2 张宏翔;李星;;基于聚类分析的学生学习相关性研究[J];计算机光盘软件与应用;2013年11期
3 蔡建国;;排序聚类分析在成组技术中的应用[J];机械工艺师;1985年01期
4 董玉祥;排序聚类分析计算程序[J];成组生产系统;1986年01期
5 A·Gongaware,Inyong Ham,焦虹;用于成组制造系统的聚类分析法[J];成组生产系统;1986年02期
6 史逸芬,蔡建国;排序聚类分析法在相似零件成组中的应用[J];成组生产系统;1986年03期
7 徐大威,王鸿歌;聚类分析应用程序系统[J];冶金自动化;1988年01期
8 张春早;会议评判与聚类分析[J];机械工程;1988年02期
9 吴国安;聚类分析在鸟的分类中的应用[J];黑龙江大学自然科学学报;1989年04期
10 卢泽生;;零件分类成组的聚类分析法[J];机械工程师;1990年04期
11 高伟平;;聚类分析在化学中的应用及在可编程序计算器上的实现[J];化学工程师;1990年06期
12 陈庚,魏学环,王玉红,金璋瑞;试用聚类分析对船只噪声和脑电分类[J];声学学报;1991年04期
13 陈艾荷;;一种基于非线性映射的聚类分析[J];武测科技;1992年03期
14 田盛丰;;聚类分析方法[J];计算机研究与发展;1992年03期
15 陈琦,陈雯卿;浙江省市县服务业发展的聚类分析[J];杭州电子科技大学学报;2005年05期
16 陈斌;徐学荣;;福建省各县市区人口结构聚类分析[J];农业网络信息;2006年04期
17 陈光宇;胡丽英;苏勇;;聚类分析在电信行业客户关系管理中的应用[J];微计算机信息;2006年33期
18 苏厚勤;非等长符号串的聚类分析法[J];计算机应用与软件;1984年04期
19 廖建华;崔君兆;张玲;;一种新的聚类分析[J];中国卫生统计;1987年03期
20 王成恩,隋铁亮,史海波;制造系统中的聚类分析方法[J];信息与控制;1993年02期
中国重要会议论文全文数据库 前10条
1 梅翠;;我国各地区居民收入差距及其对消费的制约[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 李均立;傅国华;;海南各县(市)经济实力的聚类分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 刘黄金;曹林峰;;南京服务业发展的聚类分析[A];江苏省现场统计研究会第十次学术年会论文集[C];2006年
4 肖静;杨泽峰;徐辰武;;微阵列表达谱监督聚类分析方法的比较研究[A];江苏省遗传学会第七届代表大会暨学术研讨会论文摘要汇编[C];2006年
5 路爱峰;崔玉杰;;沪市电力上市公司经营业绩的聚类分析[A];中国数学力学物理学高新技术交叉研究学会第十二届学术年会论文集[C];2008年
6 陈国华;廖小莲;夏君;;证券投资分析的聚类分析方法[A];中国企业运筹学[2011(1)][C];2011年
7 张红卫;隗金水;;聚类分析评价与测量效度关系探讨[A];第九届全国体育科学大会论文摘要汇编(4)[C];2011年
8 牛东晓;乞建勋;;网络资源平衡问题的聚类分析优化遗传算法研究[A];2001年中国管理科学学术会议论文集[C];2001年
9 詹原瑞;彭书杰;李如一;;基于聚类分析的企业信用等级评价方法[A];西部开发与系统工程——中国系统工程学会第12届年会论文集[C];2002年
10 邹晓玫;修春波;;基于聚类分析的犯罪率相关因素的研究[A];当代法学论坛(二○一○年第3辑)[C];2010年
中国博士学位论文全文数据库 前4条
1 张建萍;基于计算智能技术的聚类分析研究与应用[D];山东师范大学;2014年
2 李成安;分布式环境下聚类分析新方法的研究[D];浙江大学;2006年
3 杨旭杰;基于统计方法模型分析的中药复方专利保护研究[D];北京中医药大学;2012年
4 李宝玲;王裕颐教授学术思想与临床经验总结及治疗眩晕证治规律研究[D];北京中医药大学;2012年
中国硕士学位论文全文数据库 前10条
1 李元俊;大学生就业能力培养与社会需求的匹配性研究[D];山东建筑大学;2015年
2 冯雪冰;基于模糊理论的EM算法在聚类分析的应用研究[D];中国地质大学(北京);2015年
3 黄银;行业地区发展水平的聚类分析[D];苏州大学;2015年
4 郭俊峰;聚类分析下的股票投资价值挖掘研究[D];大连海事大学;2015年
5 张旭;考虑风电接入不确定性的节点特性建模研究[D];山东大学;2015年
6 褚旭;我国各省市CDM项目聚类分析及影响因素研究[D];首都经济贸易大学;2015年
7 刘鑫琳;VAGUE集理论及其在聚类分析中的应用[D];广西大学;2015年
8 冯文锴;聚类分析在古生物学和矿物学中的应用[D];兰州大学;2009年
9 冯伟;聚类分析在金融数据分析中的应用研究[D];辽宁师范大学;2009年
10 邹家兴;基于混合多指标信息的聚类分析[D];东北大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978