收藏本站
《大连理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于核函数的聚类分析研究

李晓利  
【摘要】:数据挖掘是信息管理领域中一个重要的研究课题,数据挖掘技术已经广泛地应用到很多行业中。聚类分析是数据挖掘中的核心技术之一,目前聚类算法中应用最广泛的k-means算法虽然简明、实用,但它没有对样本特征进行优化,其有效性很大程度上取决于数据点的分布情况,当样本边界为线性不可分或者样本分布为非高斯分布时,聚类效果较差,无法达到高精确度的聚类要求;而核函数的引入增加了对样本特征的优化,通过将样本点从输入空间映射到高维特征空间,将非线性学习问题转化为线性学习问题,从而实现了更为准确的聚类。而目前核聚类算法中的硬划分方法缺乏健壮性,模糊聚类方法又存在需要人为定义模糊参数等不足,因此有待于进一步改进。 本文借助于近似极大值函数的凝聚函数,提出一个既为软聚类格式,又无须选择模糊参数的核k-凝聚聚类算法;并且针对现实中存在大量的分类属性和混合属性数据而k-prototype和模糊k-prototype算法在处理分类型属性和混合属性上的不足,本文又将类属性分解的方法与核凝聚聚类算法相结合,将算法推广到类属性与混合属性,使算法更具有通用性。 本文首先对聚类和核方法的背景知识以及核函数相关理论进行阐述,在说明现有算法不足基础上分别提出了适用于数值属性以及分类和混合属性的核k-凝聚聚类算法,并通过Matlab编程进行数值实验,证明了该算法在聚类的准确性、稳定性、健壮性等方面取得了一定的改进。最后将该算法应用到某生发保健品连锁店客户细分的管理实践中,为他们针对不同细分市场采取不同营销策略提供了指导和依据。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.13

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 李小雷;王雷;;基于各向异性质心Voronoi图的网络异常检测技术[J];计算机应用;2011年09期
2 贾波;邹园萍;;基于无监督学习的P2P流量识别[J];杭州电子科技大学学报;2011年04期
3 刘亚楠;;网络信息检索在统计中的应用[J];现代营销(学苑版);2011年08期
4 陈雅;谭华军;郑建明;;图书馆个性化服务中的Web日志分析技术研究[J];图书馆杂志;2011年07期
5 张韬;胡旻;;互联网Web数据挖掘模型设计与技术实现[J];卫星与网络;2010年10期
6 王艳;;数据隐私保护技术综述[J];知识经济;2011年14期
7 杜垒;王飞;;数据挖掘在学生管理中的应用[J];科技信息;2011年18期
8 胡锟;杨路明;;浅谈移动CRM客户价值细分[J];电脑知识与技术;2011年13期
9 李想;;PLE编码在关联数据挖掘中的应用[J];电脑知识与技术;2011年15期
10 张博;张超伟;;中药方剂数据挖掘中的数据预处理研究[J];电脑知识与技术;2011年17期
中国重要会议论文全文数据库 前10条
1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
2 朱强生;田英;周延泉;何华灿;;银行业中的客户数据挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
3 刘建华;;一个智能搜索引擎的用户行为聚类分析[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 于波;王宏鼎;唐世渭;童云海;;基于数据挖掘的数据质量分析研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
6 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
7 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
8 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
9 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
10 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
中国重要报纸全文数据库 前10条
1 赵纪元;数据挖掘在CRM中的应用[N];人民邮电;2001年
2 赵骏飞;数据挖掘在金融行业的应用[N];中国保险报;2011年
3 创智集团副总裁 胡乐群博士;数据挖掘在CRM中的应用[N];中国计算机报;2002年
4 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
5 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
6 刘光强;靠数据挖掘抓住客户的心[N];中国计算机报;2009年
7 本报记者 郭白岩;大众点评网向数据挖掘要收益[N];中国经营报;2011年
8 本报记者 黎宇文;博时基金王德英: 数据挖掘促进基金精细化管理[N];中国证券报;2011年
9 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
10 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
2 贺琳;基于数据挖掘的道路运行安全风险分析[D];大连海事大学;2012年
3 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
4 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
5 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
6 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
7 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 闫伟;基于数据挖掘的复杂产品关键质量特性识别的方法研究[D];天津大学;2012年
10 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;2006年
2 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
3 易珺;基于数据挖掘的酒店CRM客户获取的研究[D];广东工业大学;2005年
4 鲍洪庆;一种基于密度的动态参数单元聚类算法[D];山东大学;2005年
5 李晓利;基于核函数的聚类分析研究[D];大连理工大学;2006年
6 王刚;基于混合智能系统的数据挖掘分类算法研究[D];中南大学;2004年
7 杨毅;数据挖掘在区域经济分析中的应用模型研究[D];武汉大学;2004年
8 张大治;飞机典型装配工艺挖掘技术研究[D];西北工业大学;2006年
9 谢润;概念格建格算法研究[D];西南交通大学;2006年
10 颜镝;时间序列数据挖掘的研究以及在交通流预测上的应用[D];北京工业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026