收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘技术及其在超市CRM中的应用

赵锋  
【摘要】:数据挖掘是随着信息技术不断发展而兴起的一门新学科。聚类分析作为数据挖掘领域内最为常见的技术之一,是个非常重要的研究课题。尽管有多种不同的聚类算法,但这些算法还存在一些问题:如算法的效率、初值的选择、最优解的问题等等。因此对聚类算法还需要作进一步的优化、改进研究,以更好的适用于解决工程实际问题。这样不仅有助于算法理论的完善,更有助于算法的推广和应用。本文重点对聚类算法特别是K-means进行了改进,提出了三种重要的改进方法。 本文的主要工作有: 【1】介绍了数据挖掘的定义、基本特征、主要的数据挖掘技术、聚类技术的基本概念以及主要的聚类分析算法;对经典K-means聚类算法进行了较为详细的介绍,分析其主要优缺点,提出了要改进和努力的方向。 【2】使用复合形法对K-means算法进行优化。复合形法是基于最坏点进行迭代的一种有效的随机搜索寻优方法,有着效率高,程序简单,结果稳定的特点。利用Matlab7.0中的数据作为仿真试验数据,结果表明,改进后的算法提高了计算效率和鲁棒性,基本满足工程需要。 【3】根据复合形局部搜索能力强而遗传算法全局搜索能力强的特点,将复合形与遗传算法相结合构成复合形—遗传算法(complex-GA),其中把复合形法作为一个算子嵌套到遗传算法中,来提高遗传算法的局部搜索能力。利用一组600×4的数据进行聚类,结果表明,complex-GA所得结果的迭代次数,最小目标函数值及平均目标函数值都较为理想。 【4】将遗传算法与复合形法构成组合优化方法,用于K-means优化聚类。首先使用遗传算法进行大范围搜索,在取得较优结果时加入记忆体,用来存储最优解群体,然后利用局部搜索能力较强的复合形算法、以最优解群体作为初始顶点作进一步优化,从而达到最优解或者接近最优解。结果表明该方法的迭代次数及总体所耗时间都大大降低,在提高效率的同时也改善了解的质量。 【5】将以上的研究成果用于某超市CRM系统设计,包括数据表的设计、数据转换以及数据仓库的建立等功能模块的设计。选取顾客年龄,购买总额,购买次数三个属性,分别采用改进后的聚类算法和基本k-means聚类算法对客户类型进行聚类,采用MATLAB7.0图像处理工具将聚类结果进行处理。由结果可以看出,改进后的聚类算法对客户的聚类更加合理,能够较好的反映客观现实,有着重要的参考和实用价值,具有较强的理论和实践意义。


知网文化
【相似文献】
中国期刊全文数据库 前10条
1 楼世博,金晓龙;模糊数学及其应用(四)[J];机器人;1980年03期
2 王继中;;计算机与医学[J];国际生物医学工程杂志;1980年02期
3 赵文;;局部敏感的峰值分离法[J];物探化探计算技术;1981年02期
4 王洵;;引文分析中的“同引”[J];情报科学;1982年03期
5 李安之,卢桂章;生物医学信号的系统分析与统计分析[J];机器人;1983年02期
6 张信,康树森;成组技术的新途径[J];成组技术与生产现代化;1984年01期
7 章少华;Fuzzy黑箱理论与Fuzzy算法语言在针灸学上的应用[J];信息与控制;1984年06期
8 蔡建国;生产流程分析法(PFA法)和聚类分析在生产流程分析法中的应用[J];成组技术与生产现代化;1985年01期
9 王珉,朱剑英,张幼桢;金属切削加工状态的模糊(Fuzzy)模式识别(一)——模糊等价矩阵聚类分析法[J];航空学报;1985年01期
10 郑会颂;;用以解决模糊情报检索中模糊聚类从属度问题的一种文献标引词自动统计算法[J];南京邮电大学学报(自然科学版);1985年02期
中国重要会议论文全文数据库 前10条
1 郭天宇;许荣满;;喜马拉雅山南坡蚤类生物多样性的研究[A];中国动物科学研究——中国动物学会第十四届会员代表大会及中国动物学会65周年年会论文集[C];1999年
2 鲍世民;赵国际;张瑞忠;施美连;何新桥;朱庭玉;;中国小家鼠遗传分化研究[A];中国动物科学研究——中国动物学会第十四届会员代表大会及中国动物学会65周年年会论文集[C];1999年
3 刘斌;李福来;韩之明;刘彦;;朱鹮的随机扩增多态DNA分析与种内亲缘关系研究[A];稀世珍禽——朱鹮——’99国际朱鹮保护研讨会文集[C];1999年
4 王允白;王宝华;郭承芳;周健;;烤烟主要化学成分与评吸结果的关系研究[A];中国烟草学会第三届理事会第二次会议暨1997年年会文件和论文汇编[C];1997年
5 李锡香;沈镝;朱德蔚;周明德;EyzaguirreP.B.;AyadW.C;;云南芋遗传资源的同工酶多态性研究[A];中国园艺学会成立70周年纪念优秀论文选编[C];1999年
6 乔爱民;刘佩瑛;雷建军;;芥菜16个变种的RAPD研究[A];中国园艺学会成立70周年纪念优秀论文选编[C];1999年
7 刘建秀;贺善安;陈守良;陈志一;刘永东;郭爱桂;郭海林;;华东地区狗牙根种质资源研究[A];中国园艺学会成立70周年纪念优秀论文选编[C];1999年
8 毕笃彦;毛柏鑫;马林华;;基于灰度秩数的非监控纹理图象分割[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
9 宋晓秋;朱思义;;Fuzzy聚类的一种迭代方法[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
10 员玉玲;席酉民;;我国各地区投资环境的综合评价分析[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
中国博士学位论文全文数据库 前10条
1 魏立梅;聚类分析新方法的研究与应用[D];西安电子科技大学;1998年
2 李海民;遗传算法性能及其在聚类分析中应用的研究[D];西安电子科技大学;1999年
3 李立新;安全数据库及其应用系统研究[D];重庆大学;2001年
4 曹蓟光;联机分析挖掘处理技术(OLAM)的研究[D];浙江大学;2001年
5 张淑萍;芦苇分子生态学研究[D];东北林业大学;2001年
6 冯红伟;数据挖掘技术的研究及应用[D];西北工业大学;2002年
7 张国江;软计算方法和数据挖掘理论在电力系统负荷预测中的应用[D];浙江大学;2002年
8 弗洛朗(Florent J-B.Quenum);芝麻种质资源种子特性、生化和分子标记的分析研究[D];浙江大学;2002年
9 李锡香;黄瓜种质遗传多样性的形态和分子评价及其亲缘关系研究[D];中国农业科学院;2002年
10 何礼;我国栽培豇豆的遗传多样性研究及其育种策略的探讨[D];四川大学;2002年
中国硕士学位论文全文数据库 前10条
1 范涛;基于模糊Hopfield网络的人体染色体聚类分析[D];北京工业大学;2000年
2 韩春雨;利用分子标记辅助选择加速培育大豆种子脂肪氧化酶缺失近等基因系的研究[D];中国农业科学院;2000年
3 范存丽;星级饭店经济效益差异的分析/来华旅游外国人数总额增长情况分析[D];首都师范大学;2000年
4 白卫国;秦岭巴山冷杉林群落学特征、类型划分及生产力研究[D];西北农林科技大学;2000年
5 安磊;一种基于遗传算法的数据挖掘技术的研究与应用[D];河海大学;2001年
6 吴林;基于数据仓库的数据挖掘技术的研究与实现数据分类的研究与实现[D];电子科技大学;2001年
7 邓英;数据仓库与数据挖掘技术理论及应用的研究[D];甘肃工业大学;2001年
8 段练军;数据挖掘在WWW上的实现技术[D];郑州大学;2001年
9 葛维燕;数据挖掘技术及其在数据集市中的应用[D];大连海事大学;2001年
10 杨凌;聚类分析中聚类数的确定问题[D];武汉科技大学;2001年
中国重要报纸全文数据库 前10条
1 本报记者 陈军梅;文化网站少文化[N];中国质量报;2000年
2 ;有的放矢的销售和服务[N];国际金融报;2000年
3 一泓;构建辅助决策平台[N];金融时报;2000年
4 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
5 首都信息发展股份有限公司政府事业部;电子政务的基本内容和技术框架[N];计算机世界;2001年
6 李磊 陈健;让决策更科学[N];计算机世界;2001年
7 孙富春 李磊;电子政务中的数据挖掘[N];计算机世界;2001年
8 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
9 ;数据挖掘流程[N];人民邮电;2001年
10 谷雨;入侵检测需要协同[N];网络世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978