收藏本站
《华东师范大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚类和压缩矩阵的加权关联规则算法的研究与应用

罗芳  
【摘要】: 关联规则挖掘的主要研究目的就是从大型数据集中发现隐藏的、有趣的、属性间的规律,它是数据挖掘领域中的一个重要研究方向。为了解决现实数据库中每个项目的重要性差异和分配不均匀性,本文设计了一种基于聚类和压缩矩阵(ClusterCompression Matrix)的加权关联规则算法——CCMW算法。论文的主要内容如下: (1)对数据挖掘技术进行阐述和归纳,重点介绍了聚类分析和关联规则的基本概念、思想及代表算法——K-Means算法和Apriori算法。 (2)深入分析了著名的加权关联规则算法——MINWAL(O)算法,并指出了该算法存在的问题。 (3)针对加权关联规则算法中权值设置这个难点,提出了基于时间聚类的权值设置方法。在此基础上,运用布尔向量的关系运算思想,设计了一种基于聚类和压缩矩阵的加权关联规则算法——CCMW算法。该算法通过聚类和对相同事务进行计数来压缩矩阵以减小数据库规模,并且只需扫描一次数据库,无需产生候选项集直接生成加权频繁项集。在时间效率上,该算法比MINWAL(O)算法提高了50%以上。 (4)在原有的超市管理系统中,运用CCMW算法,采用Delphi 7.0作为系统的开发工具,设计了一个数据挖掘系统用于挖掘万佳超市购物篮中的关联规则。该系统包括数据导入、数据预处理、关联规则挖掘和查询与分析等四个模块。数据导入是将管理者感兴趣的数据导入到数据仓库中;数据预处理是把导入的数据经过清洗、转换等方法转换为算法所需的数据存储形式;关联规则挖掘可找出满足加权支持度和加权置信度的加权频繁项集,根据挖掘结果为超市商品的摆放提供决策支持;查询与分析可根据条件查询相关信息并对其进行分析,为超市的管理者提供一些营销策略参考。本系统已经投入试运营阶段,并取得了实际的成效,万佳超市的商品月销售总量提高了约10%。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 邵平;杨路明;;旋转45°矩形窗口的积分图像算法改进及应用[J];计算机应用与软件;2008年03期
2 陈苏豫;;用BOOTH算法改进的计算机定点乘法运算[J];晋中学院学报;2008年03期
3 梁勇;孟桥;陆佶人;;Lyapunov指数的算法改进与加权预测[J];声学技术;2006年05期
4 邵平;杨路明;曾耀荣;;计算旋转Harr型特征的积分图像算法改进[J];计算机技术与发展;2006年11期
5 卢铭娜;朱学峰;郭永玲;陈玉霜;;PID控制器微分算法的改进研究和仿真[J];自动化技术与应用;2006年10期
6 杨盘洪;赵建安;朱军祥;杨静;;机动目标跟踪的自适应网格交互多模算法改进[J];仪器仪表学报;2006年S3期
7 连志春;王春光;张洁;;基于小波网络的BP算法改进研究[J];计算机工程与应用;2007年02期
8 陈郁;秦奋;余明全;;B-P神经网络改进及其在Matlab中应用程序发布的研究[J];河南教育学院学报(自然科学版);2007年02期
9 吴建华;邹德旋;李静辉;;一种快速精确的虹膜定位方法[J];仪器仪表学报;2007年08期
10 王玉琨;魏国军;;图像测量中的边界跟踪算法改进[J];橡胶工业;2008年09期
中国重要会议论文全文数据库 前10条
1 许爱芬;杨胜奎;王鹏;黄勇;钱继锋;;C功能刀具半径补偿的优化算法[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
2 覃喜庆;韩韬;彭春萍;;非制冷红外热像仪实用图像增强技术研究[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(下册)[C];2006年
3 魏俊超;;BP神经网络算法改进研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
4 王彤;;对Web使用记录挖掘算法的改进[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
5 潘大夫;汪渤;;一种改进的Canny算法[A];第二十七届中国控制会议论文集[C];2008年
6 郝红星;吴玲达;宋汉辰;;一种残损图像修补算法改进与实现[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
7 申东日;冯少辉;陈义俊;;BP网络学习算法的改进[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
8 庞金城;林京;黄晓砥;;宽带信号常规波束形成方位估计算法改进[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
9 赵运基;裴海龙;;光强自适应补偿的Camshift算法[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 李国栋;;定点DSP实现均衡的算法改进与仿真[A];系统仿真技术及其应用(第7卷)——'2005系统仿真技术及其应用学术交流会论文选编[C];2005年
中国重要报纸全文数据库 前5条
1 四川省畜牧科学研究院 易礼胜;饲料配方软件的算法[N];中国畜牧兽医报;2008年
2 黄慧琴 陈松;阿尔戈马钢铁厂转炉工艺的改进措施[N];世界金属导报;2007年
3 记者 胡亚 通讯员 孟晋宝;我国陆表遥感产品验证实验完成[N];中国气象报;2008年
4 易水;IEEE 802.11i 提升无线网的安全[N];计算机世界;2003年
5 本报记者 于翔;搜索整合前路漫漫[N];网络世界;2010年
中国博士学位论文全文数据库 前10条
1 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
2 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
3 李晓斌;交通出行信息服务平台及其关键技术应用研究[D];华南理工大学;2010年
4 周郭许;盲信号分离若干关键问题研究[D];华南理工大学;2010年
5 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
6 谢宗伯;信号的噪声抑制理论与技术研究[D];华南理工大学;2010年
7 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
8 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
9 曹友强;基于机敏约束阻尼的车身结构振动噪声控制研究[D];重庆大学;2011年
10 倪萍;流数据挖掘关键技术研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 罗芳;基于聚类和压缩矩阵的加权关联规则算法的研究与应用[D];华东师范大学;2010年
2 包震宇;基于粗糙集对Apriori算法的改进[D];上海师范大学;2010年
3 刘红卫;线性回归模型中多重共线性问题的应对策略及其几点改进[D];西南交通大学;2006年
4 周育乾;基于粒子群优化算法的滤波器设计与实现[D];南京理工大学;2007年
5 刘恒辉;红外图像处理算法研究及其FPGA实现[D];武汉理工大学;2008年
6 黄永;改进蚁群算法及其在公交线网优化中的应用[D];华东师范大学;2010年
7 杨海;蚁群算法及其在智能交通中的应用[D];山东师范大学;2008年
8 皇甫丽英;G.728算法改进及低码率LD-CELP算法研究[D];太原理工大学;2002年
9 刘佳;基于Gibbs算法的改进算法及其在识别MOTIF中的应用[D];吉林大学;2010年
10 张秋凤;加权关联规则挖掘算法研究及应用[D];天津师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026