收藏本站
《天津师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

加权关联规则挖掘算法研究及应用

张秋凤  
【摘要】:数据挖掘能够从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。关联规则挖掘是数据挖掘中的一个非常重要的研究方向,用于发现数据库中项之间的相互关系。从是否生成频繁项集的角度,可以将关联规则挖掘算法分两类:生成频繁项集的算法和不生成频繁项集的算法,分别以Apriori算法和FP-growth算法为经典代表,但是二者都没有考虑到数据库中项目的重要性不同。本文重点对项目加权关联规则算法进行了研究,主要工作和创新之处有以下几部分: 首先,介绍了数据挖掘和关联规则的相关理论知识,重点对Apriori算法的基本思想进行了分析和改进,简述了其在web数据挖掘领域中的应用。 其次,由于不考虑数据库中项目的重要程度,会产生无趣规则,因此为关联规则引入了项目加权思想,深入研究了几种加权关联规则挖掘算法和模型。分析出了现存的加权关联规则模型和算法的优缺点,详细阐述了改进算法的思想; 第三,提出一种基于矩阵的加权关联规则的改进算法。通过一次扫描,将关系数据库存储转换为0-1矩阵的形式,减少了内存空间的占用;在对频繁(k-1)-项集进行连接运算前进行预剪枝,并且改进了剪枝策略;算法不产生候选项集,而是直接生成频繁项集;由于引入权值导致非频繁项集的超集可能是频繁的,所以单独考虑加权频繁2-项集的生成方式,不会遗漏加权频繁集;在生成关联规则时,引入了兴趣度约束。给出算法的伪代码和流程图,通过实例和实验说明了算法的可行性和优越性。 最后,介绍了个性化推荐流程,将改进算法应用于知识点的个性化推荐领域。个性化推荐包含离线部分和在线本部分,该算法的优势主要体现在离线部分,节约了离线产生加权关联规则的时间。通过模拟实验证明了算法的可行性。
【学位授予单位】:天津师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 侯新丽;孟晓伟;于松;;基于矩阵的加权关联规则挖掘算法[J];电脑开发与应用;2010年06期
2 雷力;;矩阵加权关联规则挖掘算法研究[J];福建电脑;2006年10期
3 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
4 欧阳继红,王仲佳,刘大有;具有动态加权特性的关联规则算法[J];吉林大学学报(理学版);2005年03期
5 张智军,方颖,许云涛;基于Apriori算法的水平加权关联规则挖掘[J];计算机工程与应用;2003年14期
6 王小虎;关联规则挖掘综述[J];计算机工程与应用;2003年33期
7 王艳;姜保庆;宋晶晶;;一种新的加权关联规则模型[J];计算机工程与应用;2006年05期
8 陆丽娜,杨怡玲,管旭东,魏恒义;Web日志挖掘中的数据预处理的研究[J];计算机工程;2000年04期
9 张文献,陆建江;加权布尔型关联规则的研究[J];计算机工程;2003年09期
10 徐章艳,张师超,区玉明,卢景丽,刘美玲;挖掘关联规则中的一种优化的Apriori算法[J];计算机工程;2003年19期
中国硕士学位论文全文数据库 前4条
1 陈媛;两种个性化推荐算法的研究及应用[D];吉林大学;2007年
2 翟罡;Web数据挖掘中加权关联规则算法的研究[D];哈尔滨工程大学;2009年
3 文拯;关联规则算法的研究[D];中南大学;2009年
4 刘玉锋;数据挖掘中关联规则算法的研究与应用[D];长春理工大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 王傲胜;李国徽;;具有利润约束的数值型关联规则的发现[J];安徽电气工程职业技术学院学报;2006年03期
2 钱立三;WEB日志挖掘在远程开放教育中的应用[J];安徽广播电视大学学报;2005年03期
3 范进;;产业结构对产业集群影响力的实证分析[J];安徽广播电视大学学报;2006年04期
4 于立红;杜芸;;数据挖掘中数据预处理方法与技术[J];安徽电子信息职业技术学院学报;2009年04期
5 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
6 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
7 舒坚;郑诚;陈振;;基于关联分类方法的Web使用挖掘研究[J];安徽大学学报(自然科学版);2006年02期
8 宁小红;;Web Usage Mining在电子商务中的应用[J];安徽农业科学;2007年13期
9 唐超礼;魏圆圆;;基于数据挖掘的植保预测系统[J];安徽农业科学;2008年12期
10 刘秋生;吴小倩;;基于数据挖掘的固定资产投资效益评价[J];安徽农业科学;2011年11期
中国重要会议论文全文数据库 前10条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
3 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
4 赵云鹏;石丽;刘莹;;基于数据挖掘的高校规模分析及应用研究[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
5 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
6 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
7 吴栋;张京华;王玉成;胡伍生;;前兆信息模型在地震预测中的应用[A];数字测绘与GIS技术应用研讨交流会论文集[C];2008年
8 孟少朋;骆红云;李盛;;基于数据挖掘的汽车可靠性分析方法研究[A];2007年全国失效分析学术会议论文集[C];2007年
9 杨雯怡;郑康锋;杨义先;;一种自适应的网络安全防护方案[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
10 杨纪军;朱培栋;;关联规则挖掘技术在蜜罐系统中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
2 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
3 马志勇;机械对称的概念、作用及其应用知识获取的研究[D];浙江大学;2010年
4 张惠;产品专利知识获取及其辅助产品创新的方法研究[D];浙江大学;2010年
5 王冬丽;基于可扩展的支持向量机分类算法及在信用评级中的应用[D];东华大学;2011年
6 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
7 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
8 谭婷婷;网络微内容推荐方法及支持系统研究[D];华中科技大学;2011年
9 郜峦;基于文献分析的“肺与大肠相表里”证治规律及其关系研究[D];北京中医药大学;2011年
10 卢又燃;放射科随访数据库建立与粗糙集方法辅助诊断胶质瘤分级的应用分析[D];复旦大学;2009年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
3 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
4 韩冬振;远程诊断中心的设计与实现[D];郑州大学;2010年
5 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年
6 史文财;省级政务网安全检测系统的设计与实现[D];哈尔滨工程大学;2010年
7 杨海陆;公路收费系统数据分析与挖掘[D];哈尔滨工程大学;2010年
8 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
9 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
10 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 董祥军,王淑静,宋瀚涛,陆玉昌;负关联规则的研究[J];北京理工大学学报;2004年11期
2 范亚芹,刘颖,李兴男;Web数据挖掘原理及实现[J];吉林大学学报(信息科学版);2003年04期
3 刘亚波,刘大有,古方明,齐红;基于两阶段计数的用户关联挖掘[J];复旦学报(自然科学版);2004年05期
4 郑丽英,王庆荣,刘丽艳;面向属性的粗集数据挖掘方法研究[J];兰州理工大学学报;2005年02期
5 张秋余;曹华;;基于Apriori算法的加权关联规则的挖掘[J];兰州理工大学学报;2007年06期
6 刘美玲,徐章艳,卢景丽,区玉明,袁鼎荣,吴信东;利用项集有序特性改进Apriori算法[J];广西师范大学学报(自然科学版);2004年01期
7 袁晓玲,赵茜,桂振梅;关联规则挖掘算法的优化处理[J];河北省科学院学报;2005年02期
8 杨雪峰;张可彤;郭连水;;数据仓库技术在电信领域的应用[J];程序员;2002年12期
9 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
10 陆建江,钱祖平,宋自林;正态云关联规则在预测中的应用[J];计算机研究与发展;2000年11期
中国博士学位论文全文数据库 前1条
1 贺志;关联规则优化方法的研究[D];北京交通大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 杨泽民,陈莉,范全润;加权关联规则的并行挖掘算法[J];计算机工程与应用;2003年08期
2 杨明,孙志挥,赵传申;交易数据库的加权关联规则增量更新算法[J];计算机工程与应用;2002年01期
3 周晓云,孙志挥,倪巍伟;一种基于加权的高效关联规则挖掘算法的设计与实现[J];计算机工程与应用;2004年20期
4 欧阳为民,郑诚,蔡庆生;数据库中加权关联规则的发现[J];软件学报;2001年04期
5 杨明,孙志挥,杨萍;基于记录分区的加权关联规则挖掘[J];小型微型计算机系统;2003年10期
6 张宏宇,梁吉业,张景利;决策表中加权关联规则挖掘的研究[J];山西电子技术;2002年06期
7 张素文,孟建良,庞春江;模糊关联规则的加权挖掘算法[J];微机发展;2003年04期
8 宫雨,武森,尹阿东,高学东;加权关联规则的改进算法[J];计算机工程与应用;2004年22期
9 郭艳军;王忠桃;钱卫;;加权关联规则的改进算法[J];成都信息工程学院学报;2008年03期
10 雷力;;矩阵加权关联规则挖掘算法研究[J];福建电脑;2006年10期
中国重要会议论文全文数据库 前10条
1 莫晓静;史岚;许光宇;赵宇海;王国仁;乔建忠;;MFCC:一种高效的三维频繁闭项集挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 曹国栋;郭景峰;;一种基于定量更新滑动窗口频繁闭项集挖掘算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 杜剑峰;李宏;陈松乔;;分布式环境下约束性关联规则的挖掘算法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 张磊;夏士雄;周勇;牛强;;具有语义最小支持度的关联规则挖掘方法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
5 沈向余;李伟华;;几种关联规则挖掘算法的分析[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 柴明亮;李宁宁;宋苏;;平均阈值关联规则挖掘算法[A];2005年中国智能自动化会议论文集[C];2005年
7 丁艳辉;王洪国;高明;谷建军;;一种基于矩阵的高效关联规则挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 郭平;陈黎;聂亚可;林勇;;以Apriori为基础的序列挖掘算法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
9 黄崇争;李海峰;陈红;;数据流上近似非可导项集的挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
10 曹波伟;薛青;唐志武;任晓明;;面向军事基础数据的数据挖掘研究[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 吉林省园艺特产局局长 刘东华;实行农产品专项集中连片生产促进生产经营向现代农业发展[N];中国特产报;2003年
2 王新军 李海波;大连:1500项集雨工程抓紧实施[N];中国水利报;2003年
3 记者王伟 通讯员张姿;淮安专项集体合同保全职工安置[N];工人日报;2003年
4 韩国光;重在理顺关系明确职责[N];人民邮电;2002年
5 立青;《集体全同规定》5月1日起施行[N];北京人才市场报;2004年
6 记者黄剑;今年为全区人民办12件实事[N];中国信息报;2003年
7 通讯员 李贵日 谭春生;亿元巨资治理“舜水河”[N];永州日报;2010年
8 ;香港中小上市公司配股频频[N];中国证券报;2004年
9 李国辉 张军 汤义;挖掘技术直面多媒体[N];计算机世界;2002年
10 云南省电信公司供稿;云南电信:在改革中寻求突破[N];通信信息报;2003年
中国博士学位论文全文数据库 前10条
1 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
2 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
3 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
4 吴简;面向业务的基于模糊关联规则挖掘的网络故障诊断[D];电子科技大学;2012年
5 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
6 马志勇;机械对称的概念、作用及其应用知识获取的研究[D];浙江大学;2010年
7 李海波;频繁子结构挖掘算法研究与应用[D];华中科技大学;2011年
8 颜端武;面向知识服务的智能推荐系统研究[D];南京理工大学;2007年
9 杨厚群;半结构化数据频繁模式挖掘相关技术研究[D];重庆大学;2010年
10 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 张秋凤;加权关联规则挖掘算法研究及应用[D];天津师范大学;2011年
2 栗晓聪;加权关联规则在入侵检测中的研究与应用[D];广东工业大学;2012年
3 刘海蓉;基于矩阵的加权关联规则挖掘算法研究[D];江苏科技大学;2011年
4 李成军;蚁群算法在加权关联规则挖掘中的研究与实现[D];暨南大学;2010年
5 罗芳;基于聚类和压缩矩阵的加权关联规则算法的研究与应用[D];华东师范大学;2010年
6 许砺珅;遂宁市政府个性化门户网站系统的设计与实现[D];电子科技大学;2011年
7 陈锹;基于粗糙集的知识发现在客户关系管理(CRM)中的应用[D];广西大学;2004年
8 王江北;基于模糊理论的关联规则挖掘及其在个性化推荐中的应用研究[D];河北工业大学;2011年
9 王艳;一种加权关联规则模型及挖掘算法研究[D];河南大学;2007年
10 杨剑敏;购物篮分析方法的研究与扩展[D];暨南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026