收藏本站
《哈尔滨理工大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

关联规则挖掘算法的研究

周虹  
【摘要】: 数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。经过十几年的努力,数据挖掘产生了许多新概念和方法。特别是最近几年,一些基本概念和方法趋于清晰,它的研究正向着更深入的方向发展。像其它新技术的发展历程一样,数据挖掘技术也必须经过概念提出、概念接受、广泛研究和探索、逐步应用和大量应用等阶段。从目前的现状看,大部分学者认为数据挖掘的研究仍然处于广泛研究和探索阶段,迫切需要在基础理论、应用模式、系统构架以及挖掘算法和挖掘语言等方面进行创新。关联规则挖掘是数据挖掘中成果颇丰而且比较活跃的研究分支,留给研究者的是更深入的课题。面对大型数据库,关联规则挖掘需要在挖掘效率、可用性、精确性等方面得到提升。因此,需要探索新的挖掘理论和模型;需要利用用户的约束等聚焦挖掘目标:需要对一些传统的算法进行改进;也需要研究新的更有效的算法等。鉴于目前数据挖掘技术和关联规则挖掘研究的现状和发展趋势,我们选择了这一课题开展相关工作。 本文的研究主要包括关联规则挖掘理论及其算法等。在关联规则挖掘理论研究上,我们给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子。基于项目序列集格空间及其操作,我们建立了关联规则挖掘算法。在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法ISS-DM、时态约束下的关联规则挖掘算法TISS-DM、数据分割下的关联规则挖掘算法PISS-DM。ISS-DM算法是建立在严格的项目序列集格理论及其操作基础上,是一个一次数据库扫描的而且不使用侯选集的高效算法。我们选择目前引用率较高的Apriori算法和ISS-DM进行了对比实验。结果表明,ISS-DM执行时间整体上优于Apriori算法,而且随着数据量的增大ISS-DM执行时间的增长幅度也小于Apriori算法。为了提高对大型数据集挖掘的适应性,将时态约束应用到挖掘的预处理中,改进ISS-DM成TISS-DM。这部分工作还包括对时态区间、时态约束下的数据挖掘空间以及时态区间操作等进行了形式化,它们是TISS-DM的理论基础。对ISS-DM的另一个改进算法是PISS-DM。它是针对大数据集挖掘过程中对内存和CPU等系统资源要求较高的情况被提出和设计的,采用了数据分割的方法来减少资源的占用。本文解决了数据分割下局部频繁项目序列集和全局频繁项目序列集的转换等问题,是一个两次扫描数据库的算法。
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP301.6

【参考文献】
中国期刊全文数据库 前10条
1 杨斌,朱仲英;Mining multilevel spatial association rules with cloud models[J];Journal of Harbin Institute of Technology;2005年03期
2 王理,夏国平,闪四清;用于挖掘关联规则的事务序列合并算法[J];计算机工程与应用;2005年14期
3 王静莲,刘弘,李少辉;基于决策树的遗传算法在数据挖掘领域的应用[J];计算机工程与应用;2005年28期
4 岳训;迟忠先;莫宏伟;郝艳友;;基于免疫网络聚类算法的特征垃圾邮件获取技术[J];计算机工程与应用;2005年35期
5 王艳;姜保庆;宋晶晶;;一种新的加权关联规则模型[J];计算机工程与应用;2006年05期
6 程银波;任家东;司菁菁;;基于H-tree的多维序列模式挖掘算法[J];计算机工程与应用;2006年06期
7 王熙照;董彦军;;模糊决策树的等效剪枝研究[J];计算机工程与应用;2006年07期
8 王燕;;基于等价关系的关联规则挖掘算法研究[J];计算机工程与应用;2006年08期
9 崔立新,苑森淼,赵春喜;约束性相联规则发现方法及算法[J];计算机学报;2000年02期
10 林嘉宜,彭宏,郑启伦,李颖基;基于参考度的关联规则挖掘[J];计算机应用;2005年08期
【共引文献】
中国期刊全文数据库 前10条
1 王旭;马垣;;基本概念格的关联规则挖掘算法[J];鞍山科技大学学报;2006年01期
2 张晓明;刘萍;王鹏;;基于数据仓库的数据挖掘及联机分析技术[J];兵工自动化;2008年09期
3 邵杰;曹延平;时佳佳;;云重心理论在装甲机械化部队射击指挥能力评估中的应用[J];兵工自动化;2009年08期
4 王文清,乔雪峰;带有时态约束的多层次关联规则的挖掘[J];北京理工大学学报;2003年01期
5 安颖;;基于Apriori算法的兴趣集加权关联规则挖掘[J];北京联合大学学报(自然科学版);2008年04期
6 巫莉莉;徐艾洁;张波;李涛;;基于数据融合和数据挖掘的网络教学资源体系[J];重庆工学院学报(自然科学版);2008年06期
7 龚振中;黄敏;;关于建立税务数据仓库的思考[J];财会月刊;2007年20期
8 李玲俐;;数据挖掘中分类算法综述[J];重庆师范大学学报(自然科学版);2011年04期
9 焦振;;基于矩阵行向量运算的关联规则挖掘算法研究[J];重庆电子工程职业学院学报;2009年02期
10 丛培才;张守武;;浅析数据挖掘技术在单亲子女教育研究中的应用[J];时代教育(教育教学);2010年12期
中国重要会议论文全文数据库 前10条
1 孙衢;王永玉;;基于云模型的非线性系统智能滑模控制[A];第二十九届中国控制会议论文集[C];2010年
2 冯春晖;陈彦桥;刘金琨;;数据挖掘技术在火电机组运行参数优化中的应用[A];中国自动化学会控制理论专业委员会B卷[C];2011年
3 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
4 张柔玲;黄君瑶;;谈病案信息的利用[A];中国医院协会病案管理专业委员会第十八届学术会议论文集[C];2009年
5 樊世燕;彭玉清;贾莲;;关于广播收听调查领域中数据处理问题的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
6 陈江平;李平湘;;基于序半群的空间关联规则挖掘算法[A];湖北省测绘学会2006年度科学技术交流会论文集[C];2006年
7 董燕;;Web挖掘对电子商务网站建设的影响[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
8 高翔;王敏;;模糊频繁情节挖掘算法在入侵检测中的应用[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
9 王远游;李书勇;张海凤;黄俊波;;基于数据仓库的换流站变电管理系统[A];2006中国电力系统保护与控制学术研讨会论文集[C];2006年
10 邓传国;;频繁项集挖掘与学生素质测评应用研究[A];2007系统仿真技术及其应用学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
2 赖芨宇;基于知识挖掘的企业管理集成系统研究[D];东华大学;2011年
3 张晓辉;云理论和数据挖掘在水上安全分析中的应用[D];大连海事大学;2011年
4 牟峰;铁路车站取送车系统优化理论与方法研究[D];西南交通大学;2010年
5 晏永刚;巨项目组织联盟合作协调机制研究[D];重庆大学;2011年
6 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
7 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
8 杨新武;遗传归纳逻辑程序设计技术研究[D];北京工业大学;2003年
9 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
10 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
中国硕士学位论文全文数据库 前10条
1 徐一凤;隐私保护聚类挖掘方法的研究[D];哈尔滨工程大学;2010年
2 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年
3 韩冬梅;基于P2P的教学信息资源负载均衡调度算法的研究[D];哈尔滨工程大学;2010年
4 白喜朋;基于作业的钢铁企业成本分析[D];大连理工大学;2010年
5 谷琳;数据挖掘在陶瓷涂层制备中的应用[D];辽宁工程技术大学;2009年
6 刘晓霞;数据挖掘技术在高校教学管理系统中的应用研究[D];中国海洋大学;2010年
7 冯兴祥;关联规则挖掘在高校招生录取中的应用[D];合肥工业大学;2010年
8 卜叔阳;基于Metropolis准则的免疫算法研究及其应用[D];河北工程大学;2010年
9 张晓艳;面向农业信息服务平台的挖掘技术研究[D];湖南工业大学;2010年
10 饶仕澜;城市路桥收费综合信息平台的构建及应用研究[D];华南理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨德刚;入侵检测中数据挖掘技术的应用研究分析[J];重庆师范大学学报(自然科学版);2004年04期
2 郑宏,陆阳,徐朝农;基于BP神经网络的入侵检测系统分类器的实现[J];合肥工业大学学报(自然科学版);2003年02期
3 王春花,黄厚宽,李红莲;一种快速有效的分布式开采多层关联规则的算法[J];计算机研究与发展;2001年04期
4 杨明,孙志挥,吉根林;快速挖掘全局频繁项目集[J];计算机研究与发展;2003年04期
5 张智军,方颖,许云涛;基于Apriori算法的水平加权关联规则挖掘[J];计算机工程与应用;2003年14期
6 赵明华,杨宏伟,孙娟,王金凤,王熙照;基于遗传算法的模糊决策树的参数优化[J];计算机工程与应用;2003年25期
7 周晓云,孙志挥,倪巍伟;一种基于加权的高效关联规则挖掘算法的设计与实现[J];计算机工程与应用;2004年20期
8 宫雨,武森,尹阿东,高学东;加权关联规则的改进算法[J];计算机工程与应用;2004年22期
9 王熙照,游自英;决策树简化(剪切)方法综述[J];计算机工程与应用;2004年27期
10 刘勇国,李学明,张伟,彭军,廖晓峰,吴中福;基于遗传算法的特征子集选择[J];计算机工程;2003年06期
【相似文献】
中国期刊全文数据库 前10条
1 张志彦;李俊峰;;关联规则挖掘在学生成绩分析中的应用[J];科技和产业;2009年05期
2 王立平;黄斌;;基于数据挖掘技术的高校图书馆馆藏优化研究[J];萍乡高等专科学校学报;2009年03期
3 欧凤霞;王宗殿;;基于关联规则的数据挖掘技术在中医诊断中的应用[J];河南工程学院学报(自然科学版);2011年02期
4 杨海涛,刘胜全;基于分布式数据库的挖掘模型[J];现代计算机;2005年11期
5 郭卜铭;吕渭济;;高校科研管理中的数据挖掘技术及应用[J];科技和产业;2007年06期
6 俞燕燕;;基于关联规则的社会性网络行为研究[J];福建电脑;2007年12期
7 杨春建;石锐明;张宏;;数据挖掘在青海大学教学评估中的应用[J];计算机教育;2007年16期
8 潘锋;;关联规则在教学计划制定中的应用[J];重庆科技学院学报(自然科学版);2008年06期
9 陈玮炜;林栋;;关联规则挖掘在经穴诊疗文献整理中的应用[J];福建电脑;2009年05期
10 康艳霞;;数据挖掘在学生成绩分析中的应用[J];信息与电脑(理论版);2009年09期
中国重要会议论文全文数据库 前10条
1 王文平;刘希玉;;基于遗传算法的关联规则挖掘模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
2 邵秀凤;程葳;孟红;;网络论坛中隐含规律挖掘研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
4 刘智涛;;数据挖掘中的关联规则浅析[A];甘肃成人教育协会2008年年会论文集[C];2008年
5 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
6 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 张宇鹏;王丽珍;周丽华;;基于气象数据的关联规则挖掘[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
8 王盛;董黎刚;李群;;一种基于逆序编码的关联规则挖掘研究[A];浙江省电子学会2010学术年会论文集[C];2010年
9 方芳;李建中;潘海为;;脑部医学图像中的关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
6 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
7 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
8 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
9 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
10 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈耀东;遗传算法在关联规则挖掘中的应用[D];华东师范大学;2008年
2 高乾;基于遗传算法的关联规则挖掘[D];曲阜师范大学;2008年
3 王志浩;数据挖掘在招生信息处理系统中的应用研究[D];山东师范大学;2006年
4 贺云;数据挖掘在电子商务推荐系统中的应用研究[D];大连交通大学;2010年
5 武坤;快速生成关联规则的算法研究[D];河南大学;2006年
6 王绍锋;关联规则增量式更新算法的研究[D];哈尔滨工程大学;2007年
7 李余琪;遗传算法在数据挖掘中的研究与应用[D];中南大学;2007年
8 曾舸;基于半结构化数据的关联规则挖掘研究[D];湖南师范大学;2007年
9 胡曼;交叉销售在中国保险业的应用分析[D];山东大学;2009年
10 朱晓东;基于支持度变化的关联规则挖掘算法及实现[D];南京航空航天大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026