收藏本站
《华中师范大学》 2001年
收藏 | 手机打开
二维码
手机客户端打开本文

不完整关系数据库中关联规则挖掘问题的研究

熊伟  
【摘要】: 数据挖掘是数据库、人工智能、机器学习等领域结合而产 生的是一个新兴的、具有广泛应用前景的研究领域,其目标是从 海量数据中智能、自动地提取有价值的信息和知识以支持决策。 关联规则挖掘是数据挖掘的重要研究内容。对关联规则挖掘问题 的研究是由Agrawal等人在1993年提出来,最初的动机是希望 通过分析超级市场的商品销售数据来发现有关顾客购买行为的知 识以指导商业决策。在超级市场的事务数据库中,保存着顾客每 次购物的商品项目信息,发现顾客购物行为中不同商品项目之间 的影响和联系对于商业决策意义重大。对关联规则挖掘问题的研 究可以帮助我们正确的发现这些联系。 关联规则挖掘问题的提出引起了众多研究人员的重视,他们 对该问题展开了深入的研究;同时,关联规则挖掘问题也被进一 步扩展和改进,应用到更广泛的领域。目前,关联规则挖掘技术 已经被应用到除商业领域外的其它领域,如电讯业、金融业等, 均取得了良好的效果。 关联规则挖掘问题最初仅涉及事务数据库,由于事务数据库 中不存在属性值丢失的问题,值丢失问题在关联规则挖掘的研究 中也一直没被重视。然而,当我们尝试去发现关系数据库中的关 联规则时,就可能经常要面对属性值丢失的问题。怎样从不完整 的关系数据库中计算关联规则至今仍没有明确的方法。 文中详细介绍并比较了AIS算法、SETM算法、Apriori算 法、DIC算法等典型的布尔关联规则挖掘算法,研究了其各自的 效率和适用范围;详细介绍了数值关联规则挖掘的一般思路和关 键技术,包括连续属性离散化、数值关联规则的兴趣度和挖掘过 程中候选项目集支持率的计算方法;基于粗糙集理论中的等价类 思想,本文提出了一种在关系数据库中进行关联规则挖掘的新方 法,重新定义了关系数据库中的关联规则,及其支持率和置信度 等概念,给出了通过搜索项目集的等价类来发现频繁项目集的新 思路;深入研究了不完整关系数据库的重要性质,并在此基础上 介绍了不完整关系数据库中的关联规则,以及它的支持率和置信 Iz辇霎弓爿 茄半壹a井寸 Y“-/M托工ER S 工肛SIS 度的评估方法,并定义了它的期望支持率和期望置信度,这些定 义保证了关联规则挖掘的某些必需的性质;研究了以往的丢失值 处理方法并分析了其不足之处,最后结合前面的定义给出了不完 整关系数据库中关联规则挖掘问题的新的定义和解决方法。/
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2001
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 胡开明;陈建华;;一种改进的增量数据挖掘算法[J];计算机应用与软件;2011年08期
2 崔建;李强;王国师;;一种针对大型事务数据库的关联规则挖掘算法[J];空军雷达学院学报;2011年03期
3 徐慎刚;;关联规则数据挖掘在税务稽查系统中的应用[J];财政监督;2011年19期
4 梁丽燕;;关联规则挖掘Apriori算法在数字档案系统中的应用研究[J];现代计算机(专业版);2011年13期
5 张长海;胡孔法;陈崚;宋爱波;;一种高效的基于位图序列模式挖掘算法[J];高技术通讯;2010年02期
6 王璇;;基于关联图的频繁闭模式挖掘[J];辽东学院学报(自然科学版);2011年02期
7 刘俊;刘希玉;;基于广义离散Morse理论的强关联规则挖掘[J];计算机工程;2011年16期
8 赵明茹;郭键;孙媛;;基于线性链表存储结构的Apriori改进算法[J];科学技术与工程;2011年23期
9 罗晓丽;;改进的数据挖掘算法在高职院校图书馆中应用[J];科技和产业;2011年07期
10 唐金文;张廷宪;聂建国;胡振渝;;邻接矩阵在高校图书馆借阅数据挖掘中的应用[J];现代情报;2011年08期
中国重要会议论文全文数据库 前10条
1 韦素云;吉根林;杨明;;基于聚类的模糊关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 侯俊杰;李春平;;一种基于内存索引的频繁模式挖掘算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 宋国杰;范明;;一种多维关联规则挖掘的模型与算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 丁艳辉;王洪国;高明;谷建军;;一种基于矩阵的高效关联规则挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
6 钱铁云;冯小年;王元珍;;prefix-hash-tree的插入、查找和重构算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 林明霞;罗键;;数据挖掘关联规则的改进算法-SDA算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 高明;刘希玉;盛立;;基于矩阵相乘的Apriori改进算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国博士学位论文全文数据库 前7条
1 毛宇星;关联规则挖掘在分类数据领域的扩展性研究[D];复旦大学;2010年
2 赵强利;基于选择性集成的在线机器学习关键技术研究[D];国防科学技术大学;2010年
3 邓晓懿;移动电子商务个性化服务推荐方法研究[D];大连理工大学;2012年
4 周明;基于数据挖掘的制造业采购DSS理论及方法研究[D];天津大学;2009年
5 谢志鹏;基于概念格模型的知识发现研究[D];合肥工业大学;2001年
6 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
7 徐新文;基于内容的新闻视频挖掘方法研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 熊伟;不完整关系数据库中关联规则挖掘问题的研究[D];华中师范大学;2001年
2 李春喜;一种混合模式电子商务推荐技术的研究[D];苏州大学;2010年
3 刘正;基于MapReduce的中药数据网络化及挖掘[D];南京大学;2012年
4 王正宇;数据挖掘在读者偏好研究中的应用[D];上海交通大学;2010年
5 耿三靖;数据挖掘技术在高校教学评价中的应用研究[D];河南理工大学;2010年
6 邵伟;基于FP-Tree的关联规则挖掘算法研究[D];西安电子科技大学;2010年
7 肖韬;基于MapReduce的信息检索相关算法并行化研究与实现[D];南京大学;2012年
8 高春玲;关联规则挖掘的实现[D];郑州大学;2001年
9 俞珏民;基于项-事务关联数据库的相联规则挖掘算法的研究[D];郑州大学;2000年
10 彭剑;基于聚类和关联规则的无线网络入侵检测系统研究[D];中南大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026