收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

数据库中数据挖掘理论方法及应用研究

罗可  
【摘要】:数据挖掘是目前数据库和信息决策领域最前沿的研究方向之一。本文研究数据库中数据挖掘,主要包括以下内容: 1 介绍了数据库和数据挖掘技术的发展动态,讨论了数据挖掘技术的研究现状、存在的不足和发展方向。分析了海量数据库产生的原因和特点。讨论了适于在海量数据库中进行数据挖掘的算法的基本特征,即算法应该具有线性计算复杂度O(n)。 2 对挖掘关联规则的算法进行了研究。首先,我们分析了Apriori算法的某些不足;随后,我们提出了一种基于Apriori的改进算法,新算法在某些场合能减少扫描数据库的次数,提高了算法的效率;随后,我们又提出了一种基于事务树的高效算法,用该算法挖掘频繁项目集只需要一次扫描事务数据库,不需要产生候选项目集,该算法的速度大约是Apriori算法的10倍;最后,我们提出了一种用Visual FoxPro实现Apriori算法的方法。 3 对关联规则的衡量标准进行了研究,指出了原衡量标准和若干改进方法的不足。目前,关联规则常用的衡量标准是支持度和置信度,如果按现有标准来生成关联规则,可能会发现大量冗余的、虚假的关联规则。为了减少关联规则挖掘中的无效关联规则,我们分析了产生问题的根源,提出了三种改进方法,即在关联规则的衡量标准中增加影响度、相对置信度或有效度标准,并分别定义了影响度、相对置信度和有效度。根据影响度、相对置信度或有效度的大小,将强关联规则分为正关联规则、无效关联规则和负关联规则。一般来说,只有正关联规则才是有效的关联规则,有时,它们只占强关联规则总数的一小部分。此外,我们提供了用新衡量标准进行关联规则挖掘的改进算法,并进行了实验。实验表明,我们提出的方法能明显减少无效的关联规则。 4 对目前比较优秀的各种分类算法进行了介绍、分析和比较。综合提出了分类算法的评价标准。随后,我们讨论了SPRINT算法。针对SPRINT算法的不足,提出了二种处理离散属性的新方法。这些方法能明显减少求最优分割点的运算量,提高算法的执行速度。最后,我们提出了一种基于抽样的快速数据分类算法。该算法既是可伸缩的,也可并行化。实验表明,该算法的速度是SPRINT算法的10-50倍。 5 介绍、分析和比较了各种常用的聚类方法,综合提出了聚类算法的评价标准和今后的研究方向。随后,在分析BIRCH算法不足的基础上,提出了一种基于抽样的聚类算法。测试结果表明,该算法在聚类速度方面明显优于BIRCH算 数据库中数据挖掘理论方法及应用研究 法。 6为了提高数据挖掘的效率,提出了采用约束和多维技术的方法进行数据挖 掘。分析了数据挖掘中可能的约束类型,用关联规则挖掘讨论了哪些约束可运用 于数据挖掘过程中。设计出了一个采用约束与多维技术的数据挖掘系统结构。 7讨论了数据挖掘技术在电力系统中应用,重点研究了最优潮流问题的高效算 法。我们根据电力系统的特点,把无功界约束与一般非线性不等式约束分开来考 虑,提出了一类投影渐近半光滑Newton型算法,实验表明,我们提出的算法具 有良好的计算性能。 关键词:数据库;数据挖掘;关联规则;分类;聚类;算法 八


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘秀峰 ,詹秀菊;面向电子商务的数据挖掘技术[J];现代通信;2003年06期
2 孙京兰;;OLAP技术及数据挖掘 技术[J];中文信息;2003年04期
3 冯进;利用数据挖掘技术 深入挖掘图书馆工作[J];现代情报;2005年03期
4 王小燕;数据挖掘技术在超市中的应用研究[J];商场现代化;2005年05期
5 方忠祥,屠立;数据挖掘技术在客户关系管理中的应用研究[J];机床与液压;2005年06期
6 龙腾芳;数据挖掘技术在农业领域中的应用研究[J];微计算机信息;2005年08期
7 周勇;数据挖掘技术发展综述[J];中国科技信息;2005年16期
8 徐守军,高波,甄蓓,彭奕,王东根,王玉民,吴乐山;数据挖掘技术在科研管理中应用前景初探[J];中华医学科研管理杂志;2005年04期
9 张特来,刘万军;数据挖掘在医学领域的应用研究[J];自动化技术与应用;2005年10期
10 杨小云;;数据挖掘在图书馆中的应用[J];渭南师范学院学报;2005年S2期
11 刘蓉;陈晓红;;利用数据挖掘技术 提高电信企业管理决策水平[J];计算机应用与软件;2005年12期
12 刘超;;Web数据挖掘及其在电子商务中的应用[J];软件导刊;2005年22期
13 关心;李义杰;;面向税务系统的数据挖掘[J];辽宁工程技术大学学报;2005年S2期
14 王瑞敏;吕锋华;;数据挖掘技术探究[J];金华职业技术学院学报;2006年01期
15 袁敏;廖金辉;唐日成;;DM与6Sigma模式在软件过程改进中的应用[J];现代计算机;2006年02期
16 严潭;;数据挖掘在电子商务中的应用[J];微计算机信息;2006年12期
17 周宇葵;杜方冬;;数据挖掘的哲学思考[J];图书馆学刊;2006年03期
18 宁克娟;;关于数据挖掘在CRM中的应用[J];南平师专学报;2006年02期
19 牛卫红;;数据挖掘技术在电子商务中的应用[J];商场现代化;2006年19期
20 耿正;;基于数据挖掘的智能决策支持系统[J];鸡西大学学报;2006年04期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国博士学位论文全文数据库 前10条
1 罗可;数据库中数据挖掘理论方法及应用研究[D];湖南大学;2005年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年
2 赵园园;加权负关联规则挖掘技术的研究[D];山东轻工业学院;2009年
3 陶芳;关系数据挖掘的正负关联规则挖掘算法[D];哈尔滨理工大学;2009年
4 赵龙;基于负关联规则分类技术的研究[D];山东轻工业学院;2009年
5 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
6 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
7 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
8 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
9 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
10 袁明;基于网格的数据挖掘应用研究[D];西安电子科技大学;2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978