收藏本站
《湖南大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

数据库中数据挖掘理论方法及应用研究

罗可  
【摘要】:数据挖掘是目前数据库和信息决策领域最前沿的研究方向之一。本文研究数据库中数据挖掘,主要包括以下内容: 1 介绍了数据库和数据挖掘技术的发展动态,讨论了数据挖掘技术的研究现状、存在的不足和发展方向。分析了海量数据库产生的原因和特点。讨论了适于在海量数据库中进行数据挖掘的算法的基本特征,即算法应该具有线性计算复杂度O(n)。 2 对挖掘关联规则的算法进行了研究。首先,我们分析了Apriori算法的某些不足;随后,我们提出了一种基于Apriori的改进算法,新算法在某些场合能减少扫描数据库的次数,提高了算法的效率;随后,我们又提出了一种基于事务树的高效算法,用该算法挖掘频繁项目集只需要一次扫描事务数据库,不需要产生候选项目集,该算法的速度大约是Apriori算法的10倍;最后,我们提出了一种用Visual FoxPro实现Apriori算法的方法。 3 对关联规则的衡量标准进行了研究,指出了原衡量标准和若干改进方法的不足。目前,关联规则常用的衡量标准是支持度和置信度,如果按现有标准来生成关联规则,可能会发现大量冗余的、虚假的关联规则。为了减少关联规则挖掘中的无效关联规则,我们分析了产生问题的根源,提出了三种改进方法,即在关联规则的衡量标准中增加影响度、相对置信度或有效度标准,并分别定义了影响度、相对置信度和有效度。根据影响度、相对置信度或有效度的大小,将强关联规则分为正关联规则、无效关联规则和负关联规则。一般来说,只有正关联规则才是有效的关联规则,有时,它们只占强关联规则总数的一小部分。此外,我们提供了用新衡量标准进行关联规则挖掘的改进算法,并进行了实验。实验表明,我们提出的方法能明显减少无效的关联规则。 4 对目前比较优秀的各种分类算法进行了介绍、分析和比较。综合提出了分类算法的评价标准。随后,我们讨论了SPRINT算法。针对SPRINT算法的不足,提出了二种处理离散属性的新方法。这些方法能明显减少求最优分割点的运算量,提高算法的执行速度。最后,我们提出了一种基于抽样的快速数据分类算法。该算法既是可伸缩的,也可并行化。实验表明,该算法的速度是SPRINT算法的10-50倍。 5 介绍、分析和比较了各种常用的聚类方法,综合提出了聚类算法的评价标准和今后的研究方向。随后,在分析BIRCH算法不足的基础上,提出了一种基于抽样的聚类算法。测试结果表明,该算法在聚类速度方面明显优于BIRCH算 数据库中数据挖掘理论方法及应用研究 法。 6为了提高数据挖掘的效率,提出了采用约束和多维技术的方法进行数据挖 掘。分析了数据挖掘中可能的约束类型,用关联规则挖掘讨论了哪些约束可运用 于数据挖掘过程中。设计出了一个采用约束与多维技术的数据挖掘系统结构。 7讨论了数据挖掘技术在电力系统中应用,重点研究了最优潮流问题的高效算 法。我们根据电力系统的特点,把无功界约束与一般非线性不等式约束分开来考 虑,提出了一类投影渐近半光滑Newton型算法,实验表明,我们提出的算法具 有良好的计算性能。 关键词:数据库;数据挖掘;关联规则;分类;聚类;算法 八
【学位授予单位】:湖南大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前2条
1 谢锦男;;港口物流行业的数据挖掘与辅助决策系统设计[J];中国储运;2011年08期
2 肖建国;;论数据挖掘技术在高校就业工作中的应用[J];中国成人教育;2010年08期
中国博士学位论文全文数据库 前1条
1 井彦林;基于数据挖掘技术的黄土湿陷性研究[D];西安理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 郑陶;基于平面向量的决策树算法在高考志愿选择系统中的应用[D];辽宁工程技术大学;2010年
2 吴军;天津港决策支持系统平台的设计与实现[D];大连海事大学;2010年
3 张春霁;天津财经大学计算机机房管理系统的分析设计与实现[D];电子科技大学;2011年
4 丁静;疾控中心健康体检管理系统及其数据分析[D];河北科技大学;2012年
5 彭程;数据挖掘中分类算法的研究[D];长沙理工大学;2006年
6 琚锋;基于成矿区带基础数据库的空间数据挖掘技术研究[D];中国地质大学;2007年
7 云玉屏;基于C4.5算法的数据挖掘应用研究[D];哈尔滨理工大学;2008年
8 肖建国;数据挖掘技术在就业指导与本科教学改革工作中的应用研究[D];吉林大学;2008年
9 刘华;数据挖掘技术在公安犯罪行为分析中的应用研究[D];湖南大学;2008年
10 李周恒;基于WEB的军事医学文献检索系统设计与实现[D];第四军医大学;2009年
【参考文献】
中国期刊全文数据库 前10条
1 张永平,童小娇,倪以信,陈寿孙,吴复立;基于半光滑牛顿法的可用输电能力新算法[J];电力系统自动化;2004年07期
2 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
3 周皓峰,朱扬勇,施伯乐;一个基于兴趣度的关联规则采掘算法[J];计算机研究与发展;2002年04期
4 宫秀军,孙建平,史忠植;主动贝叶斯网络分类器[J];计算机研究与发展;2002年05期
5 李雄飞,苑森淼,董立岩,全勃;多段支持度数据挖掘算法研究[J];计算机学报;2001年06期
6 毛国君,刘椿年;基于项目序列集操作的关联规则挖掘算法[J];计算机学报;2002年04期
7 宫秀军,刘少辉,史忠植;一种增量贝叶斯分类模型[J];计算机学报;2002年06期
8 张朝晖,陆玉昌,张钹;利用神经网络发现分类规则[J];计算机学报;1999年01期
9 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
10 路松峰,卢正鼎;快速开采最大频繁项目集[J];软件学报;2001年02期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
3 赵群礼;;基于FP-Tree的最大频繁项目集综合更新算法[J];安徽教育学院学报;2006年03期
4 赵群礼;卢朴;;基于T-tree的最大频繁项目集挖掘算法[J];合肥师范学院学报;2009年06期
5 陈征;;一类系统的二次李雅普诺夫函数存在性的判断[J];安徽电子信息职业技术学院学报;2006年04期
6 凌旺福;姚远;;基于ASP的基层农网建站与维护[J];安徽电子信息职业技术学院学报;2009年02期
7 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
8 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
9 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
10 孙小军;焦建民;何俊红;;解优化问题的遗传加速信赖域搜索算法[J];安徽大学学报(自然科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 杨波;秦锋;程泽凯;;一种新的分类学习系统评估度量[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
5 刘钰;韩峰;董楠;陆希成;雷鸣;;爆炸容器安全概率的统计分析方法[A];全国危险物质与安全应急技术研讨会论文集(下)[C];2011年
6 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
7 赵越岭;王英丽;;基于粗糙集感应电动机故障诊断决策规则分析[A];第二十七届中国控制会议论文集[C];2008年
8 ;Gas Thickness On-line Monitoring Instrument Design Based on BP Neural Network[A];第二十七届中国控制会议论文集[C];2008年
9 姚智颖;刘冬;;基于Kazakov线性化的迭代滤波[A];第二十九届中国控制会议论文集[C];2010年
10 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
3 刘家国;基于突发事件风险的供应链利益分配与行为决策研究[D];哈尔滨工程大学;2010年
4 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
5 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
6 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
7 刘冬雁;川西高原甘孜黄土记录的早更新世晚期以来的古气候变化[D];中国海洋大学;2009年
8 王敏;分布式电源的概率建模及其对电力系统的影响[D];合肥工业大学;2010年
9 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
10 李方义;区间非概率多目标优化设计方法及其在车身设计中的应用[D];湖南大学;2010年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 张小亮;非线性规划的信赖域算法[D];河南理工大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
5 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
6 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
7 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
8 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
9 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
10 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 吴小培,费勤云;一种提高BP算法学习速度的有效途径[J];安徽大学学报(自然科学版);1998年03期
3 唐永成,曹静平,高章红;安徽东部地区金矿资源GIS评价[J];安徽地质;2000年02期
4 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
5 江效尧,江伟;决策树在数据挖掘中的应用研究[J];安庆师范学院学报(自然科学版);2003年01期
6 刘为民,何平,张钊;土体导热系数的评价与计算[J];冰川冻土;2002年06期
7 张立新,陶兆祥,顾同欣;氯化钠的掺入对冻土基本热学性质的影响[J];冰川冻土;1995年01期
8 李凯,黄厚宽;支持向量机增量学习算法研究[J];北方交通大学学报;2003年05期
9 杨特;;SQL Server数据库安全规划策略[J];办公自动化;2007年04期
10 吴少敏,冯建生;宝钢数据挖掘系统[J];宝钢技术;2001年01期
中国重要会议论文全文数据库 前1条
1 檀海仁;;电信运营企业集团客户的精细化营销[A];中国通信学会第五届学术年会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
2 谭征兵;矿产资源GIS评价系统及成矿预测BP模型[D];中国地质大学(北京);2003年
3 乔斌;粗糙集理论分层递阶约简算法的研究[D];浙江大学;2003年
4 李秋丹;数据挖掘相关算法的研究与平台实现[D];大连理工大学;2004年
5 佟春生;复杂性理论在河川径流时间序列分析中的应用研究[D];西安理工大学;2005年
6 王占全;基于地理信息系统空间数据挖掘若干关键技术的研究[D];浙江大学;2005年
7 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
8 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
9 王庆东;基于粗糙集的数据挖掘方法研究[D];浙江大学;2005年
10 张治国;人工神经网络及其在地学中的应用研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
2 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
3 刘晓霞;数据挖掘技术在高校教学管理系统中的应用研究[D];中国海洋大学;2010年
4 武毅;赤峰医院体检管理系统开发及应用研究[D];大连海事大学;2010年
5 刘骏峰;综合性医院体检中心业务流程重组研究[D];华中科技大学;2010年
6 詹引;基于数据挖掘技术的个性化健康体检套餐设计[D];华中科技大学;2010年
7 李满启;基于模拟器训练的海员避碰行动及相关因素综合分析[D];大连海事大学;2002年
8 孙超利;数据挖掘决策树方法的研究与应用[D];河海大学;2003年
9 黄进;关联规则数据挖掘算法的研究[D];西南交通大学;2003年
10 孙建国;空间数据挖掘技术在林业中的应用[D];西北师范大学;2003年
【二级引证文献】
中国期刊全文数据库 前6条
1 刘耀南;;浅析数据挖掘及其应用[J];电脑知识与技术;2010年33期
2 方德坚;游景升;;应用决策树C4.5算法在电视用户收视行为之研究[J];哈尔滨师范大学自然科学学报;2011年03期
3 卢媛媛;张剑;何海燕;;基于WEKA的客户分类信息系统研究[J];计算机工程与科学;2011年05期
4 孙浩军;游俊斌;吴廷发;;基于粗糙集的高维分类型数据子空间聚类算法[J];汕头大学学报(自然科学版);2012年04期
5 唐德权;张悦;贺永恒;肖自红;;基于图数据挖掘算法的犯罪规律研究及应用[J];计算机技术与发展;2011年11期
6 谢秦川;;数据挖掘技术在经济犯罪侦查中的研究与应用[J];信息网络安全;2012年12期
中国硕士学位论文全文数据库 前10条
1 王宏磊;SNMP安全态势信息获取及分析技术[D];哈尔滨工程大学;2010年
2 朱慧敏;江西省计量测试研究院综合管理数据平台建设研究[D];南昌大学;2010年
3 苏亚丁;基于决策树的数据挖掘技术在口腔诊疗中的应用[D];河北科技大学;2010年
4 孙丽;基于ERPⅡ的应收账款协同管理平台研究[D];暨南大学;2011年
5 陈林;高校人事管理信息系统的设计与实现[D];华东师范大学;2011年
6 郭文政;通用数据挖掘系统平台的设计与实现[D];南京信息工程大学;2011年
7 沈懿卓;基于数据挖掘技术的高校《就业指导》网络课程建设研究[D];上海师范大学;2011年
8 司桂琴;基于GIS数据库的数据挖掘研究[D];新疆大学;2011年
9 闫甜;基于BP神经网络的中国股市预测[D];华南理工大学;2011年
10 崔莹;多源地质空间数据挖掘方法及应用[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 刁勤华,默哈莫德·夏班,倪以信;运用连续二次规划法计算区域间极限传输容量[J];电力系统自动化;2000年24期
2 刘皓明,严正,倪以信,吴军基,邹云,吴复立;快速计算电网可用输电能力的交流灵敏度方法[J];电力系统自动化;2003年19期
3 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
4 周斌,吴泉源,高洪奎;序列模式挖掘的增量式算法的设计原则[J];计算机研究与发展;2000年10期
5 程继华,郭建生,施鹏飞;挖掘所关注规则的多策略方法研究[J];计算机学报;2000年01期
6 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
7 胡侃,夏绍玮;基于大型数据仓库的数据采掘:研究综述[J];软件学报;1998年01期
8 冯玉才,冯剑琳;关联规则的增量式更新算法[J];软件学报;1998年04期
9 王晓峰,尹丹娜,郑诗诠;相关集合论(英文)[J];沈阳化工学院学报;1999年01期
10 杨学兵,高俊波,蔡庆生;可增量更新的关联规则挖掘算法[J];小型微型计算机系统;2000年06期
【相似文献】
中国期刊全文数据库 前10条
1 刘秀峰 ,詹秀菊;面向电子商务的数据挖掘技术[J];现代通信;2003年06期
2 孙京兰;;OLAP技术及数据挖掘 技术[J];中文信息;2003年04期
3 冯进;利用数据挖掘技术 深入挖掘图书馆工作[J];现代情报;2005年03期
4 王小燕;数据挖掘技术在超市中的应用研究[J];商场现代化;2005年05期
5 方忠祥,屠立;数据挖掘技术在客户关系管理中的应用研究[J];机床与液压;2005年06期
6 龙腾芳;数据挖掘技术在农业领域中的应用研究[J];微计算机信息;2005年08期
7 周勇;数据挖掘技术发展综述[J];中国科技信息;2005年16期
8 徐守军,高波,甄蓓,彭奕,王东根,王玉民,吴乐山;数据挖掘技术在科研管理中应用前景初探[J];中华医学科研管理杂志;2005年04期
9 张特来,刘万军;数据挖掘在医学领域的应用研究[J];自动化技术与应用;2005年10期
10 杨小云;;数据挖掘在图书馆中的应用[J];渭南师范学院学报;2005年S2期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 罗可;数据库中数据挖掘理论方法及应用研究[D];湖南大学;2005年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 郭跃斌;基于序列模式的正负关联规则挖掘技术[D];山东轻工业学院;2008年
2 赵园园;加权负关联规则挖掘技术的研究[D];山东轻工业学院;2009年
3 陶芳;关系数据挖掘的正负关联规则挖掘算法[D];哈尔滨理工大学;2009年
4 赵龙;基于负关联规则分类技术的研究[D];山东轻工业学院;2009年
5 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
6 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
7 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
8 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
9 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
10 袁明;基于网格的数据挖掘应用研究[D];西安电子科技大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026