收藏本站
《西安电子科技大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

KDD中的几个关键问题研究

陈莉  
【摘要】:I 摘 要 数据库中的知识发现(Knowledge Discovery in Database,KDD)是在应用需 求的背景下产生并迅速发展起来的、开发信息资源的一套科学方法、算法及软件 工具和环境,是集统计学、人工智能、模式识别、并行计算、机器学习、数据库 等技术的一个交叉性的研究领域。KDD 是识别有效的、新颖的、具有潜在用处 的可理解的数据模式的过程。一般地,KDD 由数据清理、数据集成、数据选择、 数据变换、数据挖掘、模式(型)评估、知识表示等过程组成。KDD 有三个重 要的环节,即数据预处理、数据挖掘和结果可视化。 本文在详细分析国内外 KDD 研究现状的基础上,借鉴生物进化、计算智能、 关系代数、petri 网等概念与理论,提出了基于自适应聚类、模糊聚类进行数据 预处理的算法;基于关系代数和自适应混合算法集成的关联规则挖掘算法、泛化 关联规则挖掘算法;分析了分类挖掘机理及文本分类与降维技术;针对现有的数 据挖掘结果的可视化理论及技术,提出了基于 petri 网的鲁棒性的、统一的可视 化模型;最后,实现了一个数据挖掘的应用实例,验证了文中有关算法和方法的 有效性。主要研究内容如下: (1)数据预处理是确保数据挖掘成功的关键,文中将数据库理论与自适应 并行优化算法相结合,给出了 KDD 与数据库/数据仓库无缝集成的 KDD 模型, 并提出了基于自适应聚类与并行优化算法混合的数据预处理算法。仿真实验证明 了算法的有效性,该算法可用于分类、聚类、关联规则等数据挖掘的预处理,并 可推广到不同类型数据的数据预处理中。 (2)在数据预处理的基础上,提出了利用关系代数理论、数据库与 KDD 协 同理论挖掘关联规则、泛化关联规则的算法,仿真结果表明了算法的有效性。与 经典的 Apriori 算法相比,该算法只需扫描一次数据库,具有良好的并行性和可 伸缩性,并易于推广到模糊关联规则的挖掘。 (3)分类是数据挖掘的主要应用之一。文中给出了分类挖掘的形式化定义, 分析了分类挖掘的基本机理。在此基础上,提出了一种 Web 文档分类的基本框 架,分析了用于文档分类的降维技术,给出了基于主分量分析和支撑矢量机的文 档分类的基本思想,分析了仿真实验的结果。 (4)数据挖掘结果及数据挖掘过程的可视化表示是 KDD 的又一个重要的组 成部分。在分析了现有可视化理论及表示方法的基础上,针对其不足,提出了用 petri 网表示挖掘过程及挖掘结果的统一的、鲁棒性的框架,该方法也适用于动 态规则的可视化表示。 (5)以陕北黄土高原多个地貌区为试验样区,在数字高程模型(DEM)所 提取的数据集的基础上,挖掘各种地形因子对平均坡度的影响程度(国家自然科 雷达信号处理国家重点实验室 WP=6 II KDD 中的几个关键问题研究 学基金项目(49971065)、国家高技术研究发展计划课题(2001AA130023)),以 建立适合黄土高原多种地貌类型的,DEM 所提取的地面坡度随分辨率与地形变 化的模型。实验结果具有很高的精度,证明了文中有关算法和方法的有效性。将 KDD 和数据挖掘理论与算法用于地学信息处理是一种新的尝试,挖掘结果既有 效地估算了地理空间数据的不确定性、非线性的关系特征,又从一个侧面揭示了 黄土高原 DEM 地形信息容量变化的规律性,为建立黄土高原地形信息图谱提供 了重要素材。
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前8条
1 胡相峰;基于约简频繁模式树的频繁模式挖掘及查询算法研究[D];天津理工大学;2011年
2 吴震;数据挖掘技术在电子文件管理中的应用研究[D];广西民族大学;2011年
3 魏晨辉;高端容错计算机故障日志分析系统的设计与实现[D];哈尔滨工业大学;2011年
4 许兴军;数据挖掘技术在证券市场分析中的应用研究[D];浙江大学;2012年
5 王荣;分类技术及其在客户关系管理中的应用[D];浙江大学;2006年
6 马融;基于知识管理的企业资源计划系统研究[D];西安电子科技大学;2006年
7 董宪;数据挖掘技术在CRM中的应用研究[D];山东科技大学;2006年
8 常浩;多最小支持度关联规则挖掘研究[D];西北大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
2 陈莉,王引弟,田兵权;基于校园网的教务管理信息系统[J];高等理科教育;2003年03期
3 陈莉,刘晓霞,张仲选,刘小宁;计算机专业基础课教学改革探索——从“计算机导论”和“离散数学”课谈起[J];高等理科教育;2004年02期
4 姜浩,罗军舟,方宁生;模糊Petri网在带权不精确知识表示和推理中的应用研究[J];计算机研究与发展;2000年08期
5 周斌,吴泉源,高洪奎;用户访问模式数据挖掘的模型与算法研究[J];计算机研究与发展;1999年07期
6 杨泽民,陈莉,范全润;加权关联规则的并行挖掘算法[J];计算机工程与应用;2003年08期
7 王志坚,蔡自兴;一种新的Petri网推理方法[J];计算机工程与科学;2002年02期
8 陈莉,王玲;数据采集的驱动技术[J];四川师范大学学报(自然科学版);1998年04期
9 陈莉;混合遗传算法及应用[J];四川师范大学学报(自然科学版);1998年05期
10 陈莉;数据挖掘与虚拟数据库[J];四川师范大学学报(自然科学版);1998年06期
【共引文献】
中国期刊全文数据库 前10条
1 吴大宏,赵人达;基于遗传算法与神经网络的桥梁结构健康监测系统研究初探[J];四川建筑科学研究;2002年03期
2 张安勤;数据挖掘与进化算法[J];安徽教育学院学报;2002年03期
3 王锦;;虚拟数据库及其在数据集成中的应用[J];安徽广播电视大学学报;2006年03期
4 程家兴,陈万里;列车控制问题的计算分析及自适应算法[J];安徽大学学报(自然科学版);2002年02期
5 蒋中;遗传算法在PID参数优化中的应用[J];安徽建筑工业学院学报(自然科学版);2000年01期
6 阮怀忠,张建中;基于改进遗传算法的TSP问题求解[J];安徽建筑工业学院学报(自然科学版);2003年04期
7 陈杰,周冬华;浮点数编码的遗传算法在模糊控制器参数寻优中的应用[J];安徽建筑工业学院学报(自然科学版);2004年02期
8 方潜生;硬件进化(EHW)的研究与进展[J];安徽建筑工业学院学报(自然科学版);2004年06期
9 杨益;;基于FPGA的背包问题的求解[J];安徽建筑工业学院学报(自然科学版);2010年04期
10 刘艳华;张承中;王小平;龚葳;;基于遗传神经网络的采暖季PM_(10)浓度预测[J];安徽农业科学;2009年16期
中国重要会议论文全文数据库 前10条
1 杨益;方潜生;汪力君;;基于Handel-C的数字芯片的设计方法研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 胡杨林;蒋洁琼;王明煌;曾勤;邱岳峰;邹俊;陈红丽;FDS team;;聚变裂变混合堆长寿命锕系废料嬗变处理的中子学优化分析[A];安徽新能源技术创新与产业发展博士科技论坛论文集[C];2010年
4 孙燕;孙峥;黄鹍;;基于模拟退火机制的隔离小生境混合遗传算法[A];第二十六届中国控制会议论文集[C];2007年
5 孙燕;孙峥;;利用正交遗传算法优化交通检测点分布[A];第二十六届中国控制会议论文集[C];2007年
6 郭玉堂;刘路路;;基于佳点集遗传算法的边缘检测[A];第二十七届中国控制会议论文集[C];2008年
7 刘向;邹逢兴;张湘平;高政;;面向节能的混合流水车间调度方法的研究[A];第二十七届中国控制会议论文集[C];2008年
8 龚涛;杜常兴;;免疫计算研究的进展[A];中国自动化学会控制理论专业委员会A卷[C];2011年
9 汪民乐;高晓光;;GA早熟问题的定量分析及其预防策略[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
10 田占东;张振宇;;用遗传算法确定反应速率方程参数[A];第三届全国爆炸力学实验技术交流会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
2 韩艳玲;可能性构造空间理论与计算机作曲思维模型研究[D];华中科技大学;2010年
3 彭北青;第三方物流配送车辆路径问题模型及算法研究[D];华中科技大学;2009年
4 黄林峰;多目标进化算法研究[D];中国科学技术大学;2009年
5 刘飞;四足机器人步态规划与平衡控制研究[D];中国科学技术大学;2010年
6 魏建香;学科交叉知识发现及其可视化研究[D];南京大学;2010年
7 郑罡;频域有限差分方法的改进研究[D];电子科技大学;2010年
8 车勇;轮胎噪声的预测方法与试验研究及优化设计[D];武汉理工大学;2010年
9 李正军;林—浆—纸产业集群供应链协同管理研究[D];中南林业科技大学;2010年
10 殷源;干涉型集成光波导器件设计与实验研究[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 赫英毅;毫米波段基于TE_(21)模差网络设计[D];中国工程物理研究院;2009年
2 万成;动态环境下的元胞遗传算法研究[D];南昌航空大学;2010年
3 李坤;参数参与进化的自适应遗传算法研究[D];南昌航空大学;2010年
4 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
5 王辉;基于改进遗传算法的物流配送路径优化研究[D];山东科技大学;2010年
6 纪二云;基于改进遗传算法的电力系统无功优化的研究[D];山东科技大学;2010年
7 施晓坤;煤炭企业人才结构优化[D];山东科技大学;2010年
8 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
9 刘建东;基于Web访问信息挖掘的数字图书馆个性化服务研究[D];浙江理工大学;2010年
10 马宗梅;遗传算法在考试系统组卷中的应用与研究[D];郑州大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 王淑改;;浅谈企业电子文件的归档和管理[J];北京档案;2010年12期
2 刘永山,汤毅,陈雯柏,曾昭天;数据挖掘技术的研究[J];重庆工业高等专科学校学报;2003年02期
3 赵慧;;浅谈档案信息资源的开发利用[J];档案管理;2007年06期
4 黄萃;从法律角度探讨电子文件的保护[J];档案学通讯;2002年01期
5 徐绍敏;档案馆开发利用面临的窘境及对策[J];档案学通讯;2003年01期
6 李欣;当代档案信息资源开发研究[J];档案学通讯;2003年05期
7 何嘉荪,史习人;对电子文件必须强调档案化管理而非归档管理[J];档案学通讯;2005年03期
8 郑向阳;数据挖掘技术及其在城建档案信息服务中的应用[J];档案学通讯;2005年03期
9 肖文建,胡誉耀;对档案信息资源开发利用的启示阮冈纳赞图书馆学五定律[J];档案学通讯;2005年05期
10 史江;李金峰;;档案利用信息反馈工作的问题与对策探讨[J];档案学通讯;2007年03期
中国博士学位论文全文数据库 前5条
1 陈元;基于分类模型的知识发现过程研究[D];国防科学技术大学;2002年
2 李仁璞;分类数据挖掘中若干基本问题的研究[D];天津大学;2003年
3 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
4 李秀敏;极值统计模型族的参数估计及其应用研究[D];天津大学;2007年
5 丁艳辉;面向Web数据集成的数据抽取问题研究[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 颜焱;构建基于数据挖掘的客户关系管理系统[D];国防科学技术大学;2002年
2 黄海龙;面向CRM的分类算法及应用研究[D];重庆大学;2002年
3 林萍;数据挖掘技术在超市数据仓库中的应用研究[D];大连海事大学;2003年
4 王芳;基于数据挖掘的客户流失预测研究[D];西南师范大学;2003年
5 贾琳;数据挖掘技术及应用的研究[D];兰州理工大学;2003年
6 文专;基于神经网络的分类数据挖掘属性选择和规则抽取研究[D];天津大学;2004年
7 姜卯生;数据挖掘中基于贝叶斯技术的分类问题的研究[D];合肥工业大学;2004年
8 孙燕;CRM数据挖掘中的可拓算法[D];大连海事大学;2004年
9 陈云樱;数据挖掘技术在移动通信行业客户关系管理中的应用研究[D];西南交通大学;2004年
10 魏兵;数据挖掘技术在客户关系管理中的应用研究[D];南京理工大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 孙志刚;朱小冬;曲长征;;基于关联规则挖掘的维修专业合并研究[J];装备指挥技术学院学报;2011年06期
中国硕士学位论文全文数据库 前10条
1 潘小美;我国客运专线客户分类问题研究[D];北京交通大学;2011年
2 刘畅;数据挖掘在移动通信CRM中的应用[D];北京邮电大学;2011年
3 董宪;数据挖掘技术在CRM中的应用研究[D];山东科技大学;2006年
4 王浩;数据挖掘在客户价值管理中的应用研究[D];华中师范大学;2007年
5 戴科星;客户行为变化中关联规则挖掘的研究与应用[D];浙江工业大学;2007年
6 陈敏;CRM客户知识建模和客户分析研究[D];东华大学;2008年
7 王永杰;我国铁路货运客户服务中心相关问题研究[D];北京交通大学;2008年
8 王宽;基于知识管理的项目绩效评估建模研究与实现[D];西安建筑科技大学;2008年
9 华锐;某师范院校研究生就业意愿的调查研究[D];华中师范大学;2008年
10 段蕾;数据挖掘分类技术及其在CRM中的应用研究[D];合肥工业大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
2 张讲社,徐宗本,梁怡;整体退火遗传算法及其收敛充要条件[J];中国科学E辑:技术科学;1997年02期
3 庆胜,邬学礼;模糊Petri网在FMS故障诊断中的应用研究[J];计算机研究与发展;1998年04期
4 周斌,吴泉源,高洪奎;用户访问模式数据挖掘的模型与算法研究[J];计算机研究与发展;1999年07期
5 张宜红;樊惠娟;王能斌;;数据仓库的实现技术[J];计算机科学;1998年02期
6 林闯,陆维明;Petri网用于表示知识[J];计算机学报;1992年01期
7 周奕,吴时霖;基于归结反演的Petri网推理新方法[J];计算机学报;1997年03期
8 王雪梅,王义和;模拟退火算法与遗传算法的结合[J];计算机学报;1997年04期
9 何新贵;模糊Petri网[J];计算机学报;1994年12期
10 林闯;基于案例推理系统的Petri网模型[J];计算机学报;1994年S1期
【相似文献】
中国期刊全文数据库 前10条
1 施润身,赵青;改进的关联规则采掘算法及其实现[J];同济大学学报(自然科学版);2002年02期
2 丁振国,陈静;基于关联规则的个性化推荐系统[J];计算机集成制造系统-CIMS;2003年10期
3 汪洪涛,刘文才;数据挖掘技术关联规划算法在营销策略中的应用[J];工业控制计算机;2003年09期
4 田生伟,禹龙;关联规则挖掘在成绩录入、校对系统中的应用[J];微机发展;2003年08期
5 朱红蕾,李明;维护关联规则的算法研究[J];兰州理工大学学报;2004年05期
6 朱玉全,宋余庆,陈耿;关联规则挖掘中增量式更新算法的研究[J];计算机工程与应用;2005年15期
7 雷红艳,邹汉斌;无最小支持度的关联规则挖掘方法[J];湖南文理学院学报(自然科学版);2005年02期
8 郑玮;;基于Web日志挖掘的关联规则算法研究[J];软件导刊;2008年10期
9 程继华,施鹏飞;概念指导的关联规则的挖掘[J];计算机研究与发展;1999年09期
10 倪志伟,蔡庆生;用神经网络来进行数据库中的知识发现(英文)[J];安徽大学学报(自然科学版);2000年03期
中国重要会议论文全文数据库 前10条
1 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 周水庚;胡运发;陶晓鹏;;分布数据库关联规则的递增挖掘[A];第十五届全国数据库学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 记者 文艳;教育部与我市合建西电科大[N];西安日报;2007年
2 贾志敏 秦 明;用网络传递国情校情友情[N];陕西日报;2005年
3 别卫青;校园里的健身俱乐部[N];中国体育报;2004年
4 记者 侯树金;厚重文化引纳人才[N];西安日报;2007年
5 强建周 秦明 柯昌万;夯实工程教育的根基[N];中国教育报;2006年
6 强建周 秦明 张哲浩;夯实工程教育根基[N];科技日报;2006年
7 记者 文艳;市政协委员视察我市节能减排工作[N];西安日报;2008年
8 实习生 李萌 本报记者 李凝;一流大学是我们的努力方向[N];科技日报;2002年
9 本报记者 柯昌万 通讯员 强建周;给学生一碗“心灵鸡汤”[N];中国教育报;2004年
10 本报记者 柯昌万 通讯员 秦明;凝聚在党的旗帜下[N];中国教育报;2003年
中国博士学位论文全文数据库 前10条
1 陈莉;KDD中的几个关键问题研究[D];西安电子科技大学;2003年
2 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
3 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
4 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
5 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
6 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
7 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
8 王春雨;刑事案件关联分析与防控警务模式研究[D];大连理工大学;2010年
9 赵春;基于数据挖掘技术的财务风险分析与预警研究[D];北京化工大学;2012年
10 李学明;计算机数据的关联规则挖掘理论和算法研究[D];重庆大学;2003年
中国硕士学位论文全文数据库 前10条
1 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
2 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
3 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
4 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
5 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
6 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
7 吴倩;基于关联规则的零售业CRM的设计和实现[D];华东师范大学;2011年
8 孙彤;活性炭纤维吸附和解吸中的数据挖掘技术[D];辽宁工程技术大学;2004年
9 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年
10 王玉荣;关联规则挖掘算法在大数据集上的应用研究[D];江南大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026