收藏本站
《西安电子科技大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

KDD中的几个关键问题研究

陈莉  
【摘要】:I 摘 要 数据库中的知识发现(Knowledge Discovery in Database,KDD)是在应用需 求的背景下产生并迅速发展起来的、开发信息资源的一套科学方法、算法及软件 工具和环境,是集统计学、人工智能、模式识别、并行计算、机器学习、数据库 等技术的一个交叉性的研究领域。KDD 是识别有效的、新颖的、具有潜在用处 的可理解的数据模式的过程。一般地,KDD 由数据清理、数据集成、数据选择、 数据变换、数据挖掘、模式(型)评估、知识表示等过程组成。KDD 有三个重 要的环节,即数据预处理、数据挖掘和结果可视化。 本文在详细分析国内外 KDD 研究现状的基础上,借鉴生物进化、计算智能、 关系代数、petri 网等概念与理论,提出了基于自适应聚类、模糊聚类进行数据 预处理的算法;基于关系代数和自适应混合算法集成的关联规则挖掘算法、泛化 关联规则挖掘算法;分析了分类挖掘机理及文本分类与降维技术;针对现有的数 据挖掘结果的可视化理论及技术,提出了基于 petri 网的鲁棒性的、统一的可视 化模型;最后,实现了一个数据挖掘的应用实例,验证了文中有关算法和方法的 有效性。主要研究内容如下: (1)数据预处理是确保数据挖掘成功的关键,文中将数据库理论与自适应 并行优化算法相结合,给出了 KDD 与数据库/数据仓库无缝集成的 KDD 模型, 并提出了基于自适应聚类与并行优化算法混合的数据预处理算法。仿真实验证明 了算法的有效性,该算法可用于分类、聚类、关联规则等数据挖掘的预处理,并 可推广到不同类型数据的数据预处理中。 (2)在数据预处理的基础上,提出了利用关系代数理论、数据库与 KDD 协 同理论挖掘关联规则、泛化关联规则的算法,仿真结果表明了算法的有效性。与 经典的 Apriori 算法相比,该算法只需扫描一次数据库,具有良好的并行性和可 伸缩性,并易于推广到模糊关联规则的挖掘。 (3)分类是数据挖掘的主要应用之一。文中给出了分类挖掘的形式化定义, 分析了分类挖掘的基本机理。在此基础上,提出了一种 Web 文档分类的基本框 架,分析了用于文档分类的降维技术,给出了基于主分量分析和支撑矢量机的文 档分类的基本思想,分析了仿真实验的结果。 (4)数据挖掘结果及数据挖掘过程的可视化表示是 KDD 的又一个重要的组 成部分。在分析了现有可视化理论及表示方法的基础上,针对其不足,提出了用 petri 网表示挖掘过程及挖掘结果的统一的、鲁棒性的框架,该方法也适用于动 态规则的可视化表示。 (5)以陕北黄土高原多个地貌区为试验样区,在数字高程模型(DEM)所 提取的数据集的基础上,挖掘各种地形因子对平均坡度的影响程度(国家自然科 雷达信号处理国家重点实验室 WP=6 II KDD 中的几个关键问题研究 学基金项目(49971065)、国家高技术研究发展计划课题(2001AA130023)),以 建立适合黄土高原多种地貌类型的,DEM 所提取的地面坡度随分辨率与地形变 化的模型。实验结果具有很高的精度,证明了文中有关算法和方法的有效性。将 KDD 和数据挖掘理论与算法用于地学信息处理是一种新的尝试,挖掘结果既有 效地估算了地理空间数据的不确定性、非线性的关系特征,又从一个侧面揭示了 黄土高原 DEM 地形信息容量变化的规律性,为建立黄土高原地形信息图谱提供 了重要素材。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 施润身,赵青;改进的关联规则采掘算法及其实现[J];同济大学学报(自然科学版);2002年02期
2 丁振国,陈静;基于关联规则的个性化推荐系统[J];计算机集成制造系统-CIMS;2003年10期
3 汪洪涛,刘文才;数据挖掘技术关联规划算法在营销策略中的应用[J];工业控制计算机;2003年09期
4 田生伟,禹龙;关联规则挖掘在成绩录入、校对系统中的应用[J];微机发展;2003年08期
5 朱红蕾,李明;维护关联规则的算法研究[J];兰州理工大学学报;2004年05期
6 朱玉全,宋余庆,陈耿;关联规则挖掘中增量式更新算法的研究[J];计算机工程与应用;2005年15期
7 雷红艳,邹汉斌;无最小支持度的关联规则挖掘方法[J];湖南文理学院学报(自然科学版);2005年02期
8 郑玮;;基于Web日志挖掘的关联规则算法研究[J];软件导刊;2008年10期
9 程继华,施鹏飞;概念指导的关联规则的挖掘[J];计算机研究与发展;1999年09期
10 倪志伟,蔡庆生;用神经网络来进行数据库中的知识发现(英文)[J];安徽大学学报(自然科学版);2000年03期
11 王新,李作成;不可约关联规则及其应用[J];计算机应用;2001年07期
12 宋爱波,董逸生,赵茂先;稠密数据库有趣规则的快速挖掘[J];小型微型计算机系统;2001年07期
13 宁玉杰,郭晓淳;基于数据挖掘技术的网络入侵检测系统[J];计算机测量与控制;2002年03期
14 陈子阳,郭景峰;多层次关联规则的快速挖掘算法[J];燕山大学学报;2003年04期
15 王新;不完全数据库中关联规则的两种求估方法[J];计算机应用;2004年08期
16 何中胜,刘宗田;一种无候选集产生的并行关联规则挖掘算法[J];计算机工程与应用;2004年24期
17 张兆功,李建中,张艳秋;海量数据上挖掘关联规则的并行算法[J];哈尔滨工业大学学报;2004年05期
18 王芳,王万森;关系数据库中关联规则挖掘的一种高效算法[J];微机发展;2004年09期
19 周涛,陆惠玲;关联规则挖掘算法研究[J];齐齐哈尔大学学报;2004年03期
20 周涛,岳振才;基于改进遗传算法的关联规则挖掘[J];陕西工学院学报;2004年03期
中国重要会议论文全文数据库 前10条
1 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 周水庚;胡运发;陶晓鹏;;分布数据库关联规则的递增挖掘[A];第十五届全国数据库学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 记者 文艳;教育部与我市合建西电科大[N];西安日报;2007年
2 贾志敏 秦 明;用网络传递国情校情友情[N];陕西日报;2005年
3 别卫青;校园里的健身俱乐部[N];中国体育报;2004年
4 记者 侯树金;厚重文化引纳人才[N];西安日报;2007年
5 强建周 秦明 柯昌万;夯实工程教育的根基[N];中国教育报;2006年
6 强建周 秦明 张哲浩;夯实工程教育根基[N];科技日报;2006年
7 记者 文艳;市政协委员视察我市节能减排工作[N];西安日报;2008年
8 实习生 李萌 本报记者 李凝;一流大学是我们的努力方向[N];科技日报;2002年
9 本报记者 柯昌万 通讯员 强建周;给学生一碗“心灵鸡汤”[N];中国教育报;2004年
10 本报记者 柯昌万 通讯员 秦明;凝聚在党的旗帜下[N];中国教育报;2003年
中国博士学位论文全文数据库 前10条
1 陈莉;KDD中的几个关键问题研究[D];西安电子科技大学;2003年
2 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
3 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
4 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
5 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
6 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
7 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
8 王春雨;刑事案件关联分析与防控警务模式研究[D];大连理工大学;2010年
9 赵春;基于数据挖掘技术的财务风险分析与预警研究[D];北京化工大学;2012年
10 李学明;计算机数据的关联规则挖掘理论和算法研究[D];重庆大学;2003年
中国硕士学位论文全文数据库 前10条
1 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
2 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
3 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
4 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
5 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
6 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
7 吴倩;基于关联规则的零售业CRM的设计和实现[D];华东师范大学;2011年
8 孙彤;活性炭纤维吸附和解吸中的数据挖掘技术[D];辽宁工程技术大学;2004年
9 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年
10 王玉荣;关联规则挖掘算法在大数据集上的应用研究[D];江南大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978