收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于粒度计算模型的数据挖掘方法研究

周军  
【摘要】: 数据挖掘(Data Mining),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。分类是一类重要的数据挖掘问题,在商业领域中有着广泛的应用前景。首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。 粒度计算的思想产生于20世纪70年代,它的基本思想是模仿人类思考问题的方式:人类在思考和解决同一个问题时,或者是先从总体到局部进行观察、收集、分析各方面的情况;或者反之,从局部到总体收集数据;或者从各个角度对问题进行不同方面的了解,最后对它们进行综合分析。近年来,人们开始将粒度计算应用到数据挖掘领域中,并初步取得了一些成果,成为当前数据挖掘领域一个新的研究方向。 本文首先综述了数据挖掘的原理和现状,从数据挖掘和知识分类的角度,以粗糙集理论为基础,在粒度计算方法框架下,借鉴已有的软计算理论成果,做了一些相关的研究,主要的研究内容包括: (1)研究了基于决策树模型的信息系统分类问题。以粗糙集理论为基础,结合知识关系具有粒度性质的原理,从条件属性集和决策属性集之间关联度来选择决策属性集,从而定义了粒度商的概念。基于知识粗糙性的粒度原理,以决策树方法为理论基础,把粒度商的概念应用到决策树方法中,提出了一种新的构建决策树的方法。详细分析了该算法的优点。实例研究证明提出的基于粒度商的决策树构造算法是可靠有效的。 (2)研究了基于动态粒度理论的属性约简问题。粗糙集理论在对不精确、不确定和不完全的数据进行分类分析和知识获取中具有突出的优势。从粒度粗细的角度动态分析了粗糙集的边界域,结合属性关联的理论定义了动态粒度商的概念。依据粒度粗细的理论,提出了一种新的属性约简算法。采用动态粒度商法选择最优归约集,抛弃了传统的先求核心,再选择最优归约集的算法。实例研究证明提出的粒度计算方法是可靠有效的。 (3)研究了不完备信息系统的分类问题。根据人的认知规律,即人类可以利用有限的知识,在粗粒度层次上获取比较满意的结果,避免了在细粒度层次上的不完备性的特点。基于粒度计算模型,结合商空间和粗糙集理论,对缺省训练样本数据集进行投影和粗粒度处理,使得投影后的系统成为决策确定性系统。这样尽可能利用现有已知样本,采用多粒度层次的处理方法解决了不完备信息系统的分类问题,克服了现有大多数算法只能应用于完备信息系统的分类问题。 本文的创新点主要有: (1)从属性关联的角度,定义了粒度商的概念,应用于数据分类建模。 (2)从动态粒度的角度,采用动态粒度商法选择最优归约集。 (3)基于粒度计算模型,结合商空间和粗糙集理论应用于解决不完备信息系统的分类问题。 本文最后设计和开发一个基于教学质量管理的数据挖掘模型,应用本文算法进行属性约简和最优规则提取,部分实现该模型的功能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李玲俐;;数据挖掘中分类算法综述[J];重庆师范大学学报(自然科学版);2011年04期
2 王艳;;数据隐私保护技术综述[J];知识经济;2011年14期
3 杜垒;王飞;;数据挖掘在学生管理中的应用[J];科技信息;2011年18期
4 佟泽华;姚伟;陈全平;;基于DW+DM融合模式的企业竞争情报系统(E-CIS)研究[J];情报杂志;2011年07期
5 徐乾;王文剑;张文浩;;处理非平衡数据的粒度SVM学习方法[J];计算机工程与应用;2011年24期
6 吕刚;郑诚;胡春玲;;基于概念分类的多本体映射方法研究[J];计算机应用研究;2011年09期
7 张博;张超伟;;中药方剂数据挖掘中的数据预处理研究[J];电脑知识与技术;2011年17期
8 李炳燃;张金哲;;数据挖掘在设备故障诊断专家系统知识获取中的应用[J];科技信息;2011年20期
9 刘亚楠;;网络信息检索在统计中的应用[J];现代营销(学苑版);2011年08期
10 王颖洁;;模糊聚类分析在数据挖掘中的应用研究[J];大连大学学报;2011年03期
11 胡锟;杨路明;;浅谈移动CRM客户价值细分[J];电脑知识与技术;2011年13期
12 鹿莉霞;;关联规则在课程相关性分析中的应用[J];电脑知识与技术;2011年14期
13 李想;;PLE编码在关联数据挖掘中的应用[J];电脑知识与技术;2011年15期
14 华振楠;;多维度数据挖掘中目标相关维度选取方法对比[J];企业科技与发展;2011年10期
15 杜英;;关联规则挖掘研究[J];知识经济;2011年14期
16 李丹实;;使用SQL Server2005构建数据挖掘应用程序[J];煤炭技术;2011年07期
17 张红艳;都娟;;关联规则中Apriori算法的应用[J];数字技术与应用;2011年08期
18 吴旭东;柳炳祥;;聚类分析在高校图书馆管理中的应用[J];电脑开发与应用;2011年09期
19 吕鸣剑;;数据挖掘在知识工程中的应用研究[J];电脑知识与技术;2011年23期
20 熊芃;邓蓓;;数据挖掘在图书馆读者借阅系统中的应用[J];九江学院学报(自然科学版);2011年02期
中国重要会议论文全文数据库 前10条
1 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
2 易向军;宋威;;数据挖掘技术在冶金MES中的应用探讨[A];冶金自动化信息网年会论文集[C];2004年
3 余嘉元;;粗糙集在心理测量数据挖掘中的应用[A];第十届全国心理学学术大会论文摘要集[C];2005年
4 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
5 王令群;郑应平;周爱华;;数据挖掘技术在半导体生产过程数据分析中的应用[A];2005年中国智能自动化会议论文集[C];2005年
6 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
7 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
8 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
9 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
10 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
中国博士学位论文全文数据库 前10条
1 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
2 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
4 苏健;基于粗糙集的数据挖掘与决策支持方法研究[D];浙江大学;2002年
5 郑征;相容粒度空间模型及其应用研究[D];中国科学院研究生院(计算技术研究所);2006年
6 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
7 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
8 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
9 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
10 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
中国硕士学位论文全文数据库 前10条
1 周军;基于粒度计算模型的数据挖掘方法研究[D];江苏大学;2010年
2 魏悦亮;粗糙集在数据挖掘不确定性问题中的研究[D];中国石油大学;2010年
3 杨柳;基于粗糙集的数据挖掘技术研究及其在智能软件中的实现[D];电子科技大学;2004年
4 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
5 李萌;基于粗集理论的数据挖掘的数据预处理研究[D];华中师范大学;2004年
6 葛丽;粗糙集在海量科学数据挖掘中的应用[D];电子科技大学;2005年
7 马飞;基于数据挖掘的航运市场预测系统设计及研究[D];大连海事大学;2006年
8 王璿;数据挖掘与数据融合相结合的信息处理技术研究[D];西北工业大学;2006年
9 苏永昌;基于粒度原理的聚类分析及规则挖掘技术研究[D];武汉理工大学;2011年
10 吴文兵;粗糙集理论在关联规则挖掘中的应用[D];江西师范大学;2004年
中国重要报纸全文数据库 前10条
1 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
2 刘光强;靠数据挖掘抓住客户的心[N];中国计算机报;2009年
3 本报记者 郭白岩;大众点评网向数据挖掘要收益[N];中国经营报;2011年
4 本报记者 黎宇文;博时基金王德英: 数据挖掘促进基金精细化管理[N];中国证券报;2011年
5 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
6 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
7 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
8 ;数据挖掘流程[N];人民邮电;2001年
9 赵纪元;数据挖掘在CRM中的应用[N];人民邮电;2001年
10 黄献东;鞍钢冷轧厂实施数据挖掘系统项目[N];中国冶金报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978