收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗糙集理论的数据挖掘算法研究

张静  
【摘要】:本论文研究课题源于国家973基础研究项目(No.2002CB312006)“Internet环境下基于Agent的软件中间件理论和方法研究”和国家自然基金项目(No.60473077)“水印关系数据库关键技术研究”。 近年来,随着我国信息化建设的快速发展,知识的自动获取已成为一种重要的技术手段。数据挖掘研究如何从大量的数据中智能地自动地抽取出有价值的知识和信息,因而成为当前人工智能研究中非常活跃的研究领域。粗糙集理论是一种有效地处理模糊性和不确定性问题的数学工具,为数据挖掘提供了新的思路和基础。本文的研究工作主要围绕基于粗糙集理论的数据挖掘,重点从基于粗糙集理论的特征选择和连续属性离散化两个方面展开。本文的主要创新性研究工作包括: 1) 提出了基于属性出现频率的属性约简算法,这种算法以条件属性在分辨矩阵中出现的频率作为启发信息,以条件属性所在最小分辨矩阵项的基数作为辅助启发信息,来寻找决策信息系统的最小约简。实验证明,大多数情况下该算法能够找到系统的最优(最小)约简。在没有找到最优约简的情况下,算法能够找到次优约简。 2) 分析属性约简中条件属性之间的关系以及约简集合中条件属性和决策属性之间的关系。在粗糙集理论的基础上给出了属性相关度的定义,并且根据这一定义,提出了基于属性相关度的属性约简算法。实验结果证明,这种算法能够有效地去除属性子集中的无关属性和冗余属性。 3) 提出了基于粗糙集理论的确定候选断点集合的新算法,该方法能够在保证系统分辨关系的前提下,大幅度的降低候选断点的数量,从而大幅度的减少了后继离散化算法的计算量。实验表明,这种确定候选断点集合的办法是切实可行的。 4) 提出了一种基于断点权重的启发式连续属性离散化方法。这种方法将连续属性的候选断点作为一个单个的条件属性,建立新的决策信息系统以考察每个候选断点对信息系统分辨能力的贡献。将断点在分辨矩阵中的出现频率作为断点的权值,寻找系统的最优断点集合。实验结果表明,此算法能在较好地保留原信息系统的分辨能力的同时,有效地解决离散化问题。 5) 提出了一种基于DBSCAN聚类的连续属性离散化算法。这种离散化算法,结合基于密度分布的聚类算法和粗糙集理论中属性依赖度的概念,通过对决策信息系统中的所有实例进行聚类来实现连续属性的离散化。实验表明,这种离散化


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 林治;张璇;;粗糙集理论的应用探析[J];邢台职业技术学院学报;2011年03期
2 唐云;罗俊松;;基于粗糙集和BP神经网络的文本分类研究[J];计算机仿真;2011年06期
3 潘承恩;;改进的小脑控制神经网络算法研究[J];计算机仿真;2011年07期
4 吴克寿;陈玉明;谢荣生;王晓栋;;基于粗糙集与蚁群优化算法的特征选择方法研究[J];计算机应用研究;2011年07期
5 段其昌;程有富;;粗糙集与决策树理论在输电线路巡检中的应用[J];计算机系统应用;2011年06期
6 张博;刘文奇;周智超;周胜根;;基于粗糙集的私家车潜在消费群体研究[J];科学技术与工程;2011年21期
7 霍桂利;;粗糙集理论的研究述评[J];山西广播电视大学学报;2011年05期
8 朱颢东;李红婵;;基于互信息和粗糙集理论的特征选择[J];计算机工程;2011年15期
9 潘锋;王建东;牛奔;;基于谱分析的无监督特征选择算法[J];计算机应用;2011年08期
10 郑钟志;段鹏;杨景;;在Visual Basic环境下用粗糙集理论约简决策表属性[J];淮南师范学院学报;2011年03期
11 邹月青;;基于数据挖掘对垃圾短信识别模型的研究与应用——以某省移动公司为例[J];现代经济信息;2011年15期
12 欧萍;;粗糙集理论在关系数据库中的应用[J];电脑编程技巧与维护;2011年16期
13 徐晓蕾;张立群;刘镔;李栋;;基于流程挖掘的甄别正常与非正常案例的模型[J];计算机应用研究;2011年07期
14 马艳丽;曹燕燕;董蓓蓓;郑伟;;基于粗糙集理论的大学生成绩影响因素分析[J];河北北方学院学报(自然科学版);2011年04期
15 张齐;林媛媛;余国先;;一种基于图的特征选择方法[J];计算机工程与应用;2011年26期
16 吴萍;姜懿庭;;基于粗糙集和信息熵的入侵检测特征选择方法研究[J];云南民族大学学报(自然科学版);2011年04期
17 王桂娟;印鉴;詹卫许;;基于类别信息的特征子图选择策略[J];计算机科学;2011年08期
18 唐良玉;徐吉力;林菁;;基于一致性度量属性约简的决策树构建优化研究[J];计算机与现代化;2011年09期
19 郭辉;徐浩军;周莉;;粗糙集和区间数空袭目标威胁评估[J];火力与指挥控制;2011年09期
20 张明;唐振民;杨习贝;;不完备信息系统中的否定决策规则和知识约简[J];控制与决策;2011年06期
中国重要会议论文全文数据库 前10条
1 盛立;刘希玉;高明;;基于粗糙集理论的数据挖掘算法研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年
2 刘明亮;吴跃民;杨明;;基于粗糙集和云理论的土地适宜性评价模型的建立[A];2006年中国土地学会学术年会论文集[C];2006年
3 张文明;薛青;;粗糙集方法在作战仿真数据挖掘中的应用[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
4 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 李永敏;朱善君;吉吟东;陈湘晖;;一种基于近似推理的数据挖掘算法[A];1998中国控制与决策学术年会论文集[C];1998年
6 蒋苏萍;吴今培;;粗糙集神经网络的应用研究[A];中国运筹学会第八届学术交流会论文集[C];2006年
7 李天瑞;徐扬;;基于粗糙集的一种挖掘分类规则算法[A];2001年中国管理科学学术会议论文集[C];2001年
8 袁骏;孙进才;汪洋;;基于数据挖掘技术的水下目标识别[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
9 易向军;宋威;;数据挖掘技术在冶金MES中的应用探讨[A];冶金自动化信息网年会论文集[C];2004年
10 赵新刚;沈永清;;基于粗糙集理论的专有技术价值评估模型研究[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 张静;基于粗糙集理论的数据挖掘算法研究[D];西北工业大学;2006年
2 苏健;基于粗糙集的数据挖掘与决策支持方法研究[D];浙江大学;2002年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
5 郑文钟;基于数据挖掘和系统集成的农业机械化信息管理系统研究[D];浙江大学;2005年
6 王向阳;面向不确定性推理和数据分析的模式识别方法研究[D];上海交通大学;2006年
7 崔广才;基于粗糙集的数据挖掘方法研究[D];吉林大学;2004年
8 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
9 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
10 许琦;粗糙集理论在旋转机械故障诊断技术上应用的研究[D];南京工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 白燕娥;基于遗传算法的属性约简算法研究与实现[D];长春理工大学;2004年
2 黄文涛;在数据挖掘中概念格的理论研究[D];兰州理工大学;2007年
3 刘永军;大数据集的属性选择算法的研究与实现[D];东北大学;2005年
4 王昕娅;基于概念格模型的粗糙集约简方法研究[D];合肥工业大学;2006年
5 陈鑫影;基于粗糙集理论的约简算法研究[D];吉林大学;2005年
6 梁美莲;不完备信息系统中数据挖掘的粗糙集方法[D];广西大学;2005年
7 汪小燕;基于二进制可辨矩阵的属性约简研究[D];合肥工业大学;2006年
8 李雪斌;基于粗糙集理论的规则挖掘方法研究[D];江西师范大学;2002年
9 何国建;基于粗糙集理论与遗传算法的分类算法研究[D];西南交通大学;2005年
10 杨志勇;基于粗糙集的Web日志挖掘研究[D];兰州理工大学;2006年
中国重要报纸全文数据库 前10条
1 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
2 本报记者 郭白岩;大众点评网向数据挖掘要收益[N];中国经营报;2011年
3 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
4 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
5 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
6 ;数据挖掘流程[N];人民邮电;2001年
7 赵纪元;数据挖掘在CRM中的应用[N];人民邮电;2001年
8 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
9 黄献东;鞍钢冷轧厂实施数据挖掘系统项目[N];中国冶金报;2011年
10 刘光强;靠数据挖掘抓住客户的心[N];中国计算机报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978