粗糙集扩展模型及其在数据挖掘中的应用研究
【摘要】:
数据挖掘和知识发现是从数据中获取知识的一种新技术。粗糙集作为一种处理不完全、不精确及不确定信息的有效方法,在数据挖掘和知识发现领域大有用武之地。粗糙集方法的成功应用很大程度上依赖于其理论的完善,只有深入地研究粗糙集的理论体系,才能将之更有效地应用到实际领域。本文以国家自然科学基金项目“管理决策中数据仓库与数据挖掘新技术研究”为背景,从理论和应用两个方面较全面和系统地阐述了这一理论的研究内容和方法。完成的工作和取得的创新性成果在于:
经过对粗糙集理论的深入研究,作者找到了粗糙集与模态逻辑、模糊集、代数系统和区间集代数等抽象理论之间的关系,一是粗糙集可以为抽象理论提供语义解释,从而使我们能更好地理解掌握这些抽象理论;二是粗糙集建立了各个独立的抽象理论之间的内在关系,使彼此独立的抽象理论联系在了一起。
作者研究了粗糙集扩展理论,提出了一种多层粗糙集模型CBM-RS。该模型是一种基于覆盖的扩展的多层粗糙集模型。经过验证,二元自反关系序列下的多层粗糙集模型是CBM-RS模型的特例。CBM-RS模型突破了局限在二元关系之上的多层粗糙集模型的研究。另外,作者提出了基于分类正确度的粗糙集模型,该模型已用于作者研制的数据挖掘方法MIE-RS上。
作者提出了从不一致决策表中挖掘最简规则的粗糙集方法MIE-RS。通过分类正确度有效处理了决策表的不一致性,采用启发式算法,挖掘出满足给定精确度的最简产生式规则知识。作者构造了Hash函数来实现算法,有效降低了算法的时间复杂度。并用多个UCI数据集进行了测试,与著名的Rosetta软件进行了实验对比,结果说明MIE-RS可以大大提高总的数据约简量,有效地简化最终得到的规则知识。
作者提出了有序信息表上的数据分析与数据挖掘模型OITM。从数据挖掘的角度考虑对象排序问题,通过引进属性值上的有序关系,作者扩充了常见的属性值方法,提出了有序信息表的形式化概念,进而提出了一个有序信息表上的数据分析方法,通过分析有序信息表中的属性依赖,定义了有序信息表的约简集和核的概念;作者还提出和形式化了有序信息表中挖掘有序规则的问题,设计了有序决策逻辑语言(ODL),并给出了一个挖掘有序规则的方法。基于有序关系来挖掘有序规则可看作是粗糙集模型的非等价关系扩展的一个具体应用实例。
本文的研究成果,对于拓宽粗糙集的理论及粗糙集在数据挖掘中的应用,有一定的理论和实践意义。
|
|
|
|
1 |
许中卫,李龙澍;基于粗糙集理论的数据挖掘算法研究[J];微机发展;2001年01期 |
2 |
胡彧;张亦军;杨冬梅;;粗糙集结合遗传算法在数据挖掘中的应用[J];计算机应用;2006年S1期 |
3 |
李智玲;张亦军;胡彧;;基于粗糙集的遗传算法在数据挖掘中的应用[J];科技情报开发与经济;2009年09期 |
4 |
范娟;王红艳;;知识发现中的数据离散化处理[J];保定师范专科学校学报;2006年02期 |
5 |
谭耀武;;基于数据挖掘粗糙集技术的电信运营商客户价值评价[J];沿海企业与科技;2006年01期 |
6 |
张文宇;;一种基于有序属性决策系统分类规则提取策略[J];控制理论与应用;2007年02期 |
7 |
时希杰,沈睿芳,吴育华;基于粗糙集理论的研究生招生预测[J];微计算机应用;2005年01期 |
8 |
胡启韬;袁志平;周忠海;;基于粗糙集和遗传算法的数据挖掘方法[J];电脑知识与技术;2008年11期 |
9 |
黄海云;;图书馆数据挖掘服务系统中粗糙集算法的原理及应用[J];河北工业科技;2010年05期 |
10 |
胡启韬;袁志平;周忠海;;基于粗糙集和遗传算法的数据挖掘方法[J];江西蓝天学院学报;2008年S1期 |
11 |
刘云枫;柯林;;一种改进的基于粗糙集的数据挖掘方法研究[J];情报杂志;2008年05期 |
12 |
汪小燕;;粗集结合决策树在高校图书馆中的应用[J];电脑学习;2008年05期 |
13 |
柳炳祥;邓欢军;高淑妍;陈欢欢;;基于数据挖掘的图书馆个性化服务系统[J];现代情报;2007年03期 |
14 |
唐少先;;数据挖掘中粗糙集边界的处理方法[J];计算机工程与应用;2010年07期 |
15 |
李永敏,朱善君,陈湘晖,张岱崎,韩曾晋;基于粗糙集理论的数据挖掘模型[J];清华大学学报(自然科学版);1999年01期 |
16 |
赵连胜,行飞;基于粗糙集面向属性的数据挖掘及改进[J];内蒙古大学学报(自然科学版);2002年01期 |
17 |
刘发升,杨惠;一种带松弛因子的统计粗糙集挖掘算法[J];计算机应用;2004年08期 |
18 |
赵广社,张希仁;数据挖掘中的统计方法概述[J];计算机测量与控制;2003年12期 |
19 |
罗新星,彭久生;基于粗糙集理论的数据挖掘方法在电子商务中的应用[J];科技情报开发与经济;2003年07期 |
20 |
孙涛;董立岩;李军;张羽翔;;用于粗糙集约简的并行算法[J];吉林大学学报(理学版);2006年02期 |
|