收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于消错理论的数据挖掘错误系统优化方法及应用研究

周金革  
【摘要】:随着信息化和网络化的发展,大量的数据信息需要处理和分析。在挖掘这些信息过程中对错误信息的识别,分类,避免和消除显得至关重要,而要避免错误信息,排除错误信息,就得研究错误信息出现的原因及规律。出现错误信息后,要清除错误信息,也必须找出出错的原因及消除他们的方法。通常情况下,因为时间、空间的推移,挖掘条件和技术的改变,科学的发展等原因,一般对于一个无错误信息的信息系统、决策系统等都完全有可能变为一个有错误信息的信息系统、决策系统,这就需要人们不断消除不断发生的错误,同时不断优化数据挖掘方法。 1983年,我国学者郭开仲教授创立了消避错理论(消错理论),将人类对错误的认识和研究推进了一步。消避错理论主要采用数学(离散数学、模糊数学、高等数据、微分方程等)方法研究错误的定量化,采用系统(系统科学、系统工程、错误逻辑等)的方法研究错误的规律、关系和消避错方法。消避错理论的应用有:“十五、六、三”法理论和错误系统理论。 本论文的研究继承了消避错理论的研究成果,基于错误系统理论展开研究,在错误集、错误逻辑和错误矩阵理论的研究基础上,研究如何构建数据挖掘错误系统,并探讨该系统在计算机上实现的方法。以期通过数据挖掘错误系统的优化方法开发新的算法模型,用所建立的模型来探索数据挖掘出现错误的原因和规律。 首先,本论文从数据挖掘错误系统构建过程出发,以错误集、错误系统、错误集的变换、错误矩阵方程为基础,建立了基于消错理论的数据挖掘系统;讨论了错误子系统之间的关系和运算;给出了基于消错理论的数据挖掘关联错误函数的定义、分类、类型和基于消错理论的数据挖掘关联规则,研究了关联规则函数及其运算。通过研究错误数据处理方法,提出了在错误条件下数据处理的思路,给出了基于消错T变换的错误数据处理方法,及错误数据集的T变换及其T变换的类型。 其次,针对数据库的分类特性构建了消错分类数据挖掘,消错聚类数据挖掘,基于数据挖掘错误系统的决策树挖掘方法。给出了错误数据集分类,建立了消错聚类数据挖掘的关联错误函数,时空距聚类法、错误矩阵聚类法,并给出消错分类、聚类的具体步骤和原理;指出其在处理数据错误性的作用及其在优化数据挖掘系统的作用。 第三,基于错误集及模糊错误集,构建了动态信息下的数据挖掘错误系统,研究了论域、事物、量值、特性T变换下的时空数据挖掘错误系统优化;并讨论了它们的性质特性,定义了模糊错误数据集,多元错误数据集,具有临介点的多元错误数据集。 最后,通过两个案例描述分析,将数据挖掘错误系统的消错分类和消错聚类方法应用到案例研究中;构建了消错分类、消错聚类模型并使用R编程软件在计算机上实现,最终对案例进行了研究和分析,以辅助企业制定销售战略和研发战略。 本论文的创新性贡献包括:(1)在消错理论的基础上,探讨了错误数据集、模糊错误数据集、多元错误数据集、具有临界点的错误数据集,构建了数据挖掘错误系统,研究了动态信息下的错误数据挖掘错误系统,丰富和扩展了消错理论的成果。(2)通过数据挖掘方法与消错理论的结合,提出了消错分类数据挖掘方法模型、消错聚类数据挖掘方法模型,丰富和发展了数据挖掘方法,为后续的研究奠定了基础。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王宇,杨莉;数据挖掘及在英语借词分类中的应用[J];汕头大学学报(自然科学版);2002年02期
2 行智国;统计学与数据挖掘的比较分析[J];统计教育;2002年06期
3 汤建超;电子商务中的Web数据挖掘[J];南昌大学学报(理科版);2003年02期
4 林建勤,林筑英;数据挖掘与智能化信息处理研究[J];贵州大学学报(自然科学版);2003年03期
5 林琳;浅议在数据挖掘中应用抽样技术[J];江苏统计;2003年06期
6 张明昆;试论数据挖掘及其发展趋势[J];科技广场;2003年08期
7 夏幼明,解敏,周雯;数据挖掘方法分析与评价[J];云南师范大学学报(自然科学版);2003年02期
8 尹云飞,刘祥森;稳定性理论在数据挖掘中的应用[J];阜阳师范学院学报(自然科学版);2003年03期
9 王霞,郑丽英,李功振;基于粗集理论的数据挖掘的研究[J];甘肃科技;2004年02期
10 李金昌,徐雪琪;数据挖掘质量问题探讨[J];统计研究;2004年07期
11 朱书敏,张艳肖;数据挖掘在现代远程教育中应用的探讨[J];中国西部科技;2004年08期
12 宋莉芳,张阿兰,谢邦昌;数据挖掘与若干概念的异同[J];中国统计;2004年09期
13 李新仕;数据挖掘在商务中的应用[J];广西师范学院学报(自然科学版);2004年03期
14 刘锦国;数据挖掘方法与技术综述[J];科技广场;2004年07期
15 韩智东,张丽萍;浅谈研究复杂类型数据挖掘的必然[J];科学管理研究;2004年S1期
16 赵静;数据挖掘初探[J];科技情报开发与经济;2005年10期
17 戚桂杰,陈丹,王凯平,李丽;数据挖掘中原始数据质量问题的统计处理[J];山东大学学报(理学版);2005年03期
18 伍军云,张丽萍,洪胜华;粒计算及其在数据挖掘中的应用[J];科技广场;2005年06期
19 熊朝松;统计学和数据挖掘的异同[J];科技广场;2005年06期
20 周勇;数据挖掘技术发展综述[J];中国科技信息;2005年16期
中国重要会议论文全文数据库 前10条
1 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 李久丹;陈剑;覃涛;;数据挖掘技术理论研究[A];广西计算机学会2010年学术年会论文集[C];2010年
3 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
5 毛定祥;;数据挖掘与实证经济学[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
6 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
7 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
8 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
9 孙明;康红梅;莫一;;数据挖掘在科技奖励管理系统专家库中的应用[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
10 邵红全;杨菊梅;潘建雄;;数据挖掘的策略与实现技术[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
2 巩建光;面向电信领域的数据挖掘关键技术研究[D];哈尔滨工程大学;2012年
3 李建强;基于数据挖掘的电站运行优化理论研究与应用[D];华北电力大学(河北);2006年
4 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年
5 李国旗;本体辅助的先验知识融入生物信息数据挖掘的方法研究[D];上海交通大学;2007年
6 翟坤;基于数据挖掘的成本管理方法研究[D];大连理工大学;2012年
7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
8 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年
9 朱廷劭;数据挖掘及其在汉语文语转换中应用的研究[D];中国科学院研究生院(计算技术研究所);1999年
10 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 杨毅超;基于Web数据挖掘的作物商务平台分析与研究[D];湖南农业大学;2008年
2 徐进华;基于灰色系统理论的数据挖掘及其模型研究[D];北京交通大学;2009年
3 俞驰;基于网络数据挖掘的客户获取系统研究[D];西安电子科技大学;2009年
4 冯军;数据挖掘在自动外呼系统中的应用[D];北京邮电大学;2009年
5 于宝华;基于数据挖掘的高考数据分析[D];天津大学;2009年
6 王仁彦;数据挖掘与网站运营管理[D];华东师范大学;2010年
7 彭智军;数据挖掘的若干新方法及其在我国证券市场中应用[D];重庆大学;2005年
8 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
9 贾治国;数据挖掘在高考填报志愿上的应用[D];内蒙古大学;2005年
10 马飞;基于数据挖掘的航运市场预测系统设计及研究[D];大连海事大学;2006年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978