收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于粗集的数据挖掘技术及其应用研究

曹秀英  
【摘要】: 面对信息社会中数据和数据库的爆炸式增长,人类分析数据和从中提取有用信息的能力,远远不能满足实际的需要。虽然数据库管理系统可以高效地实现数据的录入、检索和维护等管理功能,但是却不能发现数据库中的关联和规则,也不能根据现有的数据预测未来的发展趋势。所以迫切地需要一种智能地、自动地把数据转换成有用信息的技术和工具。 需求是发展之母,数据库管理系统和人工智能中机器学习两种技术的发展和结合,促成了在数据库中发现知识(KDD)这一新技术的诞生。1989年8月,在美国底特律召开的第11届国际人工智能联合会议的专题讨论会上,首次提出KDD。KDD是一门交叉性学科,涉及机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等领域,内涵极为广泛,理论和技术上的难度也很大,从而使针对大型数据库的KDD技术一时还难以满足应用的需要。于是,1995年的美国计算机学会(ACM)会议提出了数据挖掘(Data Mining)的概念,它形象地把大型数据库看成是存放有价值信息的矿藏,通过有效的知识发现技术,从中挖掘或开采出有用的信息。 所谓数据挖掘也称为知识发现,是从大型数据库和数据中提供潜在价值的知识和规则的过程。数据挖掘技术有各种模式,如关联分析、分类和预测及聚类等。各种模式各有侧重,其中有一些已经研究得较为成熟,研究成果也较多,如挖掘关联规则、预测方法和分类模式中的一些其他方法。而分类模式中关于粗集的挖掘技术目前研究的人还不是很多,相应的研究成果也较少。因而基于粗集的数据挖掘技术有很大的研究价值。粗集理论是针对不确定性问题提出的,它的特点是不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域,从而找出该问题的内在规律。 基于粗集理论的数据挖掘技术可以用来从大型数据库中挖掘出有用和用户感兴趣的知识来,解决现代企业中数据多而信息少的问题。从某种意义上说,通过粗集理论挖掘出的分类规则是系统通过自学习机制而产生的,因而可以解决知识自动获取的瓶颈问题。因此,研究基于粗集的数据挖掘技术有着重要的理论和现实的意义。 本文在总结和借鉴前人经验的基础上,对基于粗集的数据挖掘技术进行了 哈尔滨」_:程大学博士学位论文 ‘亩奋‘亩奋亩亩亩奋亩奋奋亩石亩 系统的研究。原来人们对粗集的挖掘算法的研究主要是针对相容决策表进行 的,本文不仅研究了相容决策表的挖掘算法,同时也对不相容决策表的挖掘算 法以及产生的不确定性规则的推理策略进行了研究,从而使基于粗集的挖掘技 术更加完善。 在论文的第4章,对于粗集挖掘技术的两个主要的数据预处理过程,即决 策表数据的离散化和空缺值的补齐进行了研究。另外,本文还提出将云模型和 粗集理论结合起来进行数据挖掘和推理,并对二者的结合模式进行了探讨。 在第6章和第7章,论文对基于粗集的数据挖掘技术在管理领域中的应用 进行了探讨,包括在供应链合作伙伴评价选择和企业资信评级中的应用。供应 链合作关系和企业的资信评级在市场经济条件下显得尤为重要,应用基于粗集 的挖掘技术,不仅可以有效利用大量的历史数据和评价结果,又可以借助于信 息技术提高评价工作的效率和改善工作效果。 在第6章,论文对合作伙伴评价选择的综合指标体系进行了设计,在此基 础上运用粗集来对历史的评价结果数据进行挖掘,最终得到用于合作伙伴评价 选择的分类规则。 在最后一章,论文利用粗集的属性约简算法自动获取了企业债券财务质量 评级的指标体系,并最终得到债券财务质量评价的规则。另外,在本章论文还 提出一种基于粗集理论的属性权重确定方法,该方法将由历史数据确定的属性 的客观权重和专家的主观先验权重结合起来,最终得出主客观相结合的综合权 重。论文最后利用该方法对企业债券进行评价并得到了评价的结果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 周玉敏;;基于粗集的数据挖掘在电子商务中的应用[J];商场现代化;2008年18期
2 何先华,赵卫东,盛昭瀚;粗集在医疗诊断知识支持中的应用[J];计算机工程与应用;2001年20期
3 安利平,张建勇,仝凌云;专家系统中基于粗集的知识获取、更新与推理[J];计算机工程与设计;2004年01期
4 祝峰,何华灿;粗集的公理化[J];计算机学报;2000年03期
5 孙兴波;基于粗集方法的图像识别系统[J];四川轻化工学院学报;2001年01期
6 许琦,李永生;粗集理论及基于集合论的学习方法[J];盐城工学院学报(自然科学版);2002年01期
7 李钢,张雪婷;基于相似关系粗糙集的分解[J];计算机工程与应用;2004年02期
8 孙惠琴,熊璋;基于粗集和多Agent技术的分布式数据挖掘[J];微电子学与计算机;2005年01期
9 郝秀兰;基于粗集的属性值约简及应用[J];电脑开发与应用;2005年05期
10 夏克文,宋建平,李昌彪;基于粗集和神经网络的石油测井数据挖掘方法[J];信息与控制;2003年04期
11 王洪凯,管延勇,史开泉;粗集间的相似度量及其应用[J];计算机工程与应用;2004年31期
12 郑丽英,王庆荣,刘丽艳;面向属性的粗集数据挖掘方法研究[J];兰州理工大学学报;2005年02期
13 赵卫东,李旗号;粗集在数据开采中的应用[J];系统工程学报;2002年04期
14 赵永强,张洪才,潘泉;基于粗集的目标识别[J];计算机应用;2003年S1期
15 胡寿松,徐德友,刘亚;基于粗集模型的歼击机损伤故障检测[J];控制理论与应用;2003年06期
16 李秋丹,迟忠先,王大公;基于数据挖掘技术的负荷预测模型[J];大连理工大学学报;2003年06期
17 翟敬梅,蒋梁中,谢存禧,李杞仪;CIMS环境下企业决策支持系统模型的研究[J];机电工程技术;2002年06期
18 赵卫东,曹文彬,戴伟辉;不完全信息下的粗集拓展[J];系统工程学报;2002年06期
19 周宏,周小燕,赵卫东;粗集不可分辨关系的拓展及其可视化研究[J];系统工程理论方法应用;2002年01期
20 罗健旭,张兆宁,邵惠鹤;应用基于粗集的模糊神经网络进行软测量建模的研究[J];化工自动化及仪表;2003年02期
中国重要会议论文全文数据库 前10条
1 凌方;王建东;;基于可变精度粗集的规则简化方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 刘保仓;刘若慧;;粗模糊集的嵌入集的性质[A];中国运筹学会模糊信息与模糊工程分会第五届学术年会论文集[C];2010年
3 王洪德;马云东;;基于粗集-BP网络的通风系统可靠性预警方法研究[A];中国科协2004年学术年会第16分会场论文集[C];2004年
4 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
5 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
6 王慧敏;佟金萍;;宏观经济预警新探索:粗集—神经网络预警方法[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
7 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
8 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
9 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
10 胡学钢;郭骏;王浩;袁兆山;;基于粗集与基于格结构的知识发现方法比较[A];全国第十四届计算机科学及其在仪器仪表中的应用学术交流会论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 曹秀英;基于粗集的数据挖掘技术及其应用研究[D];哈尔滨工程大学;2003年
2 刘盾;基于粗糙集理论的多属性决策方法[D];西南交通大学;2011年
3 胡咏梅;基于粗集的车间动态调度研究[D];山东大学;2005年
4 韩斌;基于数据挖掘的信息融合理论和应用[D];浙江大学;2002年
5 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
6 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
7 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
8 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
9 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
10 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
中国硕士学位论文全文数据库 前10条
1 汤义强;结合粗集的数据分析方法及应用研究[D];安徽大学;2011年
2 李保平;基于S-粗集的系统规律挖掘与非线性系统输出反馈[D];安徽大学;2011年
3 牟宗瀛;粗集选股模型及随机择机模型初探[D];北京工业大学;2001年
4 宋雪飞;基于粗集理论值约简的数据挖掘系统[D];长春理工大学;2002年
5 张震;论数据挖掘技术在公共危机管理系统中的应用[D];吉林大学;2006年
6 杜军;基于粗集—神经网络的宏观经济预警研究[D];河海大学;2003年
7 徐昕;基于粗集和神经网络的建模方法及其应用[D];南京工业大学;2003年
8 刘春亚;基于粗集理论的数据预处理及应用研究[D];重庆大学;2003年
9 程玉胜;粗集理论约简及其应用的研究[D];合肥工业大学;2003年
10 闵小宝;基于证据推理模型的K-NN分类[D];江西师范大学;2002年
中国重要报纸全文数据库 前10条
1 ;舍弗勒:中国汽车工业的合作伙伴[N];国际商报;2005年
2 记者  范蓉;“合作伙伴”仍继续 中数传媒否认“认证”说[N];中国电子报;2006年
3 记者 张俊 通讯员 伟平;宣钢与北京住总结成合作伙伴[N];中国冶金报;2007年
4 CPW 谢;微软召开企业决策者高峰论坛暨解决方案合作伙伴大会[N];电脑商报;2006年
5 于洪涛;招募工作基本完成 Juniper推动渠道细分[N];电脑商报;2006年
6 李;召开“塞外英雄会” 长虹佳华追求“卓越”[N];电脑商报;2006年
7 ;IBM与思科是最大赢家[N];电脑商报;2006年
8 英特尔全球合作伙伴关系部中国区合作伙伴事业部经理 雷向锋;英特尔“软件合作伙伴计划”[N];电脑商报;2006年
9 ;EMC:广泛结盟提供本地化方案[N];电脑商报;2006年
10 李云增;钟郝仪:每年都是成功的开始[N];电脑商报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978