收藏本站
《天津大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

分类数据挖掘中若干基本问题的研究

李仁璞  
【摘要】: 面对大规模的、高维的数据,如何建立有效的,可扩展的分类数据挖掘算法是数据挖掘领域的研究热点。围绕以上问题,本文对分类数据挖掘中涉及的若干基本问题进行了深入研究,主要包括以下几个方面的内容: 提出了一种结构自适应的神经网络特征选择方法。通过交替删除网络中冗余的输入特征和隐结点,使网络结构在特征选择的过程中保持相对良好。实验表明该方法能快速有效删除特征,提高网络泛化性能。 提出一种基于粗集理论和神经网络相结合的分类规则挖掘算法。首先使用粗集理论和神经网络对决策表进行两次属性约简,然后使用粗集理论对约简后的决策表进行规则抽取。该方法充分融合了粗集理论强大的规则生成能力和神经网络优良的容错性能。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。 属性离散化的方法可以分为两类:局部方法和全局方法。局部方法简单易行但效果较差,而全局方法效果较好但算法复杂计算量大。本文提出一种有效的结合两类方法优点的折衷算法,在一种已有基于熵的局部算法基础上加入对决策表数据不一致度的检验,从而使该算法具有了全局化的特性。实验结果表明使用相同的规则生成器C4.5,本文方法比传统离散化方法生成的规则更强壮。 对目前广泛应用的基于粗集理论和信息熵的几种规则不确定性度量准则进行了比较分析,通过定理证明了它们之间存在不一致性以及发生不一致时的必要条件,提出了下一步构建更有效的不确定性度量的方向。 提出一种基于粗糙集理论的分类别进行规则抽取的算法。首先获得每类数据的属性约简;然后为每类数据构造一个分辨矩阵和一个合并矩阵,通过两个矩阵的交互作用逐类抽取规则。UCI数据库上的实验结果表明,与传统方法相比该算法能够在更短的时间内得到分类精度更高的规则。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 刘云翔;陈艳;袁鑫鑫;;基于粗集的信息融合系统评价指标体系优化研究与实现[J];计算机应用与软件;2011年09期
2 刘云翔;陈艳;袁鑫鑫;;C~3I信息融合评价指标体系优化方法研究[J];计算机测量与控制;2011年07期
3 唐玲;陶雪容;;基于粗集理论的大曲理化指标重要性分析[J];黑龙江科技信息;2011年17期
4 张军;黄顺亮;;动态粗集理论在K-均值聚类中的应用[J];计算机工程与应用;2011年26期
5 邓松;王映龙;何火娇;罗东平;袁威;;粗糙集在销售决策系统中的应用[J];计算机技术与发展;2011年09期
6 曹晶秀;彭泓;王斌;;粗集-RBF神经网络在瓦斯突出预测中的应用[J];计算机测量与控制;2011年08期
7 梁俊奇;闫淑霞;;关于覆盖粗糙集模型性质的一个注记[J];计算机科学;2011年09期
8 张明;唐振民;杨习贝;;不完备信息系统中的否定决策规则和知识约简[J];控制与决策;2011年06期
9 林国平;李进金;;基于绝对信息量的覆盖增量约简算法[J];模式识别与人工智能;2011年02期
10 马周明;李进金;;广义粗集公理化的一个注记[J];山东大学学报(理学版);2011年08期
中国重要会议论文全文数据库 前10条
1 王晓丽;周浔;任锐;;粗集理论在目标识别中的应用[A];中国仪器仪表学会第十二届青年学术会议论文集[C];2010年
2 王晓丽;周浔;薛海鹰;;粗集理论和神经网络在数据融合中的应用[A];第十九届测控、计量、仪器仪表学术年会(MCMI'2009)论文集[C];2009年
3 胡丹;莫智文;;基于粗集的规则提取LBR和LEM3[A];2001年中国智能自动化会议论文集(下册)[C];2001年
4 余启刚;;RS理论与可拓方法[A];1999年中国智能自动化学术会议论文集(下册)[C];1999年
5 杨海峰;张继福;;一种新的概念格结构:粗糙概念格[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
6 曾黄麟;袁曾任;;模式识别特征评选与简化的一种新方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 庞清乐;曹银杰;穆健;郎丰法;;基于粗集理论的小电流接地系统故障选线研究[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
8 曾黄麟;曾谦;;系统参数重要性与不确定性问题研究[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
9 李希亮;贾希胜;;粗集理论在CBR系统案例评价中的应用[A];1999年中国智能自动化学术会议论文集(下册)[C];1999年
10 曾黄麟;曾谦;袁曾任;;一种基于粗集理论的模式识别方法[A];2000中国控制与决策学术年会论文集[C];2000年
中国重要报纸全文数据库 前7条
1 袁磊;政府花钱 人大要管[N];人民日报;2001年
2 林心;世界保险巨头钱袋漏了[N];厂长经理日报;2001年
3 中国再保险公司国际业务部;从国际再保险业务变化中汲取什么[N];中国保险报;2001年
4 李保忠 江苏;预算监督:人大监督的“软肋”[N];人民代表报;2004年
5 范学东;3G服务金牌营销员的必由之路[N];中国保险报;2001年
6 记者 陈淑清 通讯员 赵培亚;我国投资统计进行重大改革[N];中国信息报;2004年
7 魏俊岭;魅力无限新闻组[N];电脑报;2001年
中国博士学位论文全文数据库 前10条
1 李仁璞;分类数据挖掘中若干基本问题的研究[D];天津大学;2003年
2 许志兴;粗集理论的若干技术及其应用研究[D];南京航空航天大学;2001年
3 赵军;基于粗集理论的KDD技术研究[D];重庆大学;2003年
4 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
5 孙燕楠;扎龙湿地时空格局演变的细胞自动机模型研究[D];大连理工大学;2007年
6 巫兆聪;粗集理论在遥感影像分类中的应用[D];武汉大学;2004年
7 王宏;基于粗糙集数据挖掘技术的客户价值分析[D];哈尔滨工程大学;2006年
8 王庆;知识型企业知识员工任务指派及调度决策问题研究[D];天津大学;2006年
9 蔡振禹;基于粗集—小波神经网络的煤炭企业管理研究[D];天津大学;2007年
10 李雪红;重大水工混凝土结构裂缝演变规律及转异诊断方法研究[D];河海大学;2003年
中国硕士学位论文全文数据库 前10条
1 于绍阳;基于粗集理论的信息系统的属性约简算法研究[D];厦门大学;2006年
2 林秋月;基于二进制可辨矩阵的属性约简算法与规则获取的研究[D];福州大学;2005年
3 花建立;基于粗集理论的股价走势预测[D];西南交通大学;2005年
4 刘春亚;基于粗集理论的数据预处理及应用研究[D];重庆大学;2003年
5 华江林;基于粗集理论的教学质量评估系统的研究[D];河海大学;2006年
6 盛晓炜;基于粗集理论的中文文本自动分类与检索研究[D];清华大学;2004年
7 李荣花;基于粗集理论的神经网络研究与应用[D];大庆石油学院;2003年
8 黎东英;粗糙集理论中的数据预处理及决策表约简方法研究[D];福州大学;2005年
9 张鹏;交通事故黑点智能排查系统的研究与实现[D];电子科技大学;2005年
10 曹倬瑝;基于数据挖掘的设备故障诊断[D];北京化工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026