收藏本站
《兰州大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

粒计算的高效知识约简算法与缺失数据处理

李然  
【摘要】:原始数据通常存在噪声数据、缺失数据等问题,它们会影响数据挖掘、机器学习的效果,虽然已经存在很多基于统计学的方法,但这些方法实际上是对模型参数的估计,不利于缺失数据的填补,它们更适合于处理无监督的数据表,对于决策表的缺失数据,目前的处理方法不多,而且这些方法产生的规则支持度和置信度都较低,本文利用最小描述长度原则对缺失数据进行填补,实验结果证明这一方法使得数据表产生的决策规则的支持度和信任度都较高,达到了预期目的。本文研究的另一个方面是高效的知识约简算法,知识约简是有效知识发现和规则提取的重要手段,目前的知识约简算法主要是基于Rough集理论,在处理不确定知识等方面,粗糙集有着不可替代的优势,而知识约简也是粗糙集理论和应用的关键内容,面对庞大的数据量,高效快速的算法至关重要,但很多知识约简算法只适用于小规模数据,本文研究了粒计算在知识约简中的应用,并设计了一种基于粒度的知识约简算法,分析表明其时间复杂度较小,实验结果也证明算法时间大大降低,而且多数情况下都能得到最小约简。
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP18

【引证文献】
中国硕士学位论文全文数据库 前7条
1 张智勇;基于GMDH的缺失数据插补方法研究[D];四川大学;2007年
2 邓一平;基于粒计算的多智能主体任务分配研究[D];南昌大学;2007年
3 赵敏;基于粗糙集理论的属性约简算法研究[D];长沙理工大学;2008年
4 朱晓然;粒度计算及其在机械故障诊断中的应用[D];兰州理工大学;2008年
5 丁晓磊;基于Rough集和ANN的专家系统知识获取研究[D];兰州大学;2008年
6 高文龙;系统约简的泛系观与特征关系的属性约简[D];兰州大学;2009年
7 陈帆;基于粗糙集理论的属性约简算法研究[D];兰州大学;2012年
【参考文献】
中国期刊全文数据库 前9条
1 李道国,苗夺谦,张红云;粒度计算的理论、模型与方法[J];复旦学报(自然科学版);2004年05期
2 刘清,刘群;粒及粒计算在逻辑推理中的应用[J];计算机研究与发展;2004年04期
3 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
4 张旻,吴涛,王伦文,程家兴;商空间粒度计算理论在数据库和数据仓库中应用[J];计算机工程与应用;2003年17期
5 乔梅,韩文秀;基于Rough集和数据库技术的属性约简算法[J];计算机工程;2005年06期
6 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
7 刘少辉,盛秋戬,吴斌,史忠植,胡斐;Rough集高效算法的研究[J];计算机学报;2003年05期
8 胡可云,陆玉昌,石纯一;粗糙集理论及其应用进展[J];清华大学学报(自然科学版);2001年01期
9 苗夺谦,范世栋;知识的粒度计算及其应用[J];系统工程理论与实践;2002年01期
【共引文献】
中国期刊全文数据库 前10条
1 赵彦辉;张乐文;邱道宏;仲晓杰;;基于粗糙集理论的隧道围岩模糊综合评判[J];四川建筑科学研究;2011年02期
2 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
3 范进;;产业结构对产业集群影响力的实证分析[J];安徽广播电视大学学报;2006年04期
4 于立红;杜芸;;数据挖掘中数据预处理方法与技术[J];安徽电子信息职业技术学院学报;2009年04期
5 舒坚;郑诚;陈振;;基于关联分类方法的Web使用挖掘研究[J];安徽大学学报(自然科学版);2006年02期
6 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
7 杨萍,杨明;基于VPRS的重要属性评价方法研究[J];安徽工程科技学院学报(自然科学版);2003年01期
8 江效尧,胡林生;基于粗糙集的RDT决策树生成算法的研究及应用[J];安徽工程科技学院学报(自然科学版);2004年03期
9 李建洋;倪志伟;刘慧婷;;粗糙集在CBR中的应用研究[J];安徽建筑工业学院学报(自然科学版);2006年01期
10 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
中国重要会议论文全文数据库 前10条
1 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
2 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
3 陈保家;李力;赵新泽;;基于尺度-小波能量谱、粗糙集和神经网络集成的内燃机故障诊断方法[A];第二十六届中国控制会议论文集[C];2007年
4 王印松;冯康;;主汽温调节系统性能评价的粗糙集实现方法[A];第二十七届中国控制会议论文集[C];2008年
5 方炜炜;杨炳儒;彭珍;;一种基于粗糙集的启发式属性归约的新算法[A];第二十七届中国控制会议论文集[C];2008年
6 何鹏;王雅琳;桂卫华;孔玲爽;;氧化铝硅渣成分的混沌时间序列分析与SVM预测[A];第二十九届中国控制会议论文集[C];2010年
7 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
10 邹刚;滕书华;孙即祥;陈森林;敖永红;;一种粗糙集优化协同原型模式约简分类方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
4 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
5 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
6 王小龙;建设工程数字化管理体系研究[D];北京交通大学;2010年
7 任家福;服务商选择与备件备品库存管理研究[D];电子科技大学;2010年
8 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
9 李建军;广东湛江红树林生态系统空间结构优化研究[D];中南林业科技大学;2010年
10 温世亿;膨胀土渠坡若干关键技术问题研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨新忠;基于案例的地理时空过程表达模型研究[D];山东科技大学;2010年
2 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
3 雷聪聪;一种基于数据聚类的信息粒化方法[D];郑州大学;2010年
4 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
5 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
6 沈扬;协商僵局消解优化问题研究[D];郑州大学;2010年
7 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
8 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
9 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
10 王秀锋;网络环境下异构日志信息获取和预处理研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 程兴新;EM算法的收敛性[J];北京大学学报(自然科学版);1987年03期
2 张宾,贺昌政;GMDH算法的终止法则研究[J];吉林大学学报(信息科学版);2005年03期
3 朱小飞,卓丽霞;一种基于量化容差关系的不完备数据分析方法[J];重庆工学院学报;2005年05期
4 王蕊;饶天贵;;不完备信息系统的粗糙集扩充方法[J];重庆工学院学报(自然科学版);2008年03期
5 崔广才;左思源;;遗传算法信息熵结合属性约简算法研究[J];长春理工大学学报(自然科学版);2008年04期
6 乐晓波,孙丰玉;粗糙集理论的一种新扩充模型[J];长沙交通学院学报;2003年04期
7 武建虎,贺佳,贺宪民,程红岩;多变量缺失数据的不同处理方法及分析结果比较[J];第二军医大学学报;2004年09期
8 乔斌,郑洪涛,郭智疆,李玉榕,蒋静坪;针对信息系统不完备性的粗糙集分层递阶约简[J];电路与系统学报;2001年02期
9 朱江华;潘丰;;基于蚁群算法的粗糙集知识约简[J];东南大学学报(自然科学版);2005年S2期
10 李道国,苗夺谦,张红云;粒度计算的理论、模型与方法[J];复旦学报(自然科学版);2004年05期
中国博士学位论文全文数据库 前7条
1 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
2 许琦;粗糙集理论在旋转机械故障诊断技术上应用的研究[D];南京工业大学;2003年
3 郑征;相容粒度空间模型及其应用研究[D];中国科学院研究生院(计算技术研究所);2006年
4 叶施仁;海量数据约简与分类研究[D];中国科学院研究生院(计算技术研究所);2001年
5 王宏刚;MAS在行车调度系统中的应用研究[D];铁道部科学研究院;2006年
6 邓大勇;基于粗糙集的数据约简及粗糙集扩展模型的研究[D];北京交通大学;2007年
7 贾平;基于粗糙集理论的知识发现方法研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 韩晓征;基于分布式控制系统的MAS中若干问题研究[D];合肥工业大学;2002年
2 仇丽青;粗糙集在数据挖掘中的应用研究[D];山东师范大学;2005年
3 陈玉明;基于信息粒与粒计算理论的数据约简研究[D];南昌大学;2005年
4 夏海光;MAS协调中的通信研究[D];华中科技大学;2005年
5 蒋瑜;粗集决策表属性约简算法的研究[D];兰州大学;2006年
6 吴丽丽;粒度计算与粗集、泛系和商空间理论的研究[D];兰州大学;2006年
7 李晓菲;数据预处理算法的研究与应用[D];西南交通大学;2006年
8 岳晓冬;基于粗糙集理论的连续值属性离散化方法研究[D];山西大学;2006年
9 田学全;信息系统中连续属性的离散化及规则提取[D];电子科技大学;2006年
10 张丽萍;粒计算在挖掘数据库中关联规则的应用研究[D];南昌大学;2006年
【二级引证文献】
中国期刊全文数据库 前2条
1 王继良;陈朋;周四望;;基于不规则网格的传感数据Kriging插值算法[J];计算机工程;2012年08期
2 武装;;基于粒子群的粗糙集属性约简与数控机床故障诊断研究[J];组合机床与自动化加工技术;2012年08期
中国博士学位论文全文数据库 前1条
1 谢珺;二进制粒神经网络研究及其在故障诊断中的应用[D];太原理工大学;2009年
中国硕士学位论文全文数据库 前6条
1 李楠;基于邻域粗糙集的属性约简算法研究[D];陕西师范大学;2011年
2 李娜;生产过程数据仓库ETL模块的研究与开发[D];华北电力大学(北京);2010年
3 刘伟斌;特性关系粗糙集中若干关键问题研究[D];西南交通大学;2010年
4 陈帆;基于粗糙集理论的属性约简算法研究[D];兰州大学;2012年
5 马再超;转子故障数据分类方法研究与实验台测试信息系统开发[D];兰州理工大学;2012年
6 许悦;基于混沌吸引子不变量信息熵特征的转子故障诊断方法研究[D];兰州理工大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 潘丹,郑启伦;属性约简自寻优算法[J];计算机研究与发展;2001年08期
2 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
3 刘清;黄兆华;姚力文;;Rough集理论:现状与前景[J];计算机科学;1997年04期
4 王珏,王任,苗夺谦,郭萌,阮永韶,袁小红,赵凯;基于Rough Set理论的“数据浓缩”[J];计算机学报;1998年05期
5 刘清;邻域值信息表上的邻域逻辑及其数据推理[J];计算机学报;2001年04期
6 刘清,郑非,江娟,刘斓;带Rough相等关系词的Rough逻辑系统及其推理[J];计算机学报;2003年01期
7 刘少辉,盛秋戬,吴斌,史忠植,胡斐;Rough集高效算法的研究[J];计算机学报;2003年05期
8 王珏;苗夺谦;周育健;;关于Rough Set理论与应用的综述[J];模式识别与人工智能;1996年04期
9 常犁云,263.net,王国胤,263.net,吴渝,263.net;一种基于Rough Set理论的属性约简及规则提取方法[J];软件学报;1999年11期
10 刘清,刘少辉,郑非;Rough逻辑及其在数据约简中的应用[J];软件学报;2001年03期
【相似文献】
中国期刊全文数据库 前10条
1 李然;曾黄麟;;基于依赖度的启发式约简算法[J];四川理工学院学报(自然科学版);2006年02期
2 张洁;;变精度粗糙模型的建立及其在加工过程知识约简中的应用[J];浙江工贸职业技术学院学报;2008年01期
3 刘启和,李凡,闵帆,叶茂,杨国纬;一种基于新的条件信息熵的高效知识约简算法[J];控制与决策;2005年08期
4 曹付元,梁吉业,钱宇华;基于信息熵的决策表约简[J];计算机应用;2005年11期
5 杨慧中;王军霞;丁锋;;一种综合信息熵和遗传算法的知识约简方法[J];控制理论与应用;2006年06期
6 张凤琴;张水平;白钢;严晓梅;张月玲;;基于粗糙集的装备故障诊断系统的算法研究[J];空军工程大学学报(自然科学版);2010年06期
7 颜艳;杨慧中;;一种基于互信息的粗糙集知识约简算法[J];清华大学学报(自然科学版);2007年S2期
8 宋岚;黄兆华;王洪;;基于Rough熵的决策表约简算法研究[J];华东交通大学学报;2006年04期
9 阳恋;冯山;;一种高效的不完备信息系统知识约简算法[J];科协论坛(下半月);2007年06期
10 潘伟;王云峰;伞冶;;基于自适应遗传算法的粗糙集知识约简算法[J];计算机工程与应用;2008年15期
中国重要会议论文全文数据库 前10条
1 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 朱江华;潘丰;;基于蚁群算法的粗糙集知识约简[A];2005年全国自动化新技术学术交流会论文集[C];2005年
3 朱江华;潘丰;;基于蚁群算法的粗糙集知识约简[A];2005全国自动化新技术学术交流会论文集(二)[C];2005年
4 王军霞;杨慧中;;应用遗传算法求解粗糙集的知识约简[A];2005中国控制与决策学术年会论文集(下)[C];2005年
5 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
6 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
7 董威;徐林;王建辉;顾树生;;一种离散粒子群算法在粗糙集知识约简中的应用[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年
9 闫华;;基于信息熵的粗糙集知识约简方法[A];第十届粤港机电工程技术与应用研讨会暨梁天培教授纪念会文集[C];2008年
10 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 刘若帆宋林;诗邦金A6+1:凭借其质提高其量[N];农资导报;2008年
2 记者 刘苏华特约记者 宋林;金沂蒙生态肥业召开2008经销商年会[N];农资导报;2008年
3 崔昕;带着经验前行[N];中国医药报;2005年
4 姜明;天津:万名职工评工会[N];工人日报;2005年
5 刘苏华宋林;树品牌 拓市场 求实效[N];中华合作时报;2008年
6 合水县人行 王风霞;基层金融统计数据集中工作中存在的问题及建议[N];陇东报;2007年
7 记者 靳晓磊;2月份扬尘污染综合整治考核公示[N];石家庄日报;2009年
8 王振权;抽样调查数据的质量控制[N];中国信息报;2009年
9 北京大学教育学院 马莉萍 丁小浩;就业因素中的社会关系[N];中国教育报;2010年
10 陈曦 堂庆;日均审核退税超千万[N];扬州日报;2011年
中国博士学位论文全文数据库 前10条
1 刘业政;基于粗糙集数据分析的智能决策支持系统研究[D];合肥工业大学;2002年
2 王睿;胃食管反流病流行病学调查及其缺失数据的处理方法研究[D];第二军医大学;2009年
3 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
4 于洪;Rough Set理论及其在数据挖掘中的应用研究[D];重庆大学;2003年
5 魏大宽;不完备模糊决策信息系统粗糙集模型与知识约简研究[D];南京理工大学;2007年
6 裴小兵;粗糙集的知识约简研究[D];华中科技大学;2006年
7 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
8 李健;粗集与它的若干特性研究[D];山东大学;2008年
9 黄国顺;基于粗糙集的决策表知识约简研究[D];华中科技大学;2007年
10 郑术蓉;线性不等式约束下的EM算法[D];吉林大学;2004年
中国硕士学位论文全文数据库 前10条
1 李然;粒计算的高效知识约简算法与缺失数据处理[D];兰州大学;2006年
2 田霆;定时截尾缺失数据下指数分布的统计推断[D];华中科技大学;2004年
3 贾博婷;具有缺失数据的整值自回归模型的统计推断[D];吉林大学;2011年
4 赵丽;缺失数据模型的逆概率加权的双重稳健估计[D];山东大学;2010年
5 齐化富;缺失数据下两类回归模型的经验似然推断[D];广西师范大学;2006年
6 李长军;基于贝叶斯网络的中医医案数据挖掘[D];厦门大学;2008年
7 李佳宁;有缺失数据的双向有序方列联表的统计推断[D];东北师范大学;2005年
8 石红亮;含缺失数据线性模型中的变量选取[D];东北师范大学;2008年
9 刘锴明;代价敏感的缺失值填充若干问题研究[D];广西师范大学;2010年
10 谢易林;随机缺失下自适应变系数模型的相关估计与性质[D];湖南师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026