收藏本站
《哈尔滨工程大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计学习理论的分类方法研究

殷志伟  
【摘要】:海量数据分类一直是数据挖掘、机器学习和人工智能的研究热点,海量数据分类是应用训练集构造一个分类器,应用这个分类器能够完成后续分类工作。本文深入研究了两种基于统计学习理论的数据分类算法,即朴素贝叶斯分类以及粗糙集分类的工作原理,并针对朴素贝叶斯分类算法的增量分类算法、基于粗糙集的属性约简算法等存在的一系列问题,提出了相应的解决方法。 针对朴素贝叶斯算法不具有增量分类能力及海量数据增量分类算法时间复杂度较大等缺点,提出一种基于空间特征向量的增量贝叶斯算法,给出了将向量空间原理及空间欧氏距离结合获取样本特征向量的方法及增量分类过程。仿真实验结果表明,本文提出的算法在大量样本参与分类的时候,能够相对快速并且准确的完成分类任务,能够给出一个相对准确的样本分布情况。 针对基于Skowron差别矩阵的属性约简算法存在的应用范围受限、时间及存储空间浪费和效率瓶颈等问题,通过提出一种浓缩布尔矩阵的概念,提出了一种基于浓缩布尔矩阵的属性约简算法:以布尔代数的形式来解决现有差别矩阵存储空间大、生成效率低等缺点;给出一种新的用于直接生成分辨函数最小析取范式的算法,有效改善了算法的时间和空间复杂度,从而提高了属性约简算法的效率;另外在约简率上本文所提算法也有明显的优势。 针对上述所提出的属性约简算法不适应动态变化的对象集、不支持增量式约简算法等问题,在深入分析新增对象与原决策表对象间的关系的基础上,提出了一种适用于决策表的增量式属性约简算法,实现了对属性约简结果的动态更新、维护和管理,提高了属性约简的效率,理论分析和实例验证表明算法是有效可行的。
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP18

【引证文献】
中国期刊全文数据库 前2条
1 黄冲;刘卓军;;基于统计分析的中医体质分类研究[J];中国管理科学;2012年S1期
2 赵小萌;张斌;程晓荣;;基于支持向量机的网络风险评估方法的研究[J];硅谷;2012年01期
中国重要会议论文全文数据库 前1条
1 黄冲;刘卓军;;基于统计分析的中医体质分类研究[A];第十四届中国管理科学学术年会论文集(上册)[C];2012年
中国博士学位论文全文数据库 前2条
1 魏峰;高光谱遥感数据特征提取与特征选择方法研究[D];西北工业大学;2015年
2 牛俊磊;基于全方位优化算法的马田分类和排序评价方法研究及应用[D];南京理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 杨美燕;电力系统短期负荷预测的分析与研究[D];西安理工大学;2017年
2 杜要;基于标绘数据的旅游信息挖掘研究[D];杭州师范大学;2017年
3 刘楠;气象雷达散热系统动力装置的性能研究[D];中国民航大学;2016年
4 雷洋;基于支持向量机的短信联系人关系判定方法研究[D];华中科技大学;2016年
5 胡春洋;连铸结晶器振动计算机控制系统设计及漏钢预报研究[D];燕山大学;2016年
6 芦思雨;数据挖掘中分类算法的比较分析[D];天津财经大学;2016年
7 董昕頔;基于近似模型的超声切割刀具优化技术研究[D];杭州电子科技大学;2016年
8 李偲;基于朴素贝叶斯的文本分类研究及其在微博分类中的应用[D];北京理工大学;2015年
9 惠云;视频图像中行人识别技术研究[D];西安电子科技大学;2014年
10 郑燕;基于增量学习的自适应话题追踪技术研究[D];山东师范大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 杨明;杨萍;;基于广义差别矩阵的核和属性约简算法[J];控制与决策;2008年09期
2 聂冰;李文;郭永香;;基于粗糙集理论的决策系统属性约简[J];大连交通大学学报;2008年04期
3 徐章艳;杨炳儒;宋威;侯伟;;几种不同属性约简的比较研究[J];小型微型计算机系统;2008年05期
4 朱颖翠;马英红;;基于粗糙集理论的决策表属性约简算法[J];山东师范大学学报(自然科学版);2007年04期
5 杨明;;一种基于改进差别矩阵的属性约简增量式更新算法[J];计算机学报;2007年05期
6 邓维斌;黄蜀江;周玉敏;;基于条件信息熵的自主式朴素贝叶斯分类算法[J];计算机应用;2007年04期
7 胡峰;代劲;王国胤;;一种决策表增量属性约简算法[J];控制与决策;2007年03期
8 彭京;唐常杰;元昌安;李川;胡建军;;一种基于概念相似度的数据分类方法[J];软件学报;2007年02期
9 邓维斌;王国胤;王燕;;基于Rough Set的加权朴素贝叶斯分类算法[J];计算机科学;2007年02期
10 刘洋;冯博琴;周江卫;;基于差别矩阵的增量式属性约简完备算法[J];西安交通大学学报;2007年02期
【共引文献】
中国期刊全文数据库 前10条
1 宋雨;焦谱;李刚;;大数据预处理中属性约简的特性保持分析[J];计算机测量与控制;2015年12期
2 董国华;朱莉乐;李璟健;朱习军;;粗糙集结合神经网络的哮喘辨证分型法[J];计算机与数字工程;2015年09期
3 梁宝华;汪世义;;行式存储的快速属性约简算法[J];模式识别与人工智能;2015年09期
4 杨婷;滕少华;;改进的贝叶斯分类方法在电信客户流失中的研究与应用[J];广东工业大学学报;2015年03期
5 赵洁;梁俊杰;董振宁;陈旭;唐德育;;基于全局正区域不一致性的快速求核算法[J];计算机科学;2015年08期
6 吴正江;王希璠;;增量式目标信息系统的分布约简算法[J];计算机应用与软件;2015年08期
7 王锋;魏巍;;缺失数据数据集的组增量式特征选择[J];计算机科学;2015年07期
8 王毅;陈庆新;毛宁;丁力行;;基于增量式的知识发现[J];计算机集成制造系统;2015年07期
9 龙浩;徐超;;基于改进差别矩阵的属性约简增量式更新算法[J];计算机科学;2015年06期
10 周世睿;郭星;;一种快速求核算法[J];赤峰学院学报(自然科学版);2015年10期
【同被引文献】
中国期刊全文数据库 前6条
1 王伟;;AHP和SVM组合的网络安全评估研究[J];计算机仿真;2011年03期
2 顾亚祥;丁世飞;;支持向量机研究进展[J];计算机科学;2011年02期
3 党德鹏;孟真;;基于支持向量机的信息安全风险评估[J];华中科技大学学报(自然科学版);2010年03期
4 黄光球;朱擎;;基于信息融合技术的动态安全态势评估模型[J];微计算机信息;2010年03期
5 王琦;;中医体质三论[J];北京中医药大学学报;2008年10期
6 成平;;对贝叶斯统计的几点看法[J];数理统计与应用概率;1990年04期
中国博士学位论文全文数据库 前6条
1 高晓惠;高光谱数据处理技术研究[D];中国科学院研究生院(西安光学精密机械研究所);2013年
2 蒋胜利;高维数据的特征选择与特征提取研究[D];西安电子科技大学;2011年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 耿修瑞;高光谱遥感图像目标探测与分类技术研究[D];中国科学院研究生院(遥感应用研究所);2005年
5 吴昊;高光谱遥感图像数据分类技术研究[D];国防科学技术大学;2004年
6 夏建涛;基于机器学习的高维多光谱数据分类[D];西北工业大学;2002年
中国硕士学位论文全文数据库 前10条
1 高旭瑞;基于位置社交网络的朋友关系预测研究[D];太原理工大学;2016年
2 吕仁俊;LBSN中基于行为分析的用户位置预测[D];东南大学;2015年
3 尤晓镇;基于有限元模型的超声切割刀优化设计及工艺实验研究[D];广东工业大学;2015年
4 董骐瑞;k-均值聚类算法的改进与实现[D];吉林大学;2015年
5 黄秀秀;NOMEX蜂窝复合材料直刃刀超声复合切割机理研究[D];杭州电子科技大学;2015年
6 刘琴琴;冷却风扇寿命预测与健康管理算法分析及改进[D];华南理工大学;2014年
7 尹立;基于支持向量机的某区域电网电力需求的预测研究[D];北京交通大学;2014年
8 崔广风;数据挖掘中的统计方法及其应用研究[D];西南石油大学;2014年
9 徐诚;基于PROFIBUS-DP现场总线的炉衬料生产线控制系统的设计[D];苏州大学;2014年
10 张倩;基于半监督学习的中文短文本分类研究[D];西安电子科技大学;2014年
【二级引证文献】
中国博士学位论文全文数据库 前3条
1 许磊;阳山金矿带三维地质建模与成矿预测[D];中国地质大学(北京);2018年
2 尹惠茹;城市非营利性养老机构养老服务能力评价研究[D];吉林大学;2017年
3 常志朋;基于马田系统的模糊多属性决策方法研究[D];南京理工大学;2014年
中国硕士学位论文全文数据库 前7条
1 李晓军;50μm金属散热器微通道制作工艺研究[D];大连理工大学;2018年
2 崔哲;基于朴素贝叶斯方法的文本分类研究[D];河北科技大学;2018年
3 徐娜;基于数据挖掘技术的毕业生就业管理系统设计与实现[D];齐鲁工业大学;2017年
4 郑贺军;连铸漏钢预报研究及在连铸结晶器振动监控软件中的实现[D];燕山大学;2017年
5 谢成东;基于SPARK的中文文本特征提取及分类方法研究与实现[D];电子科技大学;2017年
6 刘小军;基于LDA模型和AP聚类算法的主题演化研究[D];合肥工业大学;2016年
7 陈颖慧;高维数据流快速降维聚类算法研究[D];长沙理工大学;2016年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨明;;一种基于改进差别矩阵的属性约简增量式更新算法[J];计算机学报;2007年05期
2 蒋瑜;魏新建;张娟;林和;李永礼;;基于细分关系的决策表求核与约简算法[J];计算机工程与应用;2006年20期
3 杨明;;一种基于改进差别矩阵的核增量式更新算法[J];计算机学报;2006年03期
4 彭京;唐常杰;曾涛;乔少杰;雍小嘉;;基于神经网络和属性距离矩阵的中药方剂功效归约算法[J];四川大学学报(工程科学版);2006年01期
5 杨明,孙志挥;改进的差别矩阵及其求核方法[J];复旦学报(自然科学版);2004年05期
6 王双成,苑森淼;具有丢失数据的贝叶斯网络结构学习研究[J];软件学报;2004年07期
7 叶东毅,陈昭炯;一个新的二进制可辨识矩阵及其核的计算[J];小型微型计算机系统;2004年06期
8 韩燮,杨炳儒;一种属性与值约简简化算法[J];小型微型计算机系统;2004年02期
9 於东军,王士同,杨静宇;一种增量式规则提取算法[J];小型微型计算机系统;2004年01期
10 刘振华,刘三阳,王珏;基于信息量的一种属性约简算法[J];西安电子科技大学学报;2003年06期
【相似文献】
中国期刊全文数据库 前10条
1 宋桂娟;曲朝阳;李翔坤;陈秀寓;;基于信息熵的粗糙集属性约简算法研究[J];微计算机信息;2010年18期
2 李秀燕;刘自伟;;基于差别矩阵属性约简算法的改进[J];兵工自动化;2007年09期
3 陈静华;李小民;;一种改进的差别矩阵属性约简算法[J];微计算机信息;2010年33期
4 汪小燕;金建辉;申元霞;;基于不可区分序偶的属性约简算法[J];苏州科技大学学报(自然科学版);2017年02期
5 张娟;蒋瑜;聂华北;李永礼;;基于差别矩阵的高效属性约简算法[J];武汉理工大学学报;2010年23期
6 韩玲;李建国;;基于差别矩阵启发式决策表属性约简算法[J];计算机仿真;2008年12期
7 赵明清;;离散型决策表的二分归纳属性约简算法[J];山东科技大学学报(自然科学版);2009年01期
8 杨波;徐章艳;舒文豪;;基于差别矩阵的完备属性约简算法[J];计算机工程;2011年16期
9 闫德勤,王杨;基于关联矩阵的属性约简算法[J];计算机工程与应用;2005年20期
10 徐章艳;杨炳儒;宋威;;基于区分对象对集的高效属性约简算法[J];模式识别与人工智能;2006年05期
中国重要会议论文全文数据库 前10条
1 韩玲;胡学钢;李建国;;一种启发式的决策表属性约简算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 陶志;刘庆拯;李卫民;;一种基于改进区分矩阵的属性约简算法[A];2007中国控制与决策学术年会论文集[C];2007年
3 王杨;任永功;闫德勤;;基于遗传算法的粗糙集属性约简算法[A];第三届不确定系统年会论文集[C];2005年
4 周创德;田卫东;周红鹃;钱宏亮;;基于阈值约束的粗糙集属性约简算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 蔡智;岳丽华;王熙法;;一种数据属性约简算法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 李菊;王军;王兴;;基于改进的二进制辨识矩阵的属性约简算法[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
7 陈展雄;顾幸生;;基于多种群免疫量子粒子群的粗糙集属性约简算法[A];上海市化学化工学会2010年度学术年会论文集(自动化专题)[C];2010年
8 李菊;刘晓平;;基于改进的差异比较表的属性约简算法[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
9 杨思春;王建颖;陈家骏;;一种新的概念格属性约简算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 杨善林;刘业政;马溪骏;;基于β-δ_0粗糙集模型的属性约简算法[A];2003年中国管理科学学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 景运革;基于知识粒度的动态属性约简算法研究[D];西南交通大学;2017年
3 王永生;基于粗糙集理论的动态数据挖掘关键技术研究[D];北京科技大学;2016年
4 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
5 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
6 杨田;覆盖粗糙集约简理论及应用[D];湖南大学;2010年
7 许琦;粗糙集理论在旋转机械故障诊断技术上应用的研究[D];南京工业大学;2003年
8 黄国顺;基于粗糙集的决策表知识约简研究[D];华中科技大学;2007年
9 马希骜;概率粗糙集属性约简理论及方法研究[D];西南交通大学;2014年
10 刘瑶;基于邻域粗糙集的高光谱波段选择算法研究[D];哈尔滨工程大学;2017年
中国硕士学位论文全文数据库 前10条
1 周建华;基于差别矩阵的属性约简算法[D];广西师范大学;2014年
2 谢忱;基于粗糙集理论的快速属性约简算法研究[D];解放军信息工程大学;2009年
3 梁蒙;基于粗糙集的属性约简算法研究[D];河南大学;2011年
4 金建辉;粗糙集属性约简研究[D];安徽工业大学;2016年
5 周世睿;粗糙集求核与属性约简算法研究[D];安徽大学;2015年
6 杜跃;基于粗糙集理论的属性约简算法研究[D];西北师范大学;2008年
7 朱靖;基于粗糙集和模糊集理论的属性约简算法研究[D];湖南大学;2008年
8 李墨;粗糙集属性约简算法研究及其在大学生就业系统中的应用[D];华南理工大学;2014年
9 邓小娟;基于粗糙集的属性约简算法研究[D];西南交通大学;2009年
10 崔晓慧;基于粗糙集的启发式属性约简算法研究[D];西北师范大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026