收藏本站
《南京邮电大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘分类算法的改进研究

陈洁  
【摘要】:在全球信息化大潮的推动下,信息技术得到了迅猛的发展,社会的计算机化也导致了大量数据从我们生活的每个角落涌出。在缺乏具备强大功能的工具的条件下,人们对这些规模巨大的数据只能望洋兴叹,依靠人类的手动分析,无法探取到这些数据背后隐藏的丰富信息。为了将信息从如此海量的数据之中剥离出来,人们亟需找到一种合理的解决办法去处理信息过量所带来的挑战,研究出一种智能的自动化的替代工具,使得轻松的在大量数据中寻找有用信息变成现实。数据挖掘技术应运而生,通过对数据进行整合学习,将原始数据变换为适合操作的形式,抽取有用的数据进行挖掘,最后应用数据挖掘的各种策略来生成有用的模式和规则。利用这些模式和规则,人们可以对新的样本数据进行预测,获取信息。在数据挖掘的挖掘方法中,分类占据了很重要的地位,目前也有很多流行的分类算法,包括决策树分类算法、朴素贝叶斯分类算法、神经网络算法、SVM算法以及K-最近邻算法等,本文对其算法的思想进行了研究,并对最后对各个算法的优缺点进行了比较分析。本文针对分类算法展开研究,提出了两种改进策略与实现方法:(1)在对数据的训练开始之前,对原始数据的预处理部分做了改进。具体是对原始数据的数量级进行规范化,使得数据的值都处在同一个量级上,而后再对得到的数据进行操作。可以让数据预处理的效果更好,直接影响后续数据挖掘过程的效果和精确度,并用实验证明了改进的效果更好。(2)以最小均方算法和BP神经网络分类算法为基本算法思想,利用批量学习的规则,加入了动量项因子,设计了一种改进的批量学习BP算法。相关实验结果数据表明,改进的批量学习BP算法能够比较好地解决分类问题。
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前9条
1 张杰鑫;张铮;;包分类算法研究综述[J];计算机工程;2015年12期
2 杜选;;基于加权补集的朴素贝叶斯文本分类算法研究[J];计算机应用与软件;2014年09期
3 杨柳;于剑;景丽萍;;一种自适应的大间隔近邻分类算法[J];计算机研究与发展;2013年11期
4 郁抒思;周水庚;关佶红;;软件工程数据挖掘研究进展[J];计算机科学与探索;2012年01期
5 李如平;;数据挖掘中决策树分类算法的研究[J];东华理工大学学报(自然科学版);2010年02期
6 王爱平;王占凤;陶嗣干;燕飞飞;;数据挖掘中常用关联规则挖掘算法[J];计算机技术与发展;2010年04期
7 刘明亮;李雄飞;孙涛;许晓晴;;数据挖掘技术标准综述[J];计算机科学;2008年06期
8 孙岩;吕世聘;王秀坤;唐一源;;基于结构学习的KNN分类算法[J];计算机科学;2007年12期
9 赵翔,向一丹,刘同明,祁云嵩;一种基于粗糙集的决策树生成算法[J];华东船舶工业学院学报(自然科学版);2005年04期
中国硕士学位论文全文数据库 前2条
1 吴同;基于深度学习的分类算法研究及应用[D];吉林大学;2016年
2 张会先;自适应滤波算法的研究与应用[D];西安电子科技大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 吴清强;;网络用户行为分析法和建模法研究综述[J];数字图书馆论坛;2015年11期
2 朱清伟;施彦;王小艺;许继平;李世明;黄振芳;刘波;;基于MM分词算法与SOM神经网络的分类方法研究[J];计算机与应用化学;2015年10期
3 张巍巍;;基于SOA的高可消费性商业分析平台研究[J];电子世界;2015年20期
4 裴向杰;唐红昇;陈鹏;;一种改进的贝叶斯算法在短信过滤中的研究[J];计算机技术与发展;2015年09期
5 李广勇;黄晓霞;;基于CSP与WPD算法的脑磁信号特征提取研究[J];现代计算机(专业版);2015年18期
6 程斐斐;王子牛;侯立铎;;决策树算法在Weka平台上的数据挖掘应用[J];微型电脑应用;2015年06期
7 蔡晓龙;;数据挖掘在银行客户关系管理系统的应用研究[J];信息化建设;2015年06期
8 张秋菊;;数据存储管理技术研究与应用[J];信息技术与标准化;2015年06期
9 佘为;谢会娟;;改进的Apriori算法在高校选修课系统和应对气候变化相关统计工作中的应用[J];信息与电脑(理论版);2015年11期
10 谷瑜青;;XML数据库及其应用研究[J];电脑编程技巧与维护;2015年10期
中国硕士学位论文全文数据库 前10条
1 陈洁;数据挖掘分类算法的改进研究[D];南京邮电大学;2018年
2 杨艳艳;数字助听器中回声反馈消除算法的研究[D];南京邮电大学;2018年
3 刘宪爽;改进自适应算法在光纤电流互感器中的应用研究[D];南昌航空大学;2018年
4 段琳琳;基于深度学习的遥感影像分类研究[D];河南大学;2018年
5 尹晓阳;基于直流电位法的铝合金表面缺陷检测试验研究[D];南昌航空大学;2018年
6 资灵薇;基于奇异值分解的超声钢轨探伤中直达波自适应抑制算法[D];华南理工大学;2018年
7 郝力佳;故障诊断方法研究和软件开发及在船舶监测方面的应用[D];浙江海洋大学;2018年
8 王静静;基于稀疏表示的半监督高光谱图像分类算法[D];西安电子科技大学;2017年
9 尹海明;基于SVDD的密度峰值聚类算法及其接入网入侵检测研究[D];电子科技大学;2017年
10 李东新;基于深度学习的AD/MCI分类特征表达[D];哈尔滨工程大学;2017年
【二级参考文献】
中国期刊全文数据库 前10条
1 马腾;陈庶樵;张校辉;;改进的HyperSplit报文分类算法[J];计算机工程;2014年01期
2 亓亚烜;李军;;高性能网包分类理论与算法综述[J];计算机学报;2013年02期
3 饶丽丽;刘雄辉;张东站;;基于特征相关的改进加权朴素贝叶斯分类算法[J];厦门大学学报(自然科学版);2012年04期
4 邱云飞;王威;刘大有;邵良杉;;基于方差的CHI特征选择方法[J];计算机应用研究;2012年04期
5 徐小伟;成亚谊;;一种基于改进贝叶斯算法的Web文本分类方法[J];现代计算机(专业版);2012年11期
6 朱国胜;余少华;;基于TCAM的范围匹配方法——C-TCAM[J];通信学报;2012年01期
7 张应龙;李翠平;陈红;杜凌霞;;不确定图上的kNN查询处理[J];计算机研究与发展;2011年10期
8 陈正虎;兰巨龙;黄万伟;李玉峰;;一种基于Bloom-filter表项压缩的TCAM业务识别算法[J];电子与信息学报;2011年09期
9 刘松华;张军英;许进;贾宏恩;;Kernel-kNN:基于信息能度量的核k-最近邻算法[J];自动化学报;2010年12期
10 但小容;陈轩恕;刘飞;柳德伟;;数据挖掘中决策树分类算法的研究与改进[J];软件导刊;2009年02期
中国硕士学位论文全文数据库 前7条
1 江国荐;基于SAE-LBP网页分类的研究[D];中国科学技术大学;2015年
2 肖托;一种改进的支持向量数据描述算法[D];哈尔滨工程大学;2013年
3 吴冕;基于改进SVDD的设备故障诊断方法及在线监测系统研究[D];北京邮电大学;2013年
4 刘艳红;SVDD算法研究及在信用卡欺诈检测中的应用[D];江苏大学;2010年
5 郑筝;模糊变步长自适应谐波检测研究与实现[D];南京理工大学;2010年
6 袁飞;胎儿心率检测与非线性分析的研究[D];哈尔滨理工大学;2009年
7 王周舟;自适应均衡算法的研究[D];大连海事大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 蔡萌萌;张巍巍;王泓霖;;大数据时代的数据挖掘综述[J];价值工程;2019年05期
2 张泽;吕新;侯彤瑜;;数据挖掘在农业信息化中的应用进展探析[J];信息记录材料;2019年01期
3 邵兴江;;数据挖掘在教育信息化中的应用空间分析[J];浙江现代教育技术;2004年03期
4 于春香;;数据挖掘技术简介[J];福建信息技术教育;2005年01期
5 周洋;;数据挖掘在电力调度自动化系统中的应用解析[J];科技创新与应用;2017年35期
6 梁园;;浅析数据挖掘在审计中的应用[J];现代经济信息;2017年22期
7 冯丽慧;;云计算和挖掘服务融合下的大数据挖掘体系架构设计及应用[J];电脑编程技巧与维护;2017年24期
8 何宇雄;苑晋沛;聂宇;罗超;高小芊;寇霄宇;李蔚;;试论数据挖掘在电力调度自动化系统中的应用[J];科技创新与应用;2018年04期
9 王国胤;刘群;于洪;曾宪华;;大数据挖掘及应用[J];科技与出版;2017年11期
10 渠畅;;基于R语言的大数据挖掘课程建设研究[J];无线互联科技;2018年04期
中国重要会议论文全文数据库 前10条
1 马钰超;;浅析大数据和数据挖掘及其在烟草行业中的应用[A];中国烟草学会2015年度优秀论文汇编[C];2015年
2 唐杰;梅俏竹;;数据挖掘学科发展研究[A];2012-2013控制科学与工程学科发展报告[C];2014年
3 王时光;;大数据时代规划数据挖掘的创新思考[A];新常态:传承与变革——2015中国城市规划年会论文集(04城市规划新技术应用)[C];2015年
4 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
6 许珂;姜山;;数据挖掘方法在科技产出分布可视化研究中的运用[A];第二届中国科技哲学及交叉学科研究生论坛论文集(硕士卷)[C];2008年
7 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
8 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
9 彭怡;;从数据挖掘文章聚类分析看其发展趋势[A];现代工业工程与管理研讨会会议论文集[C];2006年
10 张建锦;刘小霞;;密度偏差抽样及其在海量数据挖掘中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
中国重要报纸全文数据库 前10条
1 陆天歌 王兆亮;数据挖掘:帮你读懂未来战争[N];解放军报;2018年
2 本报记者 张佳星;把扎克伯格拉下水,大数据挖掘犯错了吗[N];科技日报;2018年
3 本报记者 张佳星;数据挖掘大战 机器怎么做到“见信如面”[N];科技日报;2018年
4 记者 张潇;打造数据挖掘领域的“响尾蛇模式”[N];西安日报;2018年
5 上海市浦东卫生发展研究院 孙雪松 王晓丽;数据挖掘在医学大数据研究中的应用[N];中国信息化周报;2018年
6 本报记者 叶曜坤;全国人大代表邓晓辉:推翻阻碍数据挖掘的“三座大山”[N];人民邮电;2017年
7 本报记者 牛福莲;贵州争夺“大数据挖掘”制高点[N];中国经济时报;2017年
8 中国联合商报记者 刘末;大数据挖掘 让金融业未来更加多彩[N];中国联合商报;2017年
9 南方日报记者 彭颖;日化巨头借力大数据挖掘线下市场[N];南方日报;2017年
10 舒圣祥;“像打击酒驾一样打击假货”,该出招了[N];检察日报;2017年
中国博士学位论文全文数据库 前10条
1 姜彦;正则化方法在数据挖掘中的应用与研究[D];湖南大学;2015年
2 马昱欣;结合可视化与数据挖掘的数据分析方法探究[D];浙江大学;2017年
3 王达;时间序列数据挖掘研究与应用[D];浙江大学;2004年
4 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
5 王立宏;信息系统的约简与粒度分析及其在数据挖掘中的应用[D];上海大学;2004年
6 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
7 李秋丹;数据挖掘相关算法的研究与平台实现[D];大连理工大学;2004年
8 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
9 胡黔楠;化学信息学中的数据挖掘[D];中南大学;2004年
10 余辉;医学知识获取与发现的研究[D];天津大学;2003年
中国硕士学位论文全文数据库 前10条
1 AL-MUREISH NEZAR MOHAMMED GALIB;[D];湖南大学;2017年
2 王飞翔;数据挖掘技术在问答社区中的应用[D];南京邮电大学;2018年
3 陈巍;基于数据挖掘的微博舆情监测与分析平台的设计与实现[D];厦门大学;2017年
4 岳想想;竹材材性数据挖掘方法研究[D];安徽农业大学;2018年
5 陈洁;数据挖掘分类算法的改进研究[D];南京邮电大学;2018年
6 张雪婷;面向重要产品追溯系统的数据挖掘与风险管控[D];国防科学技术大学;2016年
7 胡家瑜;基于小样本量数据挖掘的压裂工艺参数优化方法研究[D];西南石油大学;2018年
8 眭璐;数据挖掘技术在职工基本医疗保险审计中的应用研究[D];南京邮电大学;2017年
9 蒋丽;基于数据挖掘的广告推荐系统的研究[D];南京航空航天大学;2018年
10 温馨;基于数据挖掘的P2P网贷平台发展影响因素研究[D];吉林财经大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026