收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本分类的增量学习算法研究

李昕  
【摘要】:随着信息时代的发展,网络上每天都产生数以亿万计的新数据。为了有效地处理和分辨这些数据,识别其中隐含的有用信息,人们需要使用各种分类器对这些数据进行学习、分类、甄别与过滤。针对网络上数据规模的持续增加、讨论热点的不断迁移现象,传统分类器已不能自适应网络环境需求,人们希望对传统分类器进行改进使之具备相应的能力,能够随着网络环境与信息的不断变化而发生改变,即改进的分类器具有连续学习能力。 在现今的增量学习算法研究中,学者们多通过对各分类器增加增量学习机制来提高单次输入的训练精度或效率,而对能适应连续学习的连续增量学习机制的研究尚少。此外,本文所依托的项目采用了特殊的级联分类机制,而目前缺乏相关研究将增量学习算法应用于此分类机制。 本文主要对以上两点进行研究讨论,具体针对现有的分类器进行研究、改进,为其以及改进的分类判别算法增加合适的增量学习机制,使之适应不断更新的网络数据,并据此提出解决方案。本文的主要研究内容与创新点有以下几点: 1.分析研究了当前经典的NB、DT、NN、KNN、SVM等分类器,以及基于分类器的各种增量学习算法,分析了各算法的优缺点以及对本文所研究的分类器对象的筛选; 2.选取一种稳定的增量学习算法机制进行代码实现,通过对不同数据的实验对该算法进行详细分析,并在实现过程中发现问题,提出相应创新机制,在保持算法精度的情况下,节约了增量学习算法的训练时间。此外,设计连续增量学习机制,在实现连续学习基础上提高分类精度; 3.在分类判别过程中,将KNN分类器与SVM分类器进行级联,针对这种分类器级联模式,将单次增量学习机制与连续增量学习机制应用于该分类判别模式中,在保证连续学习的基础上一定程度地提高了分类精度。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陶品,张钹,叶榛;构造型神经网络双交叉覆盖增量学习算法[J];软件学报;2003年02期
2 彭彬彬,孙正兴,金翔宇;多值分类环境下基于SVM增量学习的用户适应性研究(英文)[J];南京大学学报(自然科学版);2004年02期
3 姜卯生,王浩,姚宏亮;朴素贝叶斯分类器增量学习序列算法研究[J];计算机工程与应用;2004年14期
4 景博,李剑,钱越英;一种协商在线增量学习算法及其在基于智能体的电子商务中的应用[J];计算机工程与应用;2005年02期
5 吴飞,庄越挺,潘云鹤;基于增量学习支持向量机的音频例子识别与检索[J];计算机研究与发展;2003年07期
6 杨森,徐海涛,柴乔林;应用支持向量机实现增量入侵检测[J];计算机工程与应用;2004年27期
7 刘璨;粗集神经网络过程监控模型的增量学习法[J];机床与液压;2004年01期
8 滕月阳,唐焕文,张海霞;一种新的支持向量机增量学习算法[J];计算机工程与应用;2004年36期
9 张仕华;王学业;;增量回归支持向量机改进学习算法[J];计算机工程与应用;2006年03期
10 陶品,张钹,叶榛;可继续学习的构造型神经网络构造算法[J];计算机工程与应用;2002年08期
11 李凯,黄厚宽;支持向量机增量学习算法研究[J];北方交通大学学报;2003年05期
12 曾嵘,刘建成,蒋新华;一种基于支持向量机的增量学习算法[J];铁道科学与工程学报;2005年01期
13 李祥纳;艾青;秦玉平;刘卫江;;支持向量机增量学习算法综述[J];渤海大学学报(自然科学版);2007年02期
14 萧嵘 ,王继成 ,孙正兴 ,张福炎;一种SVM增量学习算法α-ISVM[J];软件学报;2001年12期
15 李忠伟,张健沛,杨静;基于支持向量机的增量学习算法研究[J];哈尔滨工程大学学报;2005年05期
16 刘风;王正群;陈广花;;基于类别信息的分类器集成方法Cagging[J];计算机应用;2008年S2期
17 万辉;魏延;;一种改进的最小二乘支持向量机算法[J];重庆师范大学学报(自然科学版);2010年04期
18 高洁,吉根林;一种增量式Bayes文本分类算法[J];南京师范大学学报(工程技术版);2004年03期
19 刘梅,权太范,姚天宾;基于增量学习神经模糊网络的机动目标跟踪[J];电子学报;2005年11期
20 蔡珍凡;;一种改进的快速支持向量机算法[J];科学技术与工程;2010年13期
中国重要会议论文全文数据库 前10条
1 张健沛;李忠伟;杨静;;一种基于多支持向量机的并行增量学习方法(英文)[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 王玲;穆志纯;郭辉;;基于支持向量回归的增量建模方法[A];第25届中国控制会议论文集(上册)[C];2006年
3 赵莹;万福永;;支持向量机的增量学习算法及其在多类分类问题中的应用[A];第25届中国控制会议论文集(下册)[C];2006年
4 郝增荣;刘海军;柳征;姜文利;;一种基于神经网络增量学习的辐射源识别算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
5 罗长升;段建国;许洪波;郭莉;;基于拉推策略的文本分类增量学习研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 马亮;陈群秀;谭伟;;智能Web信息检索相关研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 王会珍;朱靖波;季铎;叶娜;张斌;;基于反馈学习自适应的中文话题追踪[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
8 刘欣;章勇;王娟;;增量学习的TFIDF_NB协同训练分类算法[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
9 马后锋;樊兴华;;一种改进的增量贝叶斯分类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
10 何琳;章林柯;;基于组合变结构Fuzzy-RBF网络的潜艇异类噪声源检测[A];湖北省声学学会成立二十周年纪念文集[C];2006年
中国博士学位论文全文数据库 前10条
1 丁凯;基于增量学习的中文手写书写者自适应技术研究[D];华南理工大学;2011年
2 赵强利;基于选择性集成的在线机器学习关键技术研究[D];国防科学技术大学;2010年
3 秦玉平;基于支持向量机的文本分类算法研究[D];大连理工大学;2008年
4 何学文;基于支持向量机的故障智能诊断理论与方法研究[D];中南大学;2004年
5 王昱;考虑特征变量异质性的分类方法及其在风险决策中的应用研究[D];中国科学技术大学;2009年
6 李斌;概率混合模型的研究及其应用[D];复旦大学;2009年
7 王利民;贝叶斯学习理论中若干问题的研究[D];吉林大学;2005年
8 孙彩堂;彩色虹膜图像识别算法的研究[D];吉林大学;2009年
9 吴冰;相关向量回归元建模关键技术及其应用研究[D];国防科学技术大学;2011年
10 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 杜玲;覆盖算法的增量学习研究[D];安徽大学;2010年
2 李曼;云计算平台上的增量学习研究[D];南京邮电大学;2012年
3 张智敏;基于增量学习的分类算法研究[D];华南理工大学;2010年
4 刘晟;支持向量数据描述及其在财务报表舞弊识别中的应用研究[D];江苏大学;2010年
5 侯凯;加权贝叶斯增量学习中文文本分类研究[D];长沙理工大学;2013年
6 冯佳;多层文本分类与增量学习关键技术研究[D];西安电子科技大学;2009年
7 吴冕;基于改进SVDD的设备故障诊断方法及在线监测系统研究[D];北京邮电大学;2013年
8 李进;基于SVM增量学习的P2P流媒体流量识别方法研究[D];国防科学技术大学;2010年
9 周鸣;面向手机病毒挖掘引擎的增量贝叶斯算法的研究与实现[D];北京邮电大学;2012年
10 沈培华;支持矢量机的算法研究和应用[D];南京理工大学;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978