收藏本站
收藏 | 论文排版

基于聚类的相关向量机快速分类算法研究

刘俊顺  
【摘要】:分类是一个比较复杂且实用的问题,它涉及多个学科的研究领域,如统计学习、机器学习、数据挖掘等。针对分类问题,Michael E. Tipping提出一种基于稀疏贝叶斯学习理论的相关向量机,此学习机训练出的模型不仅具有很好的稀疏性,而且是概率输出。但当训练数据集规模较大时,该模型训练的时间复杂度较高,本文从以下几个方面对该问题进行研究和分析: 1.基于局部分类的思想,本文提出基于聚类的相关向量机快速分类算法BS-RVM(算法名称是Bit Reduction算法、SMOTE算法、RVM结合而成)。该算法引入Bit Reduction算法对训练样本进行聚类,将其划分为多个不同的数据簇,并利用SMOTE算法对其中的不平衡数据簇进行调整和处理,然后针对各个数据簇,构建多个局部分类器。 2.本文根据测试样本与众多局部分类器对应的二进制码之间的海明距离,选择最近的分类器进行测试,这是一个分类器动态选择的过程。并通过5组数据集的实验,说明BS-RVM算法在一定程度上提高了模型的训练速度和稀疏性,且具有处理大规模数据集的能力。 3.本文对聚类算法Bit Reduction中参数b与模型训练时间、相关向量个数(RVS)、误差率、测试时间之间的关系进行讨论,得到如下结论:当参数b值逐渐增大时,该四个衡量指标逐渐趋向平稳状态。 4.最后本文通过可视化的方法对相关向量定性解释进行说明,并从此角度说明BS-RVM算法具有较好的可行性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨新民;向量集值变分不等式解的存在性[J];工程数学学报;1992年03期
2 王晓明;;功能验证的探索与思考[J];科技致富向导;2008年18期
3 王有新;;叠前正交分解去噪方法[J];石油地球物理勘探;1990年04期
4 管宇,刘越英;单假币辨识的非适应算法[J];河南师范大学学报(自然科学版);2005年03期
5 刘锐;Fuzzy数矩阵与Fuzzy数向量集(英文)[J];哈尔滨工业大学学报;1987年04期
6 陈收;多状态相关系统分析研究[J];系统工程;1988年02期
7 黄修武,杨静宇,郭跃飞,荆晓远;一种新颖的分组决策方法及其应用[J];南京理工大学学报;1999年06期
8 吴哲辉;;关于PETRI网可重复性的充分必要条件的一个证明[J];山东科技大学学报(自然科学版);1985年03期
9 葛泽慧;胡奇英;;默会合作[J];系统工程理论与实践;2007年07期
10 姚楚君;;基于稀疏表示的超平面聚类盲信号分离算法[J];科技信息;2010年16期
11 仁增旺堆;伊格尔·斯迈;;有限域上向量子集中的陪集及最小陪集覆盖[J];西藏大学学报(自然科学版);2011年01期
12 李梦如;石琴春;;关于线性代数课教学的两点看法[J];大学数学;2006年02期
13 陈雪梅;;学生怎样理解向量的线性相关性[J];数学教育学报;2007年02期
14 周豫苹;陈东;;一类基于模式分类算法的入侵检测系统[J];漳州师范学院学报(自然科学版);2007年03期
15 苏连塔;黄利文;;改进的基于特征向量集的距离判别及在企业信用评价中的应用[J];数学的实践与认识;2011年01期
16 杨炳良;函数与线性函数[J];湖州师范学院学报;1980年S1期
17 薛建安;;多状态系统分析问题的若干理论结果[J];北京工商大学学报(自然科学版);1985年01期
18 李宏涛;向量集值函数松弛型弱有效鞍点元的存在性[J];宝鸡文理学院学报(自然科学版);2001年01期
19 王盘兴;李丽平;周伟灿;;某些气象统计问题的几何学分析[J];气象教育与科技;2001年01期
20 刘裔宏;;系统工程的数学基础[J];系统工程;1985年02期
中国重要会议论文全文数据库 前10条
1 王杰;梁华国;李华伟;闵应骅;李晓维;;基于输出违例概率的时延向量测试质量评估[A];第六届中国测试学术会议论文集[C];2010年
2 林元庆;陈加良;;方法群评价中权重集化问题的研究[A];2002年中国管理科学学术会议论文集[C];2002年
3 王文峰;王酣;关锡佑;;功能测试码I_(DDD)测试向量的优化[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
4 曹贝;肖立伊;王永生;;基于非一致CA的低功耗确定测试向量发生器的设计[A];第五届中国测试学术会议论文集[C];2008年
5 赵骏;陈汉武;陈开中;肖芳英;;可逆逻辑电路多余门错误的检测[A];全国第十三次光纤通信暨第十四届集成光学学术会议论文集[C];2007年
6 童占梅;;基于模糊聚类的语音识别[A];1999年中国智能自动化学术会议论文集(上册)[C];1999年
7 刘培强;谢青松;朱大铭;;用于基因表达谱数据聚类分析的贪心图划分算法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
8 何关钰;;受限解耦控制问题的初等变换法[A];1996年中国控制会议论文集[C];1996年
9 高飞;荆继武;向继;;文本挖掘系统的可视化方法研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
10 杨婷;邝继顺;;基于测试片段间转移的低功耗BIST实现[A];第四届中国测试学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 王岩;生物信息学和生物信号识别领域的机器学习算法研究[D];吉林大学;2007年
2 庄毅;海量多媒体数据库的高效查询处理[D];浙江大学;2007年
3 冯奇;POMDP近似解法研究及在中医诊疗方案优化中的应用[D];北京交通大学;2011年
4 范金锋;脑电非线性时间序列仿真研究[D];中国科学技术大学;2007年
5 刘万里;支持向量机中若干问题及应用研究[D];西安电子科技大学;2008年
6 周海燕;基于集合卡尔曼滤波法的非高斯含水层参数识别[D];中国地质大学(北京);2012年
7 李远;多UAV协同任务资源分配与编队轨迹优化方法研究[D];国防科学技术大学;2011年
8 李伟东;负载平衡及相关优化问题[D];云南大学;2010年
9 陈彧;基于自适应个体评价策略的多目标演化算法[D];武汉大学;2011年
10 李小燕;凸体及星体的不等式与极值问题[D];上海大学;2004年
中国硕士学位论文全文数据库 前10条
1 易东严;基于树形向量解压缩器降低测试数据量的研究[D];湖南大学;2009年
2 吴振中;人脸识别特征提取的研究[D];南京理工大学;2008年
3 孙发圣;支持向量机学习算法及其在雷达目标识别中的应用[D];国防科学技术大学;2007年
4 王昌君;一种基于Petri网的加解密算法的设计与实现[D];华东师范大学;2008年
5 杨显飞;基于边界向量预选的支持向量机算法研究[D];哈尔滨工程大学;2008年
6 姚蕾;GPCA在视频可伸缩编码中的研究和应用[D];浙江大学;2007年
7 李强;电路板故障诊断硬件平台中向量控制器设计[D];西安电子科技大学;2009年
8 李中华;基于有界延迟模型的延迟测试算法研究[D];湖南大学;2011年
9 张晶;图像边缘检测算法的研究[D];山东大学;2006年
10 代亮;基于支持向量机的文本分类问题研究[D];大连海事大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978