收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

样例权重估计及在此基础上的SVM

申丰山  
【摘要】:样例权重估计和支持向量机(SVM)是从学习样例中获取知识的两类工具,在解决复杂分类学习任务中具有重要的作用。虽然SVM具有优良的泛化性能,但是其应对大规模样本、增量样本及噪声样本的能力有待于改善。如何通过样例权重估计有效获取可供SVM改善其性能的信息也是一个颇具挑战性的问题。本文首先对样例权重估计进行了深入探讨,研究如何将机器学习技术应用于样例权重估计,以提高信息获取质量,然后研究了基于样例权重估计的增量SVM和模糊SVM(fuzzy supportvector machine,FSVM)。 本文主要工作包括以下几个方面: 1.提出了基于零间隔分类面的样例权重估计方法。该方法为每个样例建立一个通过它的合适的分类面,即零间隔分类面,该分类面对两类样本的分类精度或误分率作为该样例的权重。所产生的权重作为概率预测了样例在未来SVM学习中的重要性,同时也预测了SVM可能达到的分类精度。这表明,新方法产生的权重是根据样例对学习机的影响效果计算的,对学习机的性能具有正面引导作用。而传统几何距离型权重对学习机的影响情况是很难预测的,对学习机的性能难以进行正面引导。在模拟数据和IDA真实数据上的实验结果表明,所提方法对样例作用的预测性能比传统方法有显著提高。 2.提出了基于准支持向量界定的增量SVM。该方法在接收增量样例的同时淘汰无用历史样例,使系统只保持较有价值的学习样例,减轻系统存储和计算负担。准支持向量使用基于零间隔分类面的样例权重估计方法获取,具有计算节时、筛选质量高的综合优势。在模拟数据和IDA真实数据上的实验结果验证了所提方法的优越性。 3.为了抑制噪声/离群点对SVM的不利影响,利用样例权重估计方法设计了一种新型模糊权重函数,并将其与SVM结合形成FSVM。与使用传统模糊权重函数的FSVM相比,所提出的FSVM能够更有效地抑制离群样例。在模拟数据、IDA和UCI真实数据上的实验结果表明新FSVM的分类性能优于传统FSVM。 4.针对数据集含噪情况未知的情况,提出了一种权重水平浮动的FSVM,以提高FSVM对不同数据集的学习性能,使FSVM具有部分或完全转变为SVM的能力。在该方法中,样例模糊权重的大小将随数据集的可分性作浮动。不影响分类性能的样例免于抑制,只有影响分类性能的样例才会受到适当的抑制。权重水平浮动的FSVM对数据集噪声情况具有智能判别能力,能够在执行标准SVM程序和执行具有抑制功能的传统FSVM程序之间自动切换,减轻了用户手工选择不同类型分类器的负担,克服了盲目、过度抑制样例影响SVM性能的问题。在IDA和UCI真实数据上的实验结果验证了所提方法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王清翔;仲婷;潘金贵;;基于SVM的日文网页分类[J];广西师范大学学报(自然科学版);2007年02期
2 赵书河,冯学智,都金康,林广发;基于支持向量机的SPIN-2影像与SPOT-4多光谱影像融合研究[J];遥感学报;2003年05期
3 张键;于忠党;栾海滢;;基于SVM的教师评价系统研究[J];教育信息化;2006年03期
4 薄丽玲;;基于SVM的数字图像水印检测算法设计[J];科技情报开发与经济;2007年33期
5 黄秀丽;王蔚;;SVM在非平衡数据集中的应用[J];计算机技术与发展;2009年06期
6 刘晓亮;丁世飞;朱红;张力文;;SVM用于文本分类的适用性[J];计算机工程与科学;2010年06期
7 任俊旭;;基于SVM的企业信息化能力成熟度测度模型研究[J];商业文化(下半月);2011年04期
8 吴春辉;陈洪生;;基于内容的音频分类技术综述[J];现代计算机(专业版);2011年05期
9 毛伟;;基于支持向量机的回归应用研究[J];科技资讯;2011年12期
10 王双亭;艾泽天;都伟冰;康敏;;基于SVM不同核函数的多源遥感影像分类研究[J];河南理工大学学报(自然科学版);2011年03期
11 王亮申,欧宗瑛,苏铁明,杨鑫华,曾好平;利用SVM和灰度基元共生矩阵进行图像数据库检索[J];大连理工大学学报;2003年04期
12 业宁,孙瑞祥,董逸生;MLSVM4——一种多乘子协同优化的SVM快速学习算法[J];计算机研究与发展;2005年09期
13 周珂;彭宏;胡劲松;;支持向量机在心电图分类诊断中的应用[J];微计算机信息;2006年09期
14 游智;李战怀;张阳;;基于字符串核的免分词中文文本分类方法[J];计算机工程与应用;2006年26期
15 朱艳辉;王平;周咏梅;;一种基于Agent的中文Web信息自动检索系统(英文)[J];微电子学与计算机;2006年S1期
16 王明高;王琰;;基于小波提取特征的SVM目标识别[J];沈阳理工大学学报;2006年05期
17 霍东云;聂峰光;郭力;;利用Medline文摘数据库研究文本分类[J];计算机与应用化学;2007年09期
18 刘忠铁;;基于SVM的图像特征样本集构造技术研究[J];科技情报开发与经济;2007年26期
19 刘太安;杨柏翠;刘欣颖;李涵;;基于特征选择的最少核分类器研究[J];计算机工程与应用;2007年16期
20 杨克领;姜慧霖;;基于SVM的新多类分类算法[J];电脑知识与技术(学术交流);2007年13期
中国重要会议论文全文数据库 前10条
1 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
3 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
4 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
5 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
6 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
8 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
9 ;Adaptive Control of Nonlinear System Based on SVM Online Algorithm[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
中国博士学位论文全文数据库 前10条
1 申丰山;样例权重估计及在此基础上的SVM[D];西安电子科技大学;2011年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
4 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
5 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
6 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
7 曹志坤;制冷陈列柜性能仿真SVM方法的研究及应用[D];上海交通大学;2010年
8 王金林;基于混沌时间序列和SVM的入侵检测系统研究[D];天津大学;2010年
9 包鑫;稳健回归技术及其在光谱分析中的应用[D];浙江大学;2010年
10 渐令;基于核的学习算法与应用[D];大连理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 严会霞;基于SVM的眼动轨迹解读思维状态的研究[D];太原理工大学;2010年
2 吴迪;基于SVM分类器的分步定位算法研究[D];哈尔滨工业大学;2010年
3 杨焕;基于Basic-N-Units特征的SVM方法预测MicroRNA[D];吉林大学;2010年
4 曾玉祥;盲抽取与SVM方法在地球化学异常下限提取中的应用[D];成都理工大学;2010年
5 曹云生;基于支持向量机(SVM)的森林生态系统健康评价及预警[D];河北农业大学;2011年
6 张汉女;基于SVM的海岸线提取方法研究[D];东北师范大学;2010年
7 姚玉;基于GA-SVM算法的细胞色素酶P450突变预测[D];上海交通大学;2011年
8 陈燃燃;基于SVM算法的web分类研究与实现[D];北京邮电大学;2010年
9 陈卓;基于聚类和SVM主动反馈的图像检索方法[D];重庆大学;2010年
10 冯青;基因微阵列数据的SVM分类器优化方法[D];东北师范大学;2010年
中国重要报纸全文数据库 前10条
1 郭涛;利用SVM虚拟化技术实现容灾[N];中国计算机报;2008年
2 本报记者 韩露;乱军之中智者胜[N];证券时报;2000年
3 ;基于网络层的存储虚拟化是主流[N];中国计算机报;2008年
4 本报记者 郭平;LSI发布新存储虚拟化管理器[N];计算机世界;2008年
5 辽宁 老牛;五角钱救活“老”光驱[N];电脑报;2004年
6 耿银平;应急预案必不可少[N];中国石油报;2004年
7 王为民 莫凡;债市中期牛市或将延续稳定[N];第一财经日报;2006年
8 本报记者  禹刚;8月CPI温和上涨1.3%[N];上海证券报;2006年
9 叶檀;罗奇:内需再不拉动中国危险[N];上海证券报;2006年
10 陆文磊 屈庆;加息预期渐强 防御是最好选择[N];证券时报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978