收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于结构化SVM的直接优化不平衡准则算法研究

杨康  
【摘要】:近年来,随着现代计算机技术的高速发展,在科学研究和社会生活等各个领域中积累了大量的数据,为各种不同应用提供了重要的支持。与此同时如何从这些数据中发现更多的有用信息也成为人们的一个迫切需求,数据挖掘和机器学习的出现很好地满足了这一需求。作为数据挖掘中的一个基本方法:分类学习已经引起广大科研工作者的关注,而二分类更是由于其广泛的应用基础成为其中的研究重点,但是在真实的应用中,很多二分类场景都是不平衡的,已有的平衡二分类算法难以直接使用,对此,近些年人们提出研究面向不平衡数据集的二分类算法,其基本思路分为面向数据的改进和面向算法的改进;而后者更是由于不需要对数据做预处理成为当前研究的重点。本文就是在此基础上,以SVM为工具,重点研究了基于结构化SVM的不平衡二分类算法,文中首先介绍了基于SVM的二分类算法以及不平衡二分类的应用背景,然后分析了不平衡二分类算法的研究现状,并在此基础上提出采用基于直接优化不平衡准则的方法来构造面向不平衡数据的改进SVM算法。不同于已有基于SVM的改进算法,本文提出将不平衡二分类问题看成一个学习分类队列的过程,并提出使用结构化SVM进行求解。本文的主要工作有:(1)针对AM,QM等不平衡评价准则,提出使用基于n-slack的结构化SVM作为算法框架,并定义了面向AM和QM的目标函数。针对目标函数的非光滑难以直接优化,提出使用割平面算法进行求解,使得算法的迭代次数为o(1/s2),其中ε为允许的错误。同时针对AM,QM算法内部“寻找最大最违约”子过程,分别设计了两个高效的算法,其时间复杂度均仅为o(mlogm)。不平衡数据集上的实验表明:所提算法不仅明显优于传统SVM算法,且相比起面向数据的改进算法也更加有效。(2)针对GTP/PR评估标准,提出一个基于1-slack结构化SVM的直接优化算法。算法首先定义了面向GTP/PR的目标函数,该目标比已有面向F1的目标函数更紧凑,针对新目标函数非光滑,提出使用基于1-slack的割平面算法进行求解,使得算法的迭代次数仅为o(1/ε),也更适合大规模的应用场景。面向大规模不平衡数据集的实验结果表明,所提算法不仅优于已有其他的改进算法,且算法的效率更加高效。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王胜祥;现实、实践与理论——兼谈图书馆高位理论[J];黑龙江图书馆;1990年02期
2 王健庭;火信号的采集与相关修正[J];数据采集与处理;1987年02期
3 陈国阶;我国东西部发展不平衡与西部开发[J];科技导报;1995年07期
4 王萌;施艳艳;王海明;沈明辉;;不平衡电网电压下双馈风力发电系统强励控制[J];测控技术;2014年07期
5 漫征;;克服地区落后论的错误思想[J];新闻战线;1960年11期
6 ;来稿选题建议[J];青年研究;1999年01期
7 沈睿;;区域发展不平衡——不同地域中小企业信息化建设差距较大[J];每周电脑报;2004年08期
8 张昕竹;用电信普遍服务政策改善经济发展不平衡[J];通信世界;2001年16期
9 周耘;;试论我国年鉴发展的不平衡性[J];图书馆学研究;1987年04期
10 刘叶婷;;智慧城市应依“标”而建[J];信息化建设;2013年09期
11 韩继章;;不平衡种种[J];高校图书馆工作;2014年01期
12 蔡瑞瑱;;浅析华为上下行不平衡故障[J];广东通信技术;2009年11期
13 王建定;;扩大优质教育资源是一个长期的动态的过程[J];现代教学;2010年03期
14 廖枫明;;架空输电线路覆冰不平衡张力的计算与分析[J];通讯世界;2014年07期
15 邹权;郭茂祖;刘扬;王峻;;类别不平衡的分类方法及在生物信息学中的应用[J];计算机研究与发展;2010年08期
16 唐小卫;朱金福;高强;;流不平衡条件下飞机恢复的优化模型与算法研究[J];小型微型计算机系统;2010年04期
17 李文昌;;我国企业信息化建设现状、问题及政策建议[J];中国管理信息化;2006年12期
18 刘铁;马超;黄秋元;;一种IQ delay不平衡估计与补偿方法[J];网络新媒体技术;2013年04期
19 侯利明;孙宝升;;I/Q不平衡对卫星高速数据中继系统的影响[J];无线电通信技术;2005年06期
20 金瑞卿;1997年收款机市场回顾[J];市场与电脑;1998年02期
中国重要会议论文全文数据库 前6条
1 张雨石;唐丽敏;王庸凯;陈文科;;关于中日航线集装箱运量不平衡原因的分析[A];中国航海学会——2004年度学术交流会优秀论文集[C];2004年
2 廖芳宇;;基于LabVIEW的三相不平衡的测量[A];2011年云南电力技术论坛论文集(入选部分)[C];2011年
3 沙鹏程;;关于西部民营企业可持续发展的思考[A];第十四次全国回族学研讨会论文汇编[C];2003年
4 张敦伟;丁博;;配电网三相不平衡补偿的探讨[A];2007中国电机工程学会电力系统自动化专委会供用电管理自动化学科组(分专委会)二届三次会议论文集[C];2007年
5 王仲生;王翔;;转子不平衡自愈监控系统设计[A];第七届全国信息获取与处理学术会议论文集[C];2009年
6 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前3条
1 孙绍华;不平衡电网条件下并网逆变关键技术研究[D];哈尔滨工业大学;2015年
2 艾旭升;基于免疫系统的不平衡数据分类方法研究[D];苏州大学;2016年
3 杨泽平;基于神经网络的不平衡数据分类方法研究[D];华东理工大学;2015年
中国硕士学位论文全文数据库 前10条
1 刘庆;双馈异步风力发电机在电网电压不平衡条件下的控制策略研究[D];贵州大学;2015年
2 刘静蕾;60GHz通信系统中IQ不平衡的影响分析与补偿算法研究[D];电子科技大学;2014年
3 贾鹏飞;针对高密度不平衡样本分类方法的研究[D];哈尔滨工业大学;2014年
4 刘娜;我国排舞运动发展的基本问题探析[D];山东体育学院;2015年
5 张子伟;电网电压不平衡时电压型PWM整流器控制策略的研究[D];河南理工大学;2014年
6 潘嘉进;船舶电力系统电压不平衡时光伏并网系统控制研究[D];大连海事大学;2016年
7 张立旺;基于不平衡数据的分类方法研究[D];中北大学;2016年
8 岳彦哲;不平衡电网条件下双馈异步电机优化控制研究[D];北方工业大学;2016年
9 王若宇;电网不平衡条件下三相PWM整流器控制及并联研究[D];东北大学;2014年
10 杨康;基于结构化SVM的直接优化不平衡准则算法研究[D];安徽大学;2016年
中国重要报纸全文数据库 前10条
1 本报记者 刘金松;教育最大的不公平是教育资源不平衡[N];经济观察报;2014年
2 程凯;解决不平衡还要靠市场[N];中华工商时报;2005年
3 本报见习记者 周宁;示范小城镇建设“四个不平衡”[N];经济信息时报;2013年
4 记者 张黎明;我市治堵工作进展不平衡[N];金华日报;2014年
5 本报记者 任珺;发展不平衡 差距大隐忧多[N];中国煤炭报;2014年
6 本报记者 黄志凌 实习生 戴必莲;保险:从不平衡到平衡[N];四川日报;2004年
7 戴盈;中法贸易存在结构性不平衡短期难逆转[N];中国信息报;2013年
8 记者 王宙洁;宽松过头 全球陷入不平衡复苏格局[N];上海证券报;2013年
9 海北支队 高军;抓基层应重点抓薄弱环节[N];人民武警;2008年
10 本报记者 李香才;运网不平衡为智能交通提供空间[N];中国证券报;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978