收藏本站
《山东科技大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

不平衡数据集上支持向量机算法研究

刘维会  
【摘要】:支持向量机是由Vapnik等人提出的一种新的学习机器,它建立在统计学习理论基础之上,是处理小样本学习的有效工具,在文本自动分类、信号处理、手写数字识别、通讯等领域得到了广泛应用;并克服了传统机器学习中的过学习、维数灾难、局部极值等问题。通常的支持向量机在处理不平衡数据集时,不同类别样本数量上的差异导致分类器性能的下降,而实际应用中,少数类的样本往往提供更重要的信息,因此如何有效地提高不平衡数据集上机器学习的分类性能成为机器学习领域急需解决的课题。 本文首先介绍了支持向量机的基本理论以及处理不平衡数据集的支持向量机研究现状。对于两分类问题,正负类训练样本数量的不平衡对分类性能的影响很大,Veropulos等人对传统的SVM进行了改进,提出对不同的类别引入不同的惩罚因子。本文则基于正负类的样本数量,结合支持向量,提出了一种调整分类超平面的方法。该方法有效地提高了正类的预测正确率。 寻找支持向量机的最优参数也是支持向量机研究领域的一个重要分支。本文从两个惩罚参数的不平衡数据分类模型出发,在其对偶问题中,把两个惩罚参数也看作核函数的参数,结合最优化方法,分别对L1-SVM和L2-SVM提出了在不平衡数据集上进行参数选择的新方法。
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP18

【引证文献】
中国期刊全文数据库 前1条
1 孙九兵;王珊珊;;基于相空间重构的滑坡位移时间序列预测[J];科技视界;2015年27期
中国硕士学位论文全文数据库 前2条
1 武海涛;肝脏CT图像病变检测与识别应用研究[D];浙江大学;2016年
2 高春晓;非平衡模糊支持向量机分类算法研究[D];中国矿业大学;2014年
【参考文献】
中国期刊全文数据库 前10条
1 陈斌;陈松灿;潘志松;李斌;;异常检测综述[J];山东大学学报(工学版);2009年06期
2 常群;王晓龙;林沂蒙;王熙照;Daniel S.Yeung;;支持向量分类和多宽度高斯核[J];电子学报;2007年03期
3 黄李国;陈伟琪;王士同;;基于Parzen窗的投影聚类方法[J];广西师范大学学报(自然科学版);2006年04期
4 吴洪兴;彭宇;彭喜元;;适用于不平衡样本数据处理的支持向量机方法[J];电子学报;2006年S1期
5 岑涌;罗林开;;一种改善非平衡分布数据SVM分类能力的新策略[J];计算机与数字工程;2006年11期
6 刘爽;贾传荧;陈鹏;;一种自动选择参数的加权支持向量机算法[J];计算机工程与应用;2006年02期
7 潘继斌;;局部密度函数的支持向量机估计法[J];湖北师范学院学报(自然科学版);2005年04期
8 王斌,潘文锋;基于内容的垃圾邮件过滤技术综述[J];中文信息学报;2005年05期
9 郭庆强,李歧强;基于变精度粗集的生产调度规则获取[J];山东大学学报(工学版);2005年02期
10 彭新俊,胡光华;密度函数估计的修正SVM法[J];云南大学学报(自然科学版);2004年04期
中国重要会议论文全文数据库 前1条
1 侯伟真;潘美芹;;高斯核支持向量机最优模型参数选择搜索算法[A];中国运筹学会第八届学术交流会论文集[C];2006年
中国博士学位论文全文数据库 前1条
1 刘万里;支持向量机中若干问题及应用研究[D];西安电子科技大学;2008年
中国硕士学位论文全文数据库 前2条
1 刘全昌;支持向量机在入侵检测中的应用研究[D];山东科技大学;2008年
2 牟晓丹;不均衡支持向量机参数选取的两种优化方法[D];大连理工大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 易序峰;吴坚;喻高航;;基于自适应梯度算法的SVM核极化参数选择方法[J];赣南师范学院学报;2015年06期
2 衷路生;刘庆雄;龚锦红;张永贤;;基于Elastic Net-Decision Tree的垃圾邮件过滤研究[J];科学技术与工程;2015年32期
3 佘玉萍;陈淑清;;三种不同监督方法的离群值检测在欺诈交易上的比较[J];长春大学学报;2015年10期
4 杨超;李子怡;;基于树突状细胞算法的垃圾邮件群发检测[J];传感器与微系统;2015年10期
5 吴冰莹;林杨菲;;基于开源Spam Assassin识别过滤工具分析与应用[J];福建电脑;2015年09期
6 杜猛;;反垃圾邮件技术分析和发展研究[J];电子技术与软件工程;2015年16期
7 邓慧;;基于关联规则的垃圾邮件分类模型[J];计算机应用与软件;2015年08期
8 胡庆生;雷秀娟;;PPI网络的改进马尔科夫聚类算法[J];计算机科学;2015年07期
9 王伟;王建东;;机场噪声监测点的异常发现[J];小型微型计算机系统;2015年07期
10 刘君;宋志坚;;基于激光解析技术在蛋白质关联图预测问题数据集不均衡的研究[J];激光杂志;2015年06期
中国博士学位论文全文数据库 前7条
1 李大威;基于集成学习的高分遥感图像玉米区高精度提取算法研究[D];中北大学;2017年
2 程静;基本情感生理信号的非线性特征提取研究[D];西南大学;2015年
3 郭正刚;基于机器学习的盾构姿态调整决策方法研究[D];大连理工大学;2013年
4 刘丽梅;基于支持向量机新算法的流程工业过程故障诊断方法研究[D];东北大学;2012年
5 郑光辉;江苏部分地区土壤属性高光谱定量估算研究[D];南京大学;2011年
6 罗伊萍;LIDAR数据滤波和影像辅助提取建筑物[D];解放军信息工程大学;2010年
7 张海涛;自律计算系统的自律可信性评估研究[D];哈尔滨工程大学;2010年
中国硕士学位论文全文数据库 前4条
1 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
2 刘维会;不平衡数据集上支持向量机算法研究[D];山东科技大学;2010年
3 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
4 张新;并行支持向量机算法研究[D];山东科技大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 杨虎;吴北平;汪利;;混沌序列PSO-RBF耦合模型在滑坡位移预测中的应用[J];科学技术与工程;2013年30期
2 彭令;牛瑞卿;吴婷;;时间序列分析与支持向量机的滑坡位移预测[J];浙江大学学报(工学版);2013年09期
3 吴湘宁;胡炫;胡光道;胡成玉;李桂玲;;Oracle中使用支持向量机的时间序列预测方法[J];计算机工程与应用;2013年14期
4 熊天安;刘邦兵;雷畅;;相空间重构理论支持下的滑坡预测方法[J];地理空间信息;2011年03期
5 徐峰;汪洋;杜娟;叶疆;;基于时间序列分析的滑坡位移预测模型研究[J];岩石力学与工程学报;2011年04期
6 林大超;安凤平;郭章林;张立宁;;滑坡位移的多模态支持向量机模型预测[J];岩土力学;2011年S1期
7 董辉;傅鹤林;冷伍明;;支持向量机的时间序列回归与预测[J];系统仿真学报;2006年07期
8 陈荣鑫,陈维斌;基于Oracle ODM的数据挖掘研究[J];微机发展;2005年07期
9 刘开云,乔春生,滕文彦;边坡位移非线性时间序列采用支持向量机算法的智能建模与预测研究[J];岩土工程学报;2004年01期
10 唐璐,齐欢;混沌和神经网络结合的滑坡预测方法[J];岩石力学与工程学报;2003年12期
中国硕士学位论文全文数据库 前10条
1 卢鹤鸣;基于多期CT图像的常见肝脏疾病计算机辅助诊断系统[D];厦门大学;2014年
2 李贞贵;随机森林改进的若干研究[D];厦门大学;2013年
3 王沛;文本倾向性分析中的评价对象抽取与消歧研究[D];哈尔滨工业大学;2013年
4 韦琴林;CT图像中肝脏分割方法的研究[D];重庆大学;2012年
5 左弟俊;极速学习理论与应用研究[D];西安电子科技大学;2012年
6 刘维会;不平衡数据集上支持向量机算法研究[D];山东科技大学;2010年
7 于妍;基于不平衡数据集的文本分类技术[D];河北大学;2009年
8 丁子春;基于支持向量机的多领域自适应分类方法研究[D];武汉理工大学;2009年
9 雍凯;随机森林的特征选择和模型优化算法研究[D];哈尔滨工业大学;2008年
10 叶海军;模糊聚类分析技术及其应用研究[D];合肥工业大学;2006年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 王鹏博;医学X光图像感兴趣区域提取[D];西安工业大学;2017年
【二级参考文献】
中国期刊全文数据库 前10条
1 冯爱民;陈松灿;;基于核的单类分类器研究[J];南京师范大学学报(工程技术版);2008年04期
2 陈斌;冯爱民;陈松灿;李斌;;基于单簇聚类的数据描述[J];计算机学报;2007年08期
3 孙蕾,周明全,李丙春;一种非平衡分布数据的支持向量机新算法[J];计算机应用;2004年12期
4 李渝勤,孙丽华;基于规则的自动分类在文本分类中的应用[J];中文信息学报;2004年04期
5 范昕炜,杜树新,吴铁军;可补偿类别差异的加权支持向量机算法[J];中国图象图形学报;2003年09期
6 张军平,王珏;主曲线研究综述[J];计算机学报;2003年02期
7 落红卫,刘建毅,王枞,钟义信;智能邮件过滤系统的研究与实现[J];机电产品开发与创新;2003年01期
8 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
9 郭泓;电子邮件过滤技术浅析[J];信息网络安全;2002年10期
10 潘继斌;未确知函数及其应用[J];湖北师范学院学报(自然科学版);2002年03期
中国博士学位论文全文数据库 前2条
1 王磊;支持向量机学习算法的若干问题研究[D];电子科技大学;2007年
2 张国云;支持向量机算法及其应用研究[D];湖南大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 杨毅;卢诚波;徐根海;;面向不平衡数据集的一种精化Borderline-SMOTE方法[J];复旦学报(自然科学版);2017年05期
2 杨智明;彭宇;彭喜元;;基于支持向量机的不平衡数据集分类方法研究[J];仪器仪表学报;2009年05期
3 孙全尚;;不平衡数据集分类方法研究[J];科教文汇(下旬刊);2013年09期
4 刘丽娜;于治楼;张化祥;;针对不平衡数据集的维数约简方法[J];信息技术与信息化;2011年05期
5 李明方;张化祥;张雯;计华;;不平衡数据集的神经网络阈值优化方法[J];计算机工程与应用;2010年20期
6 文传军;詹永照;;基于样本投影分布的平衡不平衡数据集分类[J];计算机应用研究;2009年08期
7 李春雪;谢林森;卢诚波;;面向不平衡数据集的一种基于聚类的欠采样方法[J];数学的实践与认识;2019年01期
8 白凤凤;;基于不平衡数据集的文本分类技术研究[J];电脑编程技巧与维护;2010年06期
9 赵小强;刘梦依;;基于不平衡数据集的主动学习分类算法[J];控制工程;2019年02期
10 魏勋;蒋凡;;基于大规模不平衡数据集的糖尿病诊断研究[J];计算机系统应用;2018年01期
中国重要会议论文全文数据库 前10条
1 赵秀宽;阳建宏;黎敏;徐金梧;;一种改进的不平衡数据集分类方法[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 缪国宇;刘洪鹏;苏文学;刘荣生;赵相东;;基于数据仓库的企业指标分析系统[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
3 王子恒;齐勇刚;刘军;;路面交通标志检测调研:数据集及算法[A];2018中国汽车工程学会年会论文集[C];2018年
4 肖志博;王焕钢;肖英超;徐文立;;面向大规模数据集的单类支持向量机[A];2013年中国智能自动化学术会议论文集(第三分册)[C];2013年
5 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 孟烨;张鹏;宋大为;王雷;;信息检索系统性能对数据集特性的依赖性分析[A];需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
7 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
8 冷传良;;飞机化铣成样板划线数据集设计方法探索[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
9 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 刘通;张宇献;;基于加权平均数的模糊聚类有效性函数[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
中国重要报纸全文数据库 前10条
1 记者 张梦然;癌症学研究公布最新数据集[N];科技日报;2018年
2 记者 张梦然;最大规模婴儿微生物组数据集建立[N];科技日报;2018年
3 记者 王莉英;行政审批网上全流程办理率年底超80%[N];深圳特区报;2017年
4 记者 金昶 通讯员 陈斯音;我国发布首款全球海洋Argo网格数据集产品[N];中国海洋报;2017年
5 中国青年报·中青在线记者 谢宛霏;为AI领域“造血”[N];中国青年报;2017年
6 记者 罗旭;全球人工智能挑战赛开赛[N];光明日报;2017年
7 记者 刘钊 通讯员 徐文慧 杨溯;自主研发数据集显示今年上半年最热[N];中国气象报;2015年
8 冉瑞奎 刘晓林 戴艳萍;均一化历史气温数据集问世[N];中国气象报;2006年
9 通讯员廖雅琴记者冯竞;“国人数字化可视人体数据集”完成[N];科技日报;2003年
10 记者 张梦然;科学家以图片数据集揭秘“生命奥秘”[N];科技日报;2015年
中国博士学位论文全文数据库 前10条
1 张静静;基于不平衡数据集的支持向量机模型与算法研究[D];中国农业大学;2015年
2 孙秀宝;基于CMA-LSAT v1.0数据集的近百年全球陆表气温变化研究[D];南京信息工程大学;2018年
3 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
4 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年
5 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年
6 纳赛尔 阿里 穆罕默德 巴拉卡特;复杂化学数据的知识发现新型化学计量学算法研究[D];湖南大学;2005年
7 李宏;面向应用领域的分类方法研究[D];中南大学;2007年
8 余雳;虚拟可视鼠样品制备技术研究[D];华中科技大学;2006年
9 李超;高阶多数据集建模新方法与应用研究[D];哈尔滨工程大学;2017年
10 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
中国硕士学位论文全文数据库 前10条
1 刘维会;不平衡数据集上支持向量机算法研究[D];山东科技大学;2010年
2 郝姝雯;基于支持向量机的不平衡数据集分类算法研究[D];哈尔滨工程大学;2011年
3 孟军;不平衡数据集分类算法的研究[D];南京理工大学;2014年
4 刘凯;数据挖掘中类不平衡数据集分类模型研究[D];辽宁科技大学;2014年
5 刘梦依;基于不平衡数据集的数据挖掘分类算法研究[D];兰州理工大学;2017年
6 闫欣;综合过采样和欠采样的不平衡数据集的学习研究[D];东北电力大学;2016年
7 陈斌;SMOTE不平衡数据过采样算法的改进与应用[D];广西大学;2015年
8 徐丽丽;面向不平衡数据集的分类算法研究[D];辽宁师范大学;2016年
9 姚冰;一种改进的非平衡数据集支持向量机分类算法[D];吉林大学;2010年
10 俞闯;半监督学习中不平衡数据集分类研究[D];大连理工大学;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026