收藏本站
《山东科技大学》 2010年 硕士论文
收藏 | 手机打开
二维码
手机客户端打开本文

不平衡数据集上支持向量机算法研究

刘维会  
【摘要】:支持向量机是由Vapnik等人提出的一种新的学习机器,它建立在统计学习理论基础之上,是处理小样本学习的有效工具,在文本自动分类、信号处理、手写数字识别、通讯等领域得到了广泛应用;并克服了传统机器学习中的过学习、维数灾难、局部极值等问题。通常的支持向量机在处理不平衡数据集时,不同类别样本数量上的差异导致分类器性能的下降,而实际应用中,少数类的样本往往提供更重要的信息,因此如何有效地提高不平衡数据集上机器学习的分类性能成为机器学习领域急需解决的课题。 本文首先介绍了支持向量机的基本理论以及处理不平衡数据集的支持向量机研究现状。对于两分类问题,正负类训练样本数量的不平衡对分类性能的影响很大,Veropulos等人对传统的SVM进行了改进,提出对不同的类别引入不同的惩罚因子。本文则基于正负类的样本数量,结合支持向量,提出了一种调整分类超平面的方法。该方法有效地提高了正类的预测正确率。 寻找支持向量机的最优参数也是支持向量机研究领域的一个重要分支。本文从两个惩罚参数的不平衡数据分类模型出发,在其对偶问题中,把两个惩罚参数也看作核函数的参数,结合最优化方法,分别对L1-SVM和L2-SVM提出了在不平衡数据集上进行参数选择的新方法。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 杨毅;卢诚波;徐根海;;面向不平衡数据集的一种精化Borderline-SMOTE方法[J];复旦学报(自然科学版);2017年05期
2 杨智明;彭宇;彭喜元;;基于支持向量机的不平衡数据集分类方法研究[J];仪器仪表学报;2009年05期
3 孙全尚;;不平衡数据集分类方法研究[J];科教文汇(下旬刊);2013年09期
4 刘丽娜;于治楼;张化祥;;针对不平衡数据集的维数约简方法[J];信息技术与信息化;2011年05期
5 李明方;张化祥;张雯;计华;;不平衡数据集的神经网络阈值优化方法[J];计算机工程与应用;2010年20期
6 文传军;詹永照;;基于样本投影分布的平衡不平衡数据集分类[J];计算机应用研究;2009年08期
7 李春雪;谢林森;卢诚波;;面向不平衡数据集的一种基于聚类的欠采样方法[J];数学的实践与认识;2019年01期
8 白凤凤;;基于不平衡数据集的文本分类技术研究[J];电脑编程技巧与维护;2010年06期
9 赵小强;刘梦依;;基于不平衡数据集的主动学习分类算法[J];控制工程;2019年02期
10 魏勋;蒋凡;;基于大规模不平衡数据集的糖尿病诊断研究[J];计算机系统应用;2018年01期
11 赵秀宽;阳建宏;黎敏;徐金梧;;一种改进的不平衡数据集分类方法[J];计算机工程;2011年15期
12 曹路;王鹏;;基于SMOTE采样和支持向量机的不平衡数据分类[J];五邑大学学报(自然科学版);2015年04期
13 王成强;;基于不平衡数据集的文本分类技术[J];电脑知识与技术;2009年36期
14 张玉芳;王勇;熊忠阳;刘明;;不平衡数据集上的文本分类特征选择新方法[J];计算机应用研究;2011年12期
15 殷士勇;;面向不平衡数据集的线性分类方法研究[J];重庆工商大学学报(自然科学版);2010年05期
16 温雪岩;陈家男;景维鹏;徐克生;;面向不平衡数据集分类模型的优化研究[J];计算机工程;2018年04期
17 尚旭;;不平衡数据集的混合采样方法[J];数字技术与应用;2016年12期
中国重要会议论文全文数据库 前10条
1 赵秀宽;阳建宏;黎敏;徐金梧;;一种改进的不平衡数据集分类方法[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 缪国宇;刘洪鹏;苏文学;刘荣生;赵相东;;基于数据仓库的企业指标分析系统[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
3 王子恒;齐勇刚;刘军;;路面交通标志检测调研:数据集及算法[A];2018中国汽车工程学会年会论文集[C];2018年
4 肖志博;王焕钢;肖英超;徐文立;;面向大规模数据集的单类支持向量机[A];2013年中国智能自动化学术会议论文集(第三分册)[C];2013年
5 郭景峰;杜京;马倩;邹晓红;;一种基于数据集性质的快速等差模式聚类算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 孟烨;张鹏;宋大为;王雷;;信息检索系统性能对数据集特性的依赖性分析[A];需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集[C];2013年
7 田捷;;三维医学影像数据集处理的集成化平台[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
8 冷传良;;飞机化铣成样板划线数据集设计方法探索[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
9 范明;魏芳;;挖掘基本显露模式用于分类[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 刘通;张宇献;;基于加权平均数的模糊聚类有效性函数[A];第十届沈阳科学学术年会论文集(信息科学与工程技术分册)[C];2013年
中国博士学位论文全文数据库 前10条
1 张静静;基于不平衡数据集的支持向量机模型与算法研究[D];中国农业大学;2015年
2 孙秀宝;基于CMA-LSAT v1.0数据集的近百年全球陆表气温变化研究[D];南京信息工程大学;2018年
3 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
4 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年
5 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年
6 纳赛尔 阿里 穆罕默德 巴拉卡特;复杂化学数据的知识发现新型化学计量学算法研究[D];湖南大学;2005年
7 李宏;面向应用领域的分类方法研究[D];中南大学;2007年
8 余雳;虚拟可视鼠样品制备技术研究[D];华中科技大学;2006年
9 李超;高阶多数据集建模新方法与应用研究[D];哈尔滨工程大学;2017年
10 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
中国硕士学位论文全文数据库 前10条
1 刘维会;不平衡数据集上支持向量机算法研究[D];山东科技大学;2010年
2 郝姝雯;基于支持向量机的不平衡数据集分类算法研究[D];哈尔滨工程大学;2011年
3 孟军;不平衡数据集分类算法的研究[D];南京理工大学;2014年
4 刘凯;数据挖掘中类不平衡数据集分类模型研究[D];辽宁科技大学;2014年
5 刘梦依;基于不平衡数据集的数据挖掘分类算法研究[D];兰州理工大学;2017年
6 闫欣;综合过采样和欠采样的不平衡数据集的学习研究[D];东北电力大学;2016年
7 陈斌;SMOTE不平衡数据过采样算法的改进与应用[D];广西大学;2015年
8 徐丽丽;面向不平衡数据集的分类算法研究[D];辽宁师范大学;2016年
9 姚冰;一种改进的非平衡数据集支持向量机分类算法[D];吉林大学;2010年
10 俞闯;半监督学习中不平衡数据集分类研究[D];大连理工大学;2015年
中国重要报纸全文数据库 前10条
1 记者 张梦然;癌症学研究公布最新数据集[N];科技日报;2018年
2 记者 张梦然;最大规模婴儿微生物组数据集建立[N];科技日报;2018年
3 记者 王莉英;行政审批网上全流程办理率年底超80%[N];深圳特区报;2017年
4 记者 金昶 通讯员 陈斯音;我国发布首款全球海洋Argo网格数据集产品[N];中国海洋报;2017年
5 中国青年报·中青在线记者 谢宛霏;为AI领域“造血”[N];中国青年报;2017年
6 记者 罗旭;全球人工智能挑战赛开赛[N];光明日报;2017年
7 记者 刘钊 通讯员 徐文慧 杨溯;自主研发数据集显示今年上半年最热[N];中国气象报;2015年
8 冉瑞奎 刘晓林 戴艳萍;均一化历史气温数据集问世[N];中国气象报;2006年
9 通讯员廖雅琴记者冯竞;“国人数字化可视人体数据集”完成[N];科技日报;2003年
10 记者 张梦然;科学家以图片数据集揭秘“生命奥秘”[N];科技日报;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978