收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于神经网络的不平衡数据分类方法研究

杨泽平  
【摘要】:不平衡数据分类问题是机器学习领域内一个重要的研究课题,引起国内外学者的广泛关注。不平衡数据普遍存在于现实生活中,例如:基因表达数据、信用卡交易数据和医学数据等。现有分类器及其学习算法在解决不平衡数据分类问题时,由于只关注整体识别率而往往忽视少数类的识别率。如何改善类间样本的不平衡,增加少数类的识别率,同时兼顾多数类的准确度,是亟需解决的一个问题。 本论文分析和比较了一些常用的分类模型与算法对不平衡数据集的学习和推广性能,从数据和算法两个层面重点研究基于神经网络的不平衡数据分类方法。本文的主要研究工作如下: (1)在分析了不平衡数据对神经网络及其误差反传(Back-propagation, BP)算法性能影响的基础上,提出了面向不平衡数据集的主动下采样算法。该算法可以自动去除远离边界的多数类样本,在保持整体分布特性近似不变的前提下,使得类别间不平衡程度得到改善。本文根据不平衡分类评价指标对主动下采样算法和现有采样方法进行了比较。实验结果表明,本文提出的下采样算法能够有效地减轻不平衡数据对BP算法性能的影响,提高少数类识别率且兼顾整体识别率。 (2)传统采样方法在解决不平衡分类问题时容易导致类间样本重叠,现有数据清理算法在判断样本是否可删除时总是存在误删除现象。借鉴离群点检测算法的思想,结合采样方法,提出了边界噪声因子(Borderline Noise Factor, BNF)的概念,给出了基于边界噪声因子的数据清理算法。实验结果证明,基于边界噪声因子的数据清理算法和采样方法相结合可有效改善不平衡和类间样本重叠对BP算法性能的影响。 (3)针对不平衡数据对极限学习机(Extreme Learning Machine, ELM)算法的影响,提出了量子行为粒子群优化极限学习机算法,该算法采用量子行为粒子群优化算法来优化极限学习机的网络结构,在经验风险和结构风险之间保持一个良好的平衡,并采用面向不平衡数据集分类器的评价标准作为优化算法的目标评价函数;实验结果证明,该算法不仅能够优化极限学习机的网络结构,且适用于不平衡数据集。 (4)传统极限学习机对不平衡数据集分类时,采用相同的错分代价,导致少数类的识别率不高,针对这一问题提出了加权极限学习机的权值新策略;极限学习机算法随机选择输入权值和隐层阈值而导致隐节点大量冗余,加重了网络结构的复杂程度,影响了极限学习机的推广性能,因此提出了一种自适应剪枝算法来解决隐节点冗余问题,并采用隐节点输出向量正交投影距离和隐节点输出向量的范数这两种剪枝标准:将自适应剪枝算法与加权极限学习机相结合,提出自适应剪枝加权极限学习机算法。实验证明,自适应剪枝加权极限学习机算法能够有效地解决不平衡问题,且有很好的推广性能。 (5)基因表达数据有着样本分布不平衡,基因维数大,样本维数小等特点,针对基因表达数据的特点,采用分类信息指数准则来进行初始基因的选择,然后利用主成分分析进行降维,同等条件下,采用不同的分类算法对实际的基因表达数据(结肠数据集、白血病数据集、蛋白质数据集等)进行了分析,结果表明本文所提出的这些不平衡分类算法能够提高基因表达数据的分类准确率。 总之,本论文主要以经典的机器学习数据库不平衡数据集和基因表达数据为应用对象,从数据和算法两方面提出一系列学习方法,提高了神经网络对不平衡数据集的分类能力。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郭华平;董亚东;邬长安;范明;;面向类不平衡的逻辑回归方法[J];模式识别与人工智能;2015年08期
2 赵秀宽;阳建宏;黎敏;徐金梧;;一种改进的不平衡数据集分类方法[J];计算机工程;2011年15期
3 孙德森;;供暖管道热力不平衡的处理措施与分析[J];地产;2019年19期
4 王少华;;不平衡[J];教育科学论坛;2020年01期
5 廖思源;;配电网三相不平衡产生原因及治理技术研究[J];电力设备管理;2020年09期
6 曾瑞明;刘江敏;;发展不平衡问题的生成逻辑与治理路径[J];东华大学学报(社会科学版);2020年03期
7 冷漠;;艺术发展的社会性[J];北方音乐;2017年13期
8 邹力行;;重视平衡创新[J];中国科技产业;2016年06期
9 阿达丽;;逃离北京后,儿子对现在的学校各种挑剔[J];婚姻与家庭(社会纪实);2017年03期
10 杨丽;;观察探究不能“由己推人”[J];学前教育;2017年01期
11 黄菊芳;;探析六年级英语课堂缩小两极分化的策略[J];新课程(小学);2017年05期
12 两色风景;吴怀银;;长跑囧事[J];儿童故事画报;2017年21期
13 伍君仪;;心脏不好,慎练上肢[J];恋爱婚姻家庭.养生;2017年05期
14 闵保华;;心态平衡才能安度晚年[J];家庭医药.快乐养生;2017年06期
15 许诺然;;原来相处这么简单[J];小猕猴学习画刊;2017年Z4期
16 ;协调发展[J];China Today;2017年07期
17 林旭鸣;方钦艺;;重冰杆塔不平衡受力的原因分析[J];河北农机;2014年05期
18 陈兴稣;王雪峰;;一种基于聚类的不平衡数据分类算法[J];信息技术;2013年08期
19 李风华;;资本主义发展不平衡:基于机制的解释[J];政治经济学评论;2013年03期
20 焦方义;;如何看待发展不平衡问题[J];决策探索(下半月);2011年02期
中国重要会议论文全文数据库 前20条
1 王力;;探析:新时代我国体育的不平衡不充分发展[A];第七届中国体育博士高层论坛论文摘要汇编[C];2018年
2 张雨石;唐丽敏;王庸凯;陈文科;;关于中日航线集装箱运量不平衡原因的分析[A];中国航海学会——2004年度学术交流会优秀论文集[C];2004年
3 庞玉萍;刘叶青;;空间不平衡和区域协调发展可以并行不悖吗?[A];现代化经济体系与高质量发展——第十三届中华发展经济学年会会议论文摘要集[C];2019年
4 陈垠宇;陈民武;解绍锋;;IEC/TR 61000-3-13电压不平衡限值评估导则研究综述[A];第九届电能质量研讨会论文集[C];2018年
5 陈津;;析配变台区三相不平衡治理技术[A];电网节能与电能质量技术论文集[C];2018年
6 沙鹏程;;关于西部民营企业可持续发展的思考[A];第十四次全国回族学研讨会论文汇编[C];2003年
7 康党兴;赵航;;低压配电网三相不平衡对线损影响的分析[A];电网节能与电能质量技术论文集[C];2018年
8 Robert E.Lucas;;增长、贫困以及不平衡[A];北京论坛(2004-2015)主旨报告与特邀报告集[C];2016年
9 赵秀宽;阳建宏;黎敏;徐金梧;;一种改进的不平衡数据集分类方法[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
10 万晓凤;胡海林;聂晓艺;余运俊;曾繁鹏;;电网电压不平衡时的改进虚拟同步机控制策略[A];2018年江西省电机工程学会年会论文集[C];2019年
11 廖芳宇;;基于LabVIEW的三相不平衡的测量[A];2011年云南电力技术论坛论文集(入选部分)[C];2011年
12 邹永龙;李也白;范越;李铭栀;王丽强;;低配网三相不平衡治理的研究与应用[A];浙江省电力学会2018年度优秀论文集[C];2018年
13 李紫薇;;风电机组风轮不平衡故障仿真[A];第十六届沈阳科学学术年会论文集(理工农医)[C];2019年
14 张茉楠;;提高对当前宏观经济不平衡性风险的认识[A];中国智库经济观察(2013年第2辑)[C];2014年
15 张敦伟;丁博;;配电网三相不平衡补偿的探讨[A];2007中国电机工程学会电力系统自动化专委会供用电管理自动化学科组(分专委会)二届三次会议论文集[C];2007年
16 孙永;孙勇;王磊;王洪博;;水力不平衡故障诊断模型在抽蓄机组故障预警中的应用[A];2019智能电网新技术发展与应用研讨会论文集[C];2019年
17 花少震;曹伟;;基于黏弹性的多型腔自然平衡流道系统不平衡充填三维数值模拟与机理分析[A];第十一届南方计算力学学术会议(SCCM-11)摘要集[C];2017年
18 周艳希;;农村公共服务供给的不平衡性与解决对策[A];社会主义新农村建设公共服务研究研讨会论文集[C];2007年
19 王伯生;贾振华;;老有所为是促进健康的仙丹妙方[A];老年人才资源开发学术研讨论文集[C];2003年
20 吕英杰;;配网三相不平衡调节及无功补偿方法的研究[A];2007中国电机工程学会电力系统自动化专委会供用电管理自动化学科组(分专委会)二届三次会议论文集[C];2007年
中国博士学位论文全文数据库 前20条
1 杨泽平;基于神经网络的不平衡数据分类方法研究[D];华东理工大学;2015年
2 张建军;静态与动态的不平衡分类问题研究[D];华南理工大学;2020年
3 管红娇;针对不平衡数据复杂分布特征的分类方法研究[D];哈尔滨工业大学;2020年
4 孙飞;面向机器学习城镇不平衡数据集分类方法的研究[D];中国地质大学;2020年
5 艾旭升;基于免疫系统的不平衡数据分类方法研究[D];苏州大学;2016年
6 文博;中国经常项目不平衡研究[D];西南财经大学;2008年
7 夏锦文;平衡与不平衡视角下的产业发展研究[D];河海大学;2006年
8 张静静;基于不平衡数据集的支持向量机模型与算法研究[D];中国农业大学;2015年
9 张婷;中国股票市场指令不平衡与市场有效性研究[D];华东理工大学;2020年
10 潘桔;中国区域经济发展不平衡测度及影响因素分析[D];辽宁大学;2020年
11 王瑞;针对类别不平衡和代价敏感分类问题的特征选择和分类算法[D];中国科学技术大学;2013年
12 刘珍;因特网流量类不平衡特性与分类方法的研究[D];华南理工大学;2013年
13 李凤岐;基于半监督学习的不平衡数据分类算法与应用[D];大连理工大学;2014年
14 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
15 汪锋;中国的制度变迁与经济发展不平衡:1978-2005[D];重庆大学;2007年
16 郭磊;图像识别中的不平衡学习和增量学习方法研究[D];太原理工大学;2021年
17 陈雷;射频非理想特性的基带补偿技术研究[D];电子科技大学;2017年
18 安锦香;地方政府竞争与外资分布的不平衡性研究[D];大连理工大学;2013年
19 谭智力;不平衡及非线性条件下三相四线UPQC的控制策略研究[D];华中科技大学;2007年
20 王柔化;汉英不平衡双语者二语言语产出句法启动实验研究[D];东北师范大学;2019年
中国硕士学位论文全文数据库 前20条
1 刘赓;不平衡数据分类方法研究及其应用[D];重庆邮电大学;2020年
2 张岚;基于分解策略的多类不平衡分类算法研究[D];湖南大学;2020年
3 张华斌;基于不平衡数据挖掘的远程故障诊断研究[D];华中科技大学;2007年
4 何元钰;基于不平衡数据集分类的Relief算法研究与应用[D];湖南大学;2019年
5 李红杨;四川省发展不平衡不充分综合评价与提升机制[D];西南财经大学;2019年
6 刘庆;虚拟同步发电机技术及其不平衡电网下的应用[D];北京交通大学;2019年
7 周家宇;不平衡工况下三相并网变流器的有源功率解耦方法研究[D];北京交通大学;2019年
8 钟曼莉;基于柔性多状态开关的配电网三相不平衡补偿策略研究[D];合肥工业大学;2019年
9 施凯伦;直流配电网在交流侧不平衡情况下的控制策略研究[D];华北电力大学;2019年
10 杜展鑫;配电网三相不平衡与非线性负载综合补偿方法研究[D];华北电力大学;2019年
11 秦洁;非正弦不平衡系统的功率因数计算方法研究[D];西安科技大学;2019年
12 杨颖;低压配电网三相不平衡治理的研究[D];电子科技大学;2019年
13 李宇;基于数据驱动的风机核心部件健康监测方法研究及应用[D];电子科技大学;2019年
14 王纯海;基于PIR控制算法的三相负荷不平衡治理研究[D];西安科技大学;2018年
15 赵平;肺癌患者补体系统不平衡性及其潜在的生理机制研究[D];南昌大学;2019年
16 李哲;基于GAN的不平衡数据增强算法及其应用研究[D];北京交通大学;2019年
17 邹东兴;面向不平衡电商评论文本的改进朴素贝叶斯分类模型研究[D];广州大学;2019年
18 李京华;基于混合式不平衡数据处理的模糊神经分类模型[D];云南大学;2018年
19 余春霖;基于邻域三支决策的不平衡数据二分类方法及其应用研究[D];重庆邮电大学;2019年
20 曾琳;基于SVC+SVG的低压配电网不平衡三相负载混合补偿模型的研究[D];南昌大学;2019年
中国重要报纸全文数据库 前20条
1 本报记者 刘金松;教育最大的不公平是教育资源不平衡[N];经济观察报;2014年
2 记者 郭锦润 夏升权;加快补齐区域城乡发展不平衡短板[N];中山日报;2021年
3 李佳芸;聚焦发展不平衡不充分问题发力[N];昆明日报;2020年
4 本报评论员;集中精力解决发展不平衡不充分问题[N];青海日报;2020年
5 顾伯冲;聚焦各种不平衡不充分问题发力[N];学习时报;2020年
6 记者 宋庆艳;聚焦发展不平衡不充分问题 推动岚山经济社会又好又快发展[N];日照日报;2018年
7 记者 林仪 揭春雁;把乡村振兴战略作为解决发展不平衡不充分问题的根本之策[N];人民政协报;2018年
8 本报评论员;深入解决发展不平衡不充分问题[N];咸阳日报;2019年
9 武汉大学中国乡村治理研究中心主任、教授 贺雪峰;振兴乡村如何避免新不平衡[N];环球时报;2018年
10 记者 戚奇明;做大“蛋糕”有利于解决“不平衡”[N];上海金融报;2019年
11 记者 甘敏;广西着力解决教育发展不平衡不充分问题[N];广西法治日报;2019年
12 记者 丁白玉;解决发展不平衡不充分问题 努力办好人民满意的教育[N];湘潭日报;2019年
13 本报记者;环境状况治理不平衡 脏乱差问题仍在[N];丹东日报;2019年
14 记者 袁绫 通讯员 胡玉坤 龙许;为山区解决发展不平衡不充分问题提供经验示范[N];西江日报;2017年
15 杨宏斌;在不平衡中谋作为[N];中国摄影报;2018年
16 记者 郑少杰;驻林芝市各村工作队着力破解发展不平衡不充分[N];西藏日报(汉);2018年
17 中国社会科学院学部委员、中国区域经济学会会长 金碚;不平衡要协调,平衡了也要协调[N];北京日报;2018年
18 中国妇女报·中国女网记者 宋利彩 贾莹莹;让教育资源告别“不平衡”[N];中国妇女报;2018年
19 本报记者 张衡;解决教育不平衡不充分矛盾[N];中国财经报;2018年
20 记者 吴明亮;大力实施乡村振兴战略 努力解决不平衡不充分问题[N];南京日报;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978