收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于布谷鸟搜索算法的特征选择研究及改进

王莹莹  
【摘要】:在当今人工智能时代,特征选择是具有重要意义的大数据预处理的方式。特征选择可以避免维度灾难、减少学习算法在执行过程中的时间、有效地防止过拟合现象、过滤掉噪声数据。在这个数据量如此庞大的今天,我们需要从巨大的数据量中找到一些对我们有用的数据再进行训练或者学习,所以特征选择无疑是值得研究和探讨的。特征选择是一个需要从庞大的数据集中挑选出优质的特征的过程,因此也可以理解成是一个搜索过程。而如果我们用穷举的方法去进行特征选择显然失去了特征选择的意义。随机算法是一类优化求解方法,可以很好地应用到特征选择当中。随机算法一般包含群体智能算法,如蚁群和粒子群优化算法以及模拟退火算法等。近年来提出的布谷鸟算法同样也是一种应用广泛的随机算法。布谷鸟搜索算法在优化问题中取得了不错的效果,所以我们尝试将其离散化后应用到特征选择问题上,并且对其改进优化。最近研究表明,布谷鸟优化特征选择算法(BCS)具有较好分类效果。然而,BCS算法也有一些不足。第一,BCS算法初始化的随机性导致算法盲目性太大,而算法后面的过程都是依赖初始化的过程而进行的,所以如果初始化质量不好,会严重影响算法的更新迭代过程的效果;第二,BCS算法中适应度函数的局限性严重限制了该算法的分类性能和维度缩减能力;第三,迭代过程中优质的特征没有保留到下一轮迭代中。因此,根据以上说明的BCS算法缺点提出三点改进。首先,根据混沌序列可得到优质序列的特性重新构建了一种新的初始化策略。由于混沌序列有很多种类,不同种的混沌序列映射也有不同的性质。所以对不同的混沌序列映射进行测试,并根据实验结果判断哪种混沌映射更适合布谷鸟搜索算法的初始化。我们对近年表现比较好的Logistic混沌映射、Tent映射以及Chebyshev映射进行测试,得出Chebyshev映射更适合布谷鸟搜索算法初始化过程。采用Chebyshev混沌映射不但使随机性减小,增大算法的收敛速度,而且使用Chebyshev混沌映射初始化的布谷鸟巢内部结构也更精致,更利于后期算法的更新。其次,原始BCS算法中的适应度函数过于简单,我们用信息增益去衡量分类器的分类准确率,用L1范数衡量维度缩减的程度,重写了BCS算法的适应度函数。最后,我们希望将迭代中的优质特征可以保留至下一次迭代中,这样可以减少搜索无用空间,提高算法收敛速度。因此我们将二个优秀序列进行与运算得到优质特征,利用或运算可将优质特征添加到新一轮迭代产生的序列中,重新优化迭代过程。通过以上三点构建了一个新的特征选择算法FS_CSO。在实验阶段,FS_CSO使用KNN,J48和SVM分类器来指导学习过程并在小型,中型和大型的UCI数据集上进行测试。实验结果表明,与BCS对比,FS_CSO显著提高了分类性能和维度缩减能力。将FS_CSO算法与近几年提出的比较高效的特征选择算法进行比较,不论是准确率,还是维度缩减,FS_CSO都具有很强的竞争力。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 张红涛,胡玉霞,邱道尹;遗传算法在储粮害虫特征选择中的应用[J];华北水利水电学院学报;2004年03期
2 徐雷;阎平凡;常迥;;用于特征选择的BF算法及其与B&B算法的比较[J];自动化学报;1988年05期
3 杨锦英;王碧泉;;K—W检验和熵法在单个特征选择中的应用[J];华北地震科学;1989年02期
4 陈晋苏;特征选择在电信行业客户流失分析中的应用[J];科技资讯;2005年22期
5 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
6 江乃雄;蔡民;;综合距离特征选择问题解的存在性与唯一性[J];计算机应用与软件;1992年01期
7 钱学双;多重筛选逐步回归特征选择法及其应用[J];信息与控制;1986年05期
8 赵帅;张雁;徐海峰;;基于成对约束分的特征选择及稳定性评价[J];计算机与数字工程;2019年06期
9 余胜龙;赵红;;基于样本邻域保持的代价敏感特征选择[J];数据采集与处理;2018年02期
10 杜政霖;李云;;基于特征聚类集成技术的在线特征选择[J];计算机应用;2017年03期
11 崔亚芬;解男男;;一种基于特征选择的入侵检测方法[J];吉林大学学报(理学版);2015年01期
12 林秀晶;夏勇明;钱松荣;;基于支持向量机及特征选择的单通道脑电波睡眠分期研究[J];生物医学工程学杂志;2015年03期
13 仇利克;刘竞;孙中卫;赵扬帆;;一种快速的特征选择框架和方法[J];北京邮电大学学报;2019年03期
14 黄铉;;特征选择研究综述[J];信息与电脑(理论版);2017年24期
15 杨超;蔡晓东;甘凯今;王丽娟;;基于自适应显著特征选择的动态加权平均行人识别模型[J];计算机工程与科学;2017年05期
16 章新华;一种特征选择的动态规划方法[J];自动化学报;1998年05期
17 单世超;栾翠菊;;基于局部特征选择的微博中文文本分类研究[J];现代计算机(专业版);2017年23期
中国重要会议论文全文数据库 前10条
1 史彩娟;沙宇阳;刘健;闫晓东;刘利平;;基于自适应半监督稀疏特征选择的图像标注[A];第十届全国信号和智能信息处理与应用学术会议专刊[C];2016年
2 刘培磊;李满生;王挺;;蛋白质相互作用有向关系抽取的特征选择[A];第五届全国信息检索学术会议论文集[C];2009年
3 袁帅;杨宏晖;申昇;;基于云模型的特征评价准则[A];第三届上海——西安声学学会学术会议论文集[C];2013年
4 申昇;杨宏晖;袁帅;;用于水声目标识别的互信息无监督特征选择[A];第三届上海——西安声学学会学术会议论文集[C];2013年
5 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
6 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
7 宋鹏;郑文明;赵力;;基于子空间学习和特征选择融合的语音情感识别[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年
8 臧淼;徐惠民;张永梅;;基于局部约束和稀疏编码的自动图像标注[A];国防光电子论坛第二届激光雷达成像探测技术及应用研讨会论文集[C];2015年
9 俞士汶;王治敏;朱学锋;;文学语言与自然语言理解研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 薛富强;葛临东;陈丽;;新的改进遗传算法用于调制信号特征选择[A];无线传感器网及网络信息处理技术——2006年通信理论与信号处理年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 Arfan Ali Nagra;混合粒子群优化算法研究及其应用[D];江苏大学;2019年
2 袁明冬;基于图的特征提取和特征选择及其应用研究[D];西安电子科技大学;2017年
3 胡小娟;基于特征选择的文本分类方法研究[D];吉林大学;2018年
4 任宇林;结构化预测中N元特征选择算法的研究[D];华中科技大学;2018年
5 Reehan Ali Shah;基于稀疏模型组合的网络入侵分类[D];浙江大学;2019年
6 滕旭阳;面向特征选择问题的优化方法研究[D];哈尔滨工程大学;2017年
7 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
8 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年
9 刘风;基于磁共振成像的多变量模式分析方法学与应用研究[D];电子科技大学;2014年
10 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 侯宇亮;基于极限学习机的分类方法研究及应用[D];中原工学院;2019年
2 尹春燕;基于集成特征选择的冠心病筛查模型研究[D];山东大学;2019年
3 薛瑞;转子故障诊断中的特征选择问题研究[D];兰州理工大学;2019年
4 周雨;基于互信息与决策树的特征选择[D];兰州大学;2019年
5 李琦;基于机器学习的毕业生就业预测模型研究与应用[D];中国科学院大学(中国科学院沈阳计算技术研究所);2019年
6 黄波;高校学生奖助管理系统设计与实现[D];西南科技大学;2018年
7 蓝劲鹏;基于特征选择的行人定位方法研究[D];上海交通大学;2017年
8 王莹莹;基于布谷鸟搜索算法的特征选择研究及改进[D];吉林大学;2019年
9 Wei Wang;P值的不稳定性与其他因素对统计特征选择的影响[D];天津大学;2018年
10 游仁春;基于特征选择聚类和张量分析的碳纤维增强复合材料超声缺陷识别[D];厦门大学;2017年
中国重要报纸全文数据库 前7条
1 本报记者 李振辉;根据自身特征选择健身方式[N];广东科技报;2008年
2 海通证券 娄静吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年
3 铁岭市第二高中 高军;让学生“动”起来[N];铁岭日报;2005年
4 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年
5 《网络世界》记者 周源;云平台,只选对的[N];网络世界;2012年
6 郑军;高产鹅选种方法和标准[N];河南科技报;2016年
7 记者 丁宁;2012年,我们一起“追”的创新产品[N];上海证券报;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978