收藏本站
《国防科学技术大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

特征选择算法研究

苏映雪  
【摘要】: 特征选择是目标识别技术的关键技术环节之一。特征选择按照和后续分类算法的结合方式可分为嵌入式、过滤式和封装式。本文主要研究过滤式和封装式特征选择算法。 本文首先引用了M. Dash和H. Liu提出的特征选择框架,这个框架指出一个特征选择算法是由“特征子集生成”、“特征子集评价”、“停止条件”和“结果验证”四个部分组成的。基于这个框架,本文总结归纳了常用特征选择算法的搜索策略和评价准则。 过滤式(Filter)特征选择算法的评价准则与分类器无关,论文研究了两种过滤式算法。第一种过滤式算法是ReliefF算法与一种基于特征相关性算法的组合式算法。ReliefF算法产生的特征有效性强,但可能存在冗余性;Mitra提出了一种基于最大信息压缩指标的算法,这种算法能很好的去除冗余特征,但也可能选择无效特征。依据两种算法的优缺点将二者组合在一起使用,组合算法产生的特征子集都是有效特征,而且不存在冗余特征。第二种过滤式算法是改进的HFR算法:针对HFR算法用于评估待选特征重要性的特征频数(CR值)与构造简单差异矩阵的参数有关这一不足,论文提出用特征的属性重要性度量(SGF值)代替CR值来度量待选特征重要性,改进了HFR算法。 封装式(Wrapper)特征选择算法是评价准则与分类器有关的方法。本文提出了两种封装式算法。一种是基于分类结果矩阵的特征选择算法:首先受粗糙集相对差异比较表的启发,提出分类结果矩阵的概念,并将粗糙集中构造最小差异表(MDL)的思想应用到选择特征子集的过程中,实验验证这种算法性能良好,选出的特征子集不仅提高了分类器的速度,而且保证了分类精度。另一种算法是基于互补系数的特征选择算法:本文从特征对样本的分类效果的角度来度量特征之间的相关性,并提出互补系数的概念,然后在权值较大的待选特征中选择与已选特征互补系数大的特征。实验验证这种算法能够很好去除无效特征和冗余特征,并且与传统的封装式算法相比大大降低了时间复杂度。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.4

【引证文献】
中国期刊全文数据库 前1条
1 王鹏鸣;吴水秀;王明文;黄国斌;;基于偏最小二乘特征抽取的垃圾邮件过滤[J];中文信息学报;2008年01期
中国博士学位论文全文数据库 前3条
1 周雄;基于GA-NN的旋转机械故障逐次诊断研究[D];重庆大学;2008年
2 郭磊;面向高速网络管控的多业务识别关键技术研究[D];解放军信息工程大学;2012年
3 刘晨彬;基于磁共振图像分析的神经胶质瘤分子标记物检测研究[D];浙江大学;2013年
中国硕士学位论文全文数据库 前10条
1 王文栋;GEP及SVM融合的分类技术研究[D];广西师范学院;2010年
2 苏喻;基于语义的文本聚类搜索研究[D];安徽大学;2011年
3 范志超;基于禁忌搜索算法的特征选择研究[D];安徽理工大学;2010年
4 曹忠波;改进的双聚类算法在癌症基因芯片数据中的应用[D];吉林大学;2009年
5 陈路莹;高维数据的聚类分析方法研究及其应用[D];厦门大学;2009年
6 高文婷;稳健语音特征和音频场景识别方法的研究[D];大连理工大学;2009年
7 侯大军;基于机器视觉的苹果特征选择和分类识别系统[D];江苏大学;2010年
8 曹静;基于最大相关最小冗余的特征选择算法研究[D];燕山大学;2010年
9 李想;基于模糊熵的特征选择方法的研究与实现[D];东北师范大学;2010年
10 王春霞;特征选择方法及其在红斑鳞状皮肤病诊断中的应用研究[D];陕西师范大学;2010年
【参考文献】
中国期刊全文数据库 前1条
1 吴旻晖,宣国荣,柴佩琪;基于Chernoff上界的多类问题特征选择优化迭代算法[J];计算机应用与软件;2000年05期
【共引文献】
中国期刊全文数据库 前10条
1 李燕琴;一种生态旅游者的识别与细分方法——以北京市百花山自然保护区为例[J];北京大学学报(自然科学版);2005年06期
2 张则飞;邢立新;;纹理特征在Aster影像数据分类中的应用[J];吉林大学学报(地球科学版);2006年S1期
3 尚小晶;刘小梅;李成凤;李阳;田彦涛;;神经元的几何形态分类[J];吉林大学学报(信息科学版);2011年03期
4 杨晓懿,刘嘉勇,陈淑敏;SVM在文本自动分类中的应用[J];成都信息工程学院学报;2005年02期
5 武志强;巨辉;曹世梅;;改进的BP神经网络在数字识别上的应用[J];成都信息工程学院学报;2008年06期
6 刘继忠,周晓军,熊勇;人工免疫系统超变异模式识别及应用[J];传感技术学报;2005年03期
7 张永强;陈香;王从政;董中飞;左鹏飞;;基于FPGA的实时手势识别系统[J];传感技术学报;2011年11期
8 潘巨龙;高建桥;徐展翼;李文锦;李子印;;一种基于确定性理论的无线传感器网络信任机制nTRUST[J];传感技术学报;2012年02期
9 郭文;乔谊正;;改进的DKLT在彩色客票票号分割中的应用[J];传感器与微系统;2009年05期
10 林明华;项霞;王辉;;打桩锤击次数的时域识别[J];测绘工程;2008年03期
中国重要会议论文全文数据库 前10条
1 王红霞;田国会;李晓磊;卜范骞;;基于地标信息融合的家庭环境机器人组合导航[A];第二十六届中国控制会议论文集[C];2007年
2 曹爱增;陈月婷;魏军;李金屏;;一种基于EDAs和聚类分析的杂合进化算法[A];第二十六届中国控制会议论文集[C];2007年
3 李鑫;李力争;;基于模板匹配的固态流体流速检测算法[A];第二十七届中国控制会议论文集[C];2008年
4 李潮潮;迟凯;付芳萍;车文刚;赵庆江;;基于模糊聚类的证券价格对公共信息的反应强度划分[A];第二十九届中国控制会议论文集[C];2010年
5 赵庆江;迟凯;付芳萍;李潮潮;车文刚;;基于FCM的模糊时间序列模型及人民币汇率预测[A];第二十九届中国控制会议论文集[C];2010年
6 刘涛;陈浩文;王书宏;黎湘;;基于红外多光谱的空间点目标识别方法研究[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
7 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
8 曾莱蓓;孙星明;向凌云;罗纲;;基于虚词变换的文本隐藏信息检测方法研究[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年
9 王海旗;陈文汉;孙忠;;现代雷达技术及展望[A];第二届全国信息与电子工程学术交流会暨第十三届四川省电子学会曙光分会学术年会论文集[C];2006年
10 陈战伟;李晋宏;;领域知识在知识发现过程中的使用[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
中国博士学位论文全文数据库 前10条
1 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
2 易吉良;基于S变换的电能质量扰动分析[D];湖南大学;2010年
3 陈韶斌;基于知识推理和视觉机理的遥感图像目标识别方法研究[D];华中科技大学;2010年
4 宋清昆;自适应结构优化神经网络控制研究[D];哈尔滨理工大学;2009年
5 高杰;基于过渡金属的超分子光化学传感器识别生物功能性检测物[D];华东理工大学;2010年
6 陶勇;知识辅助的SAR图像目标特性分析与识别研究[D];国防科学技术大学;2010年
7 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
8 薛冬新;激光扭矩测量中散斑统计学理论及试验研究[D];大连理工大学;2011年
9 刘怀广;浮法玻璃缺陷在线识别算法的研究及系统实现[D];华中科技大学;2011年
10 郑庆庆;纹理特征提取及其在图像分割中的应用研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
2 宋晓玥;基于TDPCA与SPIHT的高光谱压缩和降维算法研究[D];哈尔滨工程大学;2009年
3 叶铂;基于统计学方法的水面目标特征提取与识别方法的研究[D];哈尔滨工程大学;2010年
4 梁怀志;基于嵌入式的车型分类系统的设计与实现[D];大连理工大学;2010年
5 蒙昭森;基于图像的AGV道路交通标志识别技术研究[D];沈阳理工大学;2010年
6 姜伦;模糊聚类算法及其在中文文本聚类中的研究与实现[D];哈尔滨理工大学;2010年
7 刘怀愚;静态图像的车辆检测算法研究[D];淮北师范大学;2010年
8 张云鹏;发动机机械故障诊断系统特征提取算法研究[D];长春工业大学;2010年
9 沈小静;基于小波包变换和支持向量机的中医声诊客观化研究[D];华东理工大学;2011年
10 相景丽;Web挖掘技术在远程教学系统中的应用[D];电子科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 孙艳丰;;基于遗传算法和禁忌搜索算法的混合策略及其应用[J];北京工业大学学报;2006年03期
2 杨兆升;龚勃文;林赐云;张欣伟;;分对数模型在城市快速路交通状态预测中的应用[J];北京工业大学学报;2009年04期
3 魏景芝;辛阳;杨义先;钮心忻;;用于检测过滤的多模式匹配[J];北京邮电大学学报;2007年06期
4 安欣;王韬;张录达;;一种基于SVM分类的多类识别方法及应用[J];北京农学院学报;2006年02期
5 刘文军,王加银,冯艳宾,谷云东,李洪兴;一种求粗糙集中最小属性约简的新算法[J];北京师范大学学报(自然科学版);2004年01期
6 任其亮;肖裕民;;城市路网交通拥堵H-Fuzzy评判方法研究[J];重庆交通大学学报(自然科学版);2008年05期
7 李春生;陈光辉;;基于最大信息压缩指标与层次分析法的电力负荷组合预测模型[J];电力科学与技术学报;2008年01期
8 刘桂生;城市快速路系统规划设计[J];城市道桥与防洪;2000年01期
9 王春迎,郝士琦,李洪淘,陈修桥;基于结构自适应神经网络特征选择的一种改进方法[J];电光与控制;2005年05期
10 李久芳;;基于二值化的边缘图像滤波方法[J];电子工业专用设备;2010年02期
中国重要会议论文全文数据库 前1条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 董春娇;多状态下城市快速路网交通流短时预测理论与方法研究[D];北京交通大学;2011年
2 林冠洲;网络流量识别关键技术研究[D];北京邮电大学;2011年
3 李庆中;苹果自动分级中计算机视觉信息快速获取与处理技术的研究[D];中国农业大学;2000年
4 夏建涛;基于机器学习的高维多光谱数据分类[D];西北工业大学;2002年
5 焦卫东;基于独立分量分析的旋转机械故障诊断方法研究[D];浙江大学;2003年
6 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
7 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
8 杨宇;基于EMD和支持向量机的旋转机械故障诊断方法研究[D];湖南大学;2005年
9 李云;特征选择算法及其在基于内容图像检索中的应用研究[D];重庆大学;2005年
10 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘荣烨;最大相关最小冗余的无监督特征选择算法的研究及其应用[D];中国海洋大学;2010年
2 王瑛;基于模糊聚类的入侵检测算法研究[D];江西理工大学;2010年
3 曹份槟;基于PCA和SVM的货车故障检测[D];北京交通大学;2011年
4 刘燕;城市道路交通流状态辨识及决策方法研究[D];合肥工业大学;2011年
5 李娇;支持向量机参数优化研究[D];华中师范大学;2011年
6 章渺;高速公路基本路段实时交通状态识别方法[D];长安大学;2011年
7 黄伟;基于DPI的P2P应用识别与流量控制[D];复旦大学;2010年
8 韦旭棉;基于固定型检测器的高速公路自动事件检测算法研究[D];山东大学;2011年
9 赵小强;交通事故持续时间预测理论与方法[D];清华大学;2010年
10 庞淑敬;基于模糊聚类分析的入侵检测技术研究[D];长沙理工大学;2011年
【二级引证文献】
中国期刊全文数据库 前7条
1 窦东阳;杨建国;李丽娟;赵英凯;;基于规则的神经网络在模式分类中的应用[J];东南大学学报(自然科学版);2011年03期
2 邓星;胡腾飞;李江华;;神经网络的滚动轴承故障诊断[J];重庆文理学院学报;2013年03期
3 陈俊;刘遵雄;;基于非负矩阵分解特征提取的垃圾邮件过滤[J];华东交通大学学报;2010年06期
4 叶吉祥;龚希龄;;一种快速的Wrapper式特征子集选择新方法[J];长沙理工大学学报(自然科学版);2010年04期
5 赵文旻;姬长英;李莹莹;;自然场景下成熟苹果的图像识别研究[J];科学技术与工程;2012年27期
6 计智伟;吴耿锋;;基于层次聚类算法和偏最小二乘的特征选择[J];计算机工程与设计;2009年21期
7 吴军;杜泽华;;一种以DPI为核心的网络流量识别方案[J];软件导刊;2014年01期
中国博士学位论文全文数据库 前3条
1 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
2 褚娜;基于混合智能的中医辨证系统研究[D];上海交通大学;2012年
3 顾宝兴;智能移动式水果采摘机器人系统的研究[D];南京农业大学;2012年
中国硕士学位论文全文数据库 前10条
1 赵郅;一种改进的双聚类算法及其应用[D];吉林大学;2011年
2 李楠;基于邻域粗糙集的属性约简算法研究[D];陕西师范大学;2011年
3 李栋;超声回波信号处理与特征提取研究[D];内蒙古大学;2011年
4 赵春;面向基因表达数据的特征选择算法研究[D];燕山大学;2011年
5 徐辰冠;基于数据挖掘聚类技术的我国高校分类研究[D];华中科技大学;2011年
6 彭昂;基于复杂属性相似度的聚类算法研究及应用[D];湖南大学;2010年
7 班怀芸;基于模糊偏最小二乘的特征抽取方法研究[D];南京理工大学;2009年
8 岑芳明;基于核偏最小二乘分类的垃圾邮件过滤研究[D];江西师范大学;2009年
9 张雁;基于禁忌粒子群算法的多目标背包问题研究[D];湖南师范大学;2012年
10 李莉;五种双聚类算法在基因表达谱数据中的比较与评价[D];西北农林科技大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 简清明;曾黄麟;叶晓彤;;粗糙集特征选择和支持向量机在入侵检测系统中的应用[J];四川理工学院学报(自然科学版);2009年05期
2 肖迪;张广明;;基于粗糙集理论的肺癌细胞图像识别[J];南京工业大学学报(自然科学版);2007年06期
3 张翔;周明全;耿国华;;基于粗糙集的中文文本特征选择方法研究[J];计算机应用与软件;2010年03期
4 谭台哲;梁应毅;刘富春;;一种ReliefF特征估计方法在无监督流形学习中的应用[J];山东大学学报(工学版);2010年05期
5 张志飞;苗夺谦;;基于粗糙集的文本分类特征选择算法[J];智能系统学报;2009年05期
6 段丽;张建明;;基于粗糙集的表情特征选择[J];计算机工程与应用;2010年32期
7 钱宇华;梁吉业;王锋;;面向非完备决策表的正向近似特征选择加速算法[J];计算机学报;2011年03期
8 吴克寿;陈玉明;谢荣生;王晓栋;;基于粗糙集与蚁群优化算法的特征选择方法研究[J];计算机应用研究;2011年07期
9 袁赣;张巍;蔡庆生;;具有非一致性数据预处理的粗糙集特征选择算法[J];计算机科学;2004年10期
10 孙春明;徐燕;林碧英;;一种基于词条频率的文档频率方法的改进[J];中国电力教育;2006年S3期
中国重要会议论文全文数据库 前10条
1 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 万京;王建东;;一种基于新的差异性度量的ReliefF方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 蒋苏萍;吴今培;;粗糙集神经网络的应用研究[A];中国运筹学会第八届学术交流会论文集[C];2006年
5 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
6 马玉良;赵光宙;;粗糙集理论及其在工程中的应用研究[A];第11届全国电气自动化电控系统学术年会论文集[C];2002年
7 刘碧森;姚宇;;粗SVM理论及其在税收预测中的应用[A];第三届全国信息获取与处理学术会议论文集[C];2005年
8 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 王强;曾向阳;王曙光;李娜;;主元分析在水下目标特征选择中的应用[A];中国声学学会水声学分会2011年全国水声学学术会议论文集[C];2011年
10 杨斌;闫桦;;基于粗糙集理论的农业水价承受能力研究[A];第十一届中国管理科学学术年会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 ;一种过滤式储水瓶 97245915.4[N];中国包装报;2003年
2 周晓娟;TD已过分水岭[N];通信产业报;2008年
3 佘启元;如何选择呼吸防护装备(上)[N];中国安全生产报;2005年
4 孙文杰;呼吸防护用品选择不当导致死亡[N];中国安全生产报;2005年
5 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
6 王立勤 刘明慧;过滤式管理提升措施效果[N];中国石化报;2009年
7 浙江 张培君;空气加湿器的特点与使用[N];电子报;2007年
8 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
9 顾永强 王振华;给成本“漏斗”装上“过滤网”[N];中国石化报;2005年
10 张晶明;选台空气净化器居家生活更惬意[N];中国消费者报;2001年
中国博士学位论文全文数据库 前10条
1 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
2 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
3 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
4 张颖;基于群集智能模式识别方法的研究[D];大连理工大学;2008年
5 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
6 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
7 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
8 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
9 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
10 张勇;粗糙集—神经网络智能系统在浮选过程中的应用研究[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 苏映雪;特征选择算法研究[D];国防科学技术大学;2006年
2 王丽红;基于粗糙集理论的文本分类技术研究[D];天津师范大学;2009年
3 张亚平;基于粗糙集和神经网络的数据分类技术研究[D];大连理工大学;2008年
4 林宏正;基于粗糙集和神经网络的邮件分类研究[D];暨南大学;2008年
5 张青枝;基于粗糙集的专家系统研究[D];武汉理工大学;2003年
6 张腾飞;基于粗糙集和RBF网络的动态建模方法研究[D];上海海事大学;2004年
7 陈鑫影;基于粗糙集理论的约简算法研究[D];吉林大学;2005年
8 吴习宇;粗糙集理论在农业决策支持系统知识发现中的应用[D];西南农业大学;2005年
9 房一鸣;用分类树算法进行上市公司评级的实证研究[D];对外经济贸易大学;2006年
10 黄文涛;在数据挖掘中概念格的理论研究[D];兰州理工大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026