特征选择算法及其在基于内容图像检索中的应用研究
【摘要】:随着计算机应用范围和领域的日益扩大,特别是Internet 的飞速发展,在各种应用系统和Internet 上积累了大量、甚至海量数据,产生了“数据爆炸、知识贫乏”的现象;数据挖掘是解决这种问题的最为有效的手段,但是要有效地利用数据挖掘,对数据进行预处理是必不可少的,而特征选择是数据预处理中一种重要而且经常采用的方法。此外,在机器学习和模式识别中,特征选择也是一个必要的步骤。
特征选择的研究开始于上个世纪的六十年代,已经有几十年的历史,取得了许多成果,但随着新的应用领域和新对象不断涌现,使得特征选择还有许多问题亟待解决。本论文对此作了详细介绍,并对目前特征选择的研究热点和问题进行了深入的研究,取得了一定的成果。
作者把特征选择的研究分为三个阶段,首先介绍了常规的特征选择算法模型,并分别从研究人员和用户角度,对特征选择算法进行分类,这将大大方便用户选择合适的特征选择算法,有助于特征选择算法的应用,也为特征选择算法的进一步研究打下坚实的基础。
其次,提出或者介绍了一些具体的特征选择算法,也是当前的一些研究重点和热点,包括在模糊特征空间进行特征选择的算法、监督的高维特征选择算法、非监督的高维特征选择算法和小样本训练的特征选择算法。其中,对于模糊特征空间的特征选择,主要是利用扩张矩阵作为搜索策略,类间的模糊相似性作为评价准则,理论和实验都表明该算法具有较好的性能和低的时间开销。该算法属于一种专业算法,充分考虑特征的模糊性,可以应用到模糊分类器的设计中。而在监督的高维特征选择中,由于现实的高维数据集中往往存在大量的冗余特征和不相关特征,因此作者提出了一种基于特征关联性的分层过滤器方法,有效地消除冗余特征和不相关特征,实验表明该算法能有效地降低特征维数。同时将该方法与部分基于关联性的方法进行了比较分析,并全面系统地回顾了所有基于特征关联性的高维特征选择算法以及关联性的定义和计算公式,大大有助于以后的研究。在非监督特征选择的研究中,作者提出一种新的基于特征排序和分层的过滤器算法,排序规则采用的是指数熵,而评价准则采用了模糊特征评价指标,该算法克服了其它一些非监督特征选择算法的缺点,可以同时剔除冗余特征和不相关特征,能有效处理高维数据和噪声数据,且计算的开销较小。前面提出的三种算法都是建立在训练样本较充分的基础之上,但当可获取的训练样本相对于特征维数偏少时,如何有效地进行特征选择?作者详细介绍了一类基于支持向量机的特征选择
|
|
|
|
1 |
袁红春;黎莹;熊范纶;;一种新的面向渔情预测的智能数据处理模型研究[J];计算机应用研究;2009年12期 |
2 |
朱艳辉;阳爱民;杨伟丰;;基于模糊集和支持向量机的文本流派分类方法[J];计算机工程与应用;2008年11期 |
3 |
刘洪刚;徐克宝;赵平强;高丽丽;;基于FRS—SVM采煤机液压系统故障诊断的研究[J];煤矿机械;2010年02期 |
4 |
袁英;陈立潮;张英俊;赵治军;;基于模糊决策树的采煤机故障诊断研究[J];微计算机信息;2009年34期 |
5 |
田盛丰,黄厚宽;基于支持向量机的数据库学习算法[J];计算机研究与发展;2000年01期 |
6 |
张铃;支持向量机理论与基于规划的神经网络学习算法[J];计算机学报;2001年02期 |
7 |
阎辉,张学工,李衍达;支持向量机与最小二乘法的关系研究[J];清华大学学报(自然科学版);2001年09期 |
8 |
朱国强,刘士荣,俞金寿;支持向量机及其在函数逼近中的应用[J];华东理工大学学报;2002年05期 |
9 |
侯风雷,王炳锡;基于支持向量机的说话人辨认研究[J];通信学报;2002年06期 |
10 |
马永军,方凯,刘暾东,方廷健;基于支持向量机和方差的管道内表面粗糙度等级识别[J];信息与控制;2002年05期 |
11 |
吴飞,庄越挺,潘云鹤;基于增量学习支持向量机的音频例子识别与检索[J];计算机研究与发展;2003年07期 |
12 |
孙延风,梁艳春;支持向量机的数据依赖型核函数改进算法[J];吉林大学学报(理学版);2003年03期 |
13 |
朱永生,张优云;支持向量机分类器中几个问题的研究[J];计算机工程与应用;2003年13期 |
14 |
朱家元,吴伟,张恒喜,董彦非;一种新型的多元分类支持向量机[J];计算机工程;2003年17期 |
15 |
饶鲜,董春曦,杨绍全;应用支持向量机实现计算机入侵检测[J];西安电子科技大学学报;2003年03期 |
16 |
周志明,陈敏;支持向量机的人脸识别方法[J];咸宁学院学报;2003年03期 |
17 |
赵洪波;赵丽红;;支持向量机学习算法—序列最小优化(SMO)[J];绍兴文理学院学报(自然科学版);2003年04期 |
18 |
吴成东,杜崇峰,杨丽英;基于误差修正码的支持向量机大类别分类方法[J];沈阳建筑工程学院学报(自然科学版);2004年01期 |
19 |
张健,李艳,朱学峰,黄道平,史步海;基于支持向量机的蒸煮过程卡伯值软测量[J];计算机测量与控制;2004年02期 |
20 |
张辉,张浩,陆剑峰;SVM在数据挖掘中的应用[J];计算机工程;2004年06期 |
|