收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

特征选择算法及其在基于内容图像检索中的应用研究

李云  
【摘要】:随着计算机应用范围和领域的日益扩大,特别是Internet 的飞速发展,在各种应用系统和Internet 上积累了大量、甚至海量数据,产生了“数据爆炸、知识贫乏”的现象;数据挖掘是解决这种问题的最为有效的手段,但是要有效地利用数据挖掘,对数据进行预处理是必不可少的,而特征选择是数据预处理中一种重要而且经常采用的方法。此外,在机器学习和模式识别中,特征选择也是一个必要的步骤。 特征选择的研究开始于上个世纪的六十年代,已经有几十年的历史,取得了许多成果,但随着新的应用领域和新对象不断涌现,使得特征选择还有许多问题亟待解决。本论文对此作了详细介绍,并对目前特征选择的研究热点和问题进行了深入的研究,取得了一定的成果。 作者把特征选择的研究分为三个阶段,首先介绍了常规的特征选择算法模型,并分别从研究人员和用户角度,对特征选择算法进行分类,这将大大方便用户选择合适的特征选择算法,有助于特征选择算法的应用,也为特征选择算法的进一步研究打下坚实的基础。 其次,提出或者介绍了一些具体的特征选择算法,也是当前的一些研究重点和热点,包括在模糊特征空间进行特征选择的算法、监督的高维特征选择算法、非监督的高维特征选择算法和小样本训练的特征选择算法。其中,对于模糊特征空间的特征选择,主要是利用扩张矩阵作为搜索策略,类间的模糊相似性作为评价准则,理论和实验都表明该算法具有较好的性能和低的时间开销。该算法属于一种专业算法,充分考虑特征的模糊性,可以应用到模糊分类器的设计中。而在监督的高维特征选择中,由于现实的高维数据集中往往存在大量的冗余特征和不相关特征,因此作者提出了一种基于特征关联性的分层过滤器方法,有效地消除冗余特征和不相关特征,实验表明该算法能有效地降低特征维数。同时将该方法与部分基于关联性的方法进行了比较分析,并全面系统地回顾了所有基于特征关联性的高维特征选择算法以及关联性的定义和计算公式,大大有助于以后的研究。在非监督特征选择的研究中,作者提出一种新的基于特征排序和分层的过滤器算法,排序规则采用的是指数熵,而评价准则采用了模糊特征评价指标,该算法克服了其它一些非监督特征选择算法的缺点,可以同时剔除冗余特征和不相关特征,能有效处理高维数据和噪声数据,且计算的开销较小。前面提出的三种算法都是建立在训练样本较充分的基础之上,但当可获取的训练样本相对于特征维数偏少时,如何有效地进行特征选择?作者详细介绍了一类基于支持向量机的特征选择


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 袁红春;黎莹;熊范纶;;一种新的面向渔情预测的智能数据处理模型研究[J];计算机应用研究;2009年12期
2 朱艳辉;阳爱民;杨伟丰;;基于模糊集和支持向量机的文本流派分类方法[J];计算机工程与应用;2008年11期
3 刘洪刚;徐克宝;赵平强;高丽丽;;基于FRS—SVM采煤机液压系统故障诊断的研究[J];煤矿机械;2010年02期
4 袁英;陈立潮;张英俊;赵治军;;基于模糊决策树的采煤机故障诊断研究[J];微计算机信息;2009年34期
5 田盛丰,黄厚宽;基于支持向量机的数据库学习算法[J];计算机研究与发展;2000年01期
6 张铃;支持向量机理论与基于规划的神经网络学习算法[J];计算机学报;2001年02期
7 阎辉,张学工,李衍达;支持向量机与最小二乘法的关系研究[J];清华大学学报(自然科学版);2001年09期
8 朱国强,刘士荣,俞金寿;支持向量机及其在函数逼近中的应用[J];华东理工大学学报;2002年05期
9 侯风雷,王炳锡;基于支持向量机的说话人辨认研究[J];通信学报;2002年06期
10 马永军,方凯,刘暾东,方廷健;基于支持向量机和方差的管道内表面粗糙度等级识别[J];信息与控制;2002年05期
11 吴飞,庄越挺,潘云鹤;基于增量学习支持向量机的音频例子识别与检索[J];计算机研究与发展;2003年07期
12 孙延风,梁艳春;支持向量机的数据依赖型核函数改进算法[J];吉林大学学报(理学版);2003年03期
13 朱永生,张优云;支持向量机分类器中几个问题的研究[J];计算机工程与应用;2003年13期
14 朱家元,吴伟,张恒喜,董彦非;一种新型的多元分类支持向量机[J];计算机工程;2003年17期
15 饶鲜,董春曦,杨绍全;应用支持向量机实现计算机入侵检测[J];西安电子科技大学学报;2003年03期
16 周志明,陈敏;支持向量机的人脸识别方法[J];咸宁学院学报;2003年03期
17 赵洪波;赵丽红;;支持向量机学习算法—序列最小优化(SMO)[J];绍兴文理学院学报(自然科学版);2003年04期
18 吴成东,杜崇峰,杨丽英;基于误差修正码的支持向量机大类别分类方法[J];沈阳建筑工程学院学报(自然科学版);2004年01期
19 张健,李艳,朱学峰,黄道平,史步海;基于支持向量机的蒸煮过程卡伯值软测量[J];计算机测量与控制;2004年02期
20 张辉,张浩,陆剑峰;SVM在数据挖掘中的应用[J];计算机工程;2004年06期
中国重要会议论文全文数据库 前10条
1 刘碧森;钟守铭;陈华富;;基于支持向量机与粗糙集理论的信息处理[A];第二届全国信息获取与处理学术会议论文集[C];2004年
2 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
3 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
4 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
6 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
7 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
8 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
9 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
10 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 李云;特征选择算法及其在基于内容图像检索中的应用研究[D];重庆大学;2005年
2 任艳;基于公理模糊集与支持向量机的知识发现方法与应用研究[D];大连理工大学;2011年
3 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
4 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
5 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
6 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
7 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
8 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
9 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
10 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
中国硕士学位论文全文数据库 前10条
1 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
2 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
3 童振;基于支持向量机的电解液成分预测[D];东北大学;2008年
4 聂小芳;模糊粗糙集与支持向量机在煤与瓦斯突出预测中的应用研究[D];辽宁工程技术大学;2009年
5 鄢常亮;基于支持向量机的高炉向凉向热炉况预测研究[D];内蒙古科技大学;2010年
6 韩叙东;基于支持向量机的水电故障分类器的设计与实现[D];东北大学;2008年
7 冯杰;慢时变对象的支持向量机建模与在线校正方法研究[D];东北大学;2009年
8 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
9 王奇安;基于广泛内核的CVM算法研究及参数C的选择[D];南京航空航天大学;2009年
10 张永新;基于支持向量机和遗传算法相结合的模拟电路故障诊断方法研究[D];东北大学;2009年
中国重要报纸全文数据库 前10条
1 中国水利水电科学研究院水资源研究所所长、中国工程院院士 王浩;一部有创新性的力著[N];科技日报;2006年
2 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
3 李水根;计算机详解配伍与药效关系[N];健康报;2005年
4 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
5 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
6 ;模糊计算不“含糊”[N];计算机世界;2003年
7 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
8 ;选择合适的数据挖掘算法[N];计算机世界;2007年
9 周颖;王米渠与中医心理学[N];中国中医药报;2006年
10 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978