收藏本站
《华中师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

一种数据挖掘中的特征子集选取模型研究和应用

张箫  
【摘要】:特征提取是模式识别中的一个重要过程,如今,也在数据挖掘领域也有着广泛的应用。对于高维数据的数据挖掘,特征提取可以有效地对数据进行降维处理,从而降低算法的运算规模。相对于主成分分析,粗糙集等数据降维方法,特征提取更加系统化,也更加依赖与问题的具体应用领域,提出针对性的特征提取模型,得到的结果也更加具有参考价值。将支持向量机应用于特征提取中,可以结合两者的长处,优化特征提取的过程,是对特征提取方法的一种探索。 本文针对最优特征子集选取的问题,进行了相关的探索研究。借鉴经典统计理论中的分位数的概念,将其引入特征选取模型,建立了分位数特征选取模型。另外,参考信息学中关于信息相对熵的概念和定义,建立了相对熵特征选取模型。在对特征候选集进行最优特征子集选取的过程中,本文依照分位数特征选取模型和相对熵特征选取模型分别建立了样本属性的可分性判别函数,并运用浮动序列前进算法找出不同属性个数下的最佳特征候选子集。最后,本文又借助于支持向量机的方法,将包含不同属性个数的特征候选子集对应的数据放入支持向量机,学习后进行判断,根据最后识别的错误率来判断该特征候选子集的优劣程度,从而得到最优特征子集。另外,通过在结肠癌患病和正常样本基因表达水平数据集上进行实验,来对上述特征提取模型进行了验证。 本文将特征提取应用于数据挖掘领域中,所建立的特征提取模型依据样本的统计学特性以及信息学特性,这些模型的建立脱离了系统的具体应用领域,使其更具有普遍意义。
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13;TP391.4

【相似文献】
中国期刊全文数据库 前10条
1 武志峰;陈冬霞;;基于遗传算法的特征子集选择方法[J];河北省科学院学报;2006年03期
2 贺兴时;于洁琼;李丽丽;;基于互信息的特征子集选择[J];西安工程大学学报;2008年03期
3 乔立岩;彭喜元;彭宇;;基于微粒群算法和支持向量机的特征子集选择方法[J];电子学报;2006年03期
4 刘勇国,李学明,张伟,彭军,廖晓峰,吴中福;基于遗传算法的特征子集选择[J];计算机工程;2003年06期
5 武志峰;;一种基于差异演化的特征子集选择算法[J];信息技术;2007年04期
6 郭文忠;陈国龙;陈庆良;余轮;;基于粒子群优化算法和相关性分析的特征子集选择[J];计算机科学;2008年02期
7 乔立岩;彭喜元;马云彤;;基于遗传算法和支持向量机的特征子集选择方法[J];电子测量与仪器学报;2006年01期
8 程凤伟;任晶晶;;特征子集区分度与支持向量机的特征选择算法分析[J];信息系统工程;2018年11期
9 王兴起,孔繁胜;容忍噪音的特征子集选择算法研究[J];计算机研究与发展;2002年12期
10 杨萍;夏平;张彬;;缺陷超声回波信号特征提取与最佳特征子集的选择研究[J];机械制造;2013年06期
中国重要会议论文全文数据库 前10条
1 易超群;李建平;朱成文;;一种改进的浮动搜索特征子集算法[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
2 李长升;卢汉清;;排序学习模型中的特征选择[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
3 张隆;余建桥;;基于最小特征子集的数据分类算法[A];’2004计算机应用技术交流会议论文集[C];2004年
4 袁帅;杨宏晖;申昇;;基于云模型的特征评价准则[A];第三届上海——西安声学学会学术会议论文集[C];2013年
5 徐继伟;李建中;柳勃;杨昆;;使用支持向量机和改进特征提取方法的蛋白质分类[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
6 汪荣贵;孙见青;胡琼;李守毅;;一种新的支持向量机决策树及其应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
7 王晓红;;一种改进多类支持向量机加权后验概率重构策略[A];2009中国控制与决策会议论文集(3)[C];2009年
8 余乐安;姚潇;;基于中心化支持向量机的信用风险评估模型[A];第六届(2011)中国管理学年会——商务智能分会场论文集[C];2011年
9 何琴淑;刘信恩;肖世富;;基于支持向量机的系统辨识方法研究及应用[A];中国力学大会——2013论文摘要集[C];2013年
10 郭一楠;程健;肖大伟;杨梅;;分布式多分类支持向量机[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
中国重要报纸全文数据库 前10条
1 记者 张馨;“仓位模型”显量化优势 中欧数据挖掘基金发行[N];上海证券报;2015年
2 陆天歌 王兆亮;数据挖掘:帮你读懂未来战争[N];解放军报;2018年
3 本报记者 戴丽昕;在人才工作中展现数据挖掘力量[N];上海科技报;2019年
4 本报记者 林丽鹂;用大数据挖掘市场“金矿”[N];人民日报;2019年
5 本报记者 张佳星;把扎克伯格拉下水,大数据挖掘犯错了吗[N];科技日报;2018年
6 本报记者 张佳星;数据挖掘大战 机器怎么做到“见信如面”[N];科技日报;2018年
7 记者 张潇;打造数据挖掘领域的“响尾蛇模式”[N];西安日报;2018年
8 上海市浦东卫生发展研究院 孙雪松 王晓丽;数据挖掘在医学大数据研究中的应用[N];中国信息化周报;2018年
9 本报记者 叶曜坤;全国人大代表邓晓辉:推翻阻碍数据挖掘的“三座大山”[N];人民邮电;2017年
10 本报记者 牛福莲;贵州争夺“大数据挖掘”制高点[N];中国经济时报;2017年
中国博士学位论文全文数据库 前10条
1 刘哲夫;新型特征选择与机器学习结合方法在化工数据中的应用[D];中国石油大学(北京);2016年
2 舒文豪;面向动态不完备数据的特征选择模型与算法研究[D];北京交通大学;2015年
3 王玲;基于图像特征选择的田间籽棉成熟度与品级判别技术研究[D];南京农业大学;2009年
4 陈素根;非平行平面支持向量机及特征提取中若干问题研究[D];江南大学;2016年
5 刘义海;基于信息融合的水中目标属性识别关键技术研究[D];西北工业大学;2015年
6 王快妮;支持向量机鲁棒性模型与算法研究[D];中国农业大学;2015年
7 胡庆辉;非稀疏多核支持向量机学习方法研究[D];武汉大学;2015年
8 孙宗海;支持向量机及其在控制中的应用研究[D];浙江大学;2003年
9 徐芳;航空影像分割的支持向量机方法[D];武汉大学;2004年
10 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
中国硕士学位论文全文数据库 前10条
1 张箫;一种数据挖掘中的特征子集选取模型研究和应用[D];华中师范大学;2011年
2 夏文春;基于MapReduce的全基因组关联分析技术研究与实现[D];东北大学;2015年
3 吴冠朋;基于智能计算的HBV病毒再激活分类预测模型研究[D];齐鲁工业大学;2017年
4 路小英;基于模糊扩张矩阵多类问题的最优特征子集抽取[D];河北大学;2005年
5 吴培;面向行人检测的代表性特征子集获取方法研究[D];中国科学技术大学;2009年
6 汪保男;相关分析在异常检测中的应用研究[D];西安科技大学;2010年
7 张夏丽;基于数据挖掘的网络安全审计技术研究[D];解放军信息工程大学;2007年
8 张方方;基于特征选择的多侧面覆盖算法[D];安徽大学;2011年
9 易超群;基于特征分析的支持向量分类机[D];国防科学技术大学;2010年
10 蒋琳;基于支持向量机的特征提取方法研究与应用[D];湖南大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026