收藏本站
《广西师范大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

超图低秩属性选择算法及应用

方月  
【摘要】:在这个数据日益增长的时代,各类电子设备在每时每刻都会产生或多或少的数据,有时产生的数据往往维度非常高,即称为高维大数据,然而数据挖掘中需要处理的高维数据通常包含冗余属性而难以直接被应用。属性选择在机器学习领域扮演着不可或缺的角色,工程和学术研究中经常会使用到属性选择方法,它可以消除高维大数据中无关紧要的属性。利用属性约简可以缩小高维数据的维度,筛选出最有意义的属性,从而降低高维数据的维度,以此来提高数据挖掘算法的效率,而又不改变其学习效果。属性选择一般在搜索策略和评价标准上进行讨论研究,不同的策略设计的算法一般有三类,即过滤器、包装器、嵌入模型,在评价标准上一般分为属性加权排序算法和子集选择算法。利用属性约简可以缩小高维数据的维度,筛选出最有意义的属性,从而降低高维数据的维度,以此来提高分类和回归效果。已有的属性约简方法可以分为子空间学习和属性选择两类。子空间学习是将高维数据投影到低维空间,从而保持了数据间的相关结构。属性选择方法可以通过某种积分排名标准对属性进行排序,筛选出最有意义的属性,是一种提高算法性能的手段,因此它能够在模式识别和机器学习等领域得到广泛应用。本文在模型中同时运用属性选择和子空间学习,并利用超图正则化项保持数据间的局部结构,用低秩约束来保持不同数据的全局结构,并应用在分类和回归数据集上。本论文的核心内容和创新点如下:(1)提出了一种基于局部结构学习的无监督谱属性选择算法(Unsupervised Spectral Feature Selection with local structure learning,缩写为LSL_FS)。该方法结合属性选择和局部结构学习它能够自适应地学习高维数据的局部流形结构,并且能够学习到更多有价值的属性。此方法引入了一个合理的约束条件,在尽可能少的噪声和冗余的低维空间中获得局部和全局结构关联性,从而动态地构造图矩阵,这样的图矩阵就更为可靠了。在此算法的框架中,将?_(2,1)-范数正则化项整合到最小二乘损失函数中来寻找样本之间的相关性,能有效地剔除离群点的干扰,选择更多有用的样本,提高属性选择模型的性能。(2)提出一种基于超图表示的低秩属性选择算法用于回归分析(Based on hypergraph expressing low-rank feature selection algorithm for regression analysis,简称为LHSL_FS)。LHSL_FS算法在属性选择时考虑了类标签之间的关系,并且运用了双重稀疏模式,即对损失项用?_(2,1)-范数进行样本选择,对回归系数矩阵AB用?_(2,p)-范数进行惩罚,通过调节p(0p2)使得系数矩阵更稀疏,从而使模型能准确地筛选重要的属性,因此该算法具有较好的鲁棒性和泛化性。为了合理考虑各类数据间的关联结构,用超图代替普通图,避免了因使用普通图而导致不能发现数据间的复杂关系这一问题,并用超图正则化项保持数据间的局部结构,这样使得通过空间投影变换后的样本数据的近邻关系结构不变;用低秩约束来保持不同数据的全局结构,使用低秩限制实际上就是使用LDA进行子空间学习,而子空间学习尽量保证不丢失信息并且能降低数据的维度,通过稀疏表示,使得系数矩阵中大部分行元素变为0,系数矩阵中非零元素位置对应的属性得到保留,从而达到属性选择的目的。为了使得算法挑选的属性具有鲁棒性,本文在学习得到的模型中有效地结合LDA子空间学习算法,对低秩模型算出的结果进行适当的调整。因此,该算法可以更好地处理高维数据的多输出回归分析问题。对LHSL_FS算法的目标函数运用与交替方向乘子法稍微不同的方法进行求解,即先固定低秩属性选择的结果,以此增强子空间学习的能力。然后,固定子空间学习的结果,确保低秩属性选择能输出更具判别力的属性集。该优化算法使目标值在每次迭代过程中逐步趋近于全局最优解,最终取得全局最优解。本文针对高维数据中的分类和回归两大类数据集进行实验分析,充分验证了本文提出的属性选择算法的性能。具体来说,本文运用超图、低秩以及稀疏等技术,将属性选择算法用于分类和回归,本文将提出的属性选择算法和其他属性算法进行比较,在各类评价指标上,本文设计的算法在公开的大部分数据集上表现的性能比其他算法更优秀。在今后的工作中,将考虑在深度学习框架中进行运用,属性选择算法作为深度学习数据的预处理阶段,然后再运用到各类实际应用中。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP301.6;TP311.13

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 于德玉;吉日木图;;关于信息超图一些基本概念的注记[J];内蒙古民族大学学报(自然科学版);2017年02期
2 吴崝;;解析超图软件“三创”[J];软件和集成电路;2016年Z1期
3 冷明;孙凌宇;朱平;李金忠;;赋权超图划分问题的多水平迁移优化算法研究[J];小型微型计算机系统;2016年06期
4 鄢仁政;李薇;;一致超图谱半径界的改进结果[J];纯粹数学与应用数学;2014年06期
5 王雅;;r一致B-混合超图可着色的最大边数[J];考试周刊;2015年85期
6 段潇潇;朱潇;刁科凤;;给定色可行集的极大混合超图[J];曲阜师范大学学报(自然科学版);2014年02期
7 唐正华;闫清东;冷韶华;刘毅;;超图建模法及其在车辆传动系统中的应用[J];汽车工程;2013年04期
8 董晓光;李国全;;具有固定匹配数的极值k-部k-一致超图的结构[J];天津师范大学学报(自然科学版);2013年03期
9 赵二岭;;四元超图的模型及其性质[J];江汉大学学报(自然科学版);2012年02期
10 ;超图两款产品在软件测评中再获表彰[J];数字通信世界;2011年02期
中国重要会议论文全文数据库 前7条
1 刘强;方锦清;李永;;4种类型超网络模型构建方法[A];中国原子能科学研究院年报 2013[C];2014年
2 黄骞;;时空大数据与安全生产应急应用展望[A];中国安全生产协会信息化工作委员会2016年委员会议、中国煤炭学会计算机通讯专业委员会2016年委员会议暨“互联网+安全生产”专题技术交流会会议交流资料[C];2016年
3 郝忠孝;刘永山;刘国华;;对应于关系模式的微超图及某些性质[A];第十届全国数据库学术会议论文集[C];1992年
4 张港;邱惠昌;孟繁辉;郝彬;;超图组件式地理信息系统平台在全天候实时监控系统中的应用[A];第二十七届中国(天津)2013IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2013年
5 江涛;钱旭;;基于有向超图的最优学习空间[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
6 崔伟宏;史文中;李小娟;;基于特征的时空数据模型研究及在土地利用变化动态监测中的应用[A];全国地图学与GIS学术会议论文集[C];2004年
7 卢秉武;;基于图文一体化的海事综合管理信息系统研究[A];中国航海学会航标专业委员会测绘学组学术研讨会学术交流论文集[C];2006年
中国重要报纸全文数据库 前10条
1 记者 祁豆豆;刚挂新三板即被围猎 国图信息4.68亿“卖身”超图软件[N];上海证券报;2016年
2 记者 赵一蕙;超图软件业绩快报“失准”逾20%[N];上海证券报;2013年
3 栾玲 赵培;超图软件:中国“智”造的跨国软件企业[N];中国高新技术产业导报;2010年
4 本报记者 解佳涛 戈清平;超图软件:做“中国智造”的跨国软件企业[N];中国高新技术产业导报;2010年
5 本报驻东京记者 吴仲国;中国软件在日本叫响知名品牌成市场宠儿[N];科技日报;2002年
6 证券时报记者 吴中珞;超图软件信披创新 微博释疑股吧发帖详解年报延期[N];证券时报;2011年
7 栾玲 赵培;超图软件:做GIS领军人[N];中国高新技术产业导报;2011年
8 本报记者 郑燃;超图软件:让应急事件避免盲人摸象[N];政府采购信息报;2011年
9 记者 魏梦杰 见习记者 赵晓琳 编辑 邱江;超图软件上半年主营净利不足百万[N];上海证券报;2010年
10 江雪;钟耳顺钟情GIS[N];中国企业报;2007年
中国博士学位论文全文数据库 前10条
1 陈平鸽;超图的拉格朗日与Turán数[D];湖南大学;2018年
2 王兵;边染色超图的划分和覆盖问题研究[D];华东师范大学;2018年
3 吉日木图;图的标号及超图分解问题研究[D];大连理工大学;2006年
4 王琦;网络中的超图嵌入问题[D];山东大学;2007年
5 冯弢;3-设计及若干应用[D];北京交通大学;2008年
6 古万荣;基于超图模型的新闻推荐研究[D];华南理工大学;2015年
7 吴艳;3-一致超图分解及相关问题[D];北京交通大学;2010年
8 黄晟;图像特征提取与分类超图的学习算法研究[D];重庆大学;2015年
9 吴颖敏;市场机遇发现的超图支持方法研究[D];华中科技大学;2009年
10 孙艳萍;3一致超图的拉格朗日和最大团之间的关系的研究[D];湖南大学;2016年
中国硕士学位论文全文数据库 前10条
1 蒋罗娜;关于超图谱半径和特征向量的研究[D];哈尔滨工程大学;2018年
2 杜年伟;关于超图谱半径的一些研究[D];哈尔滨工程大学;2018年
3 汪昱璠;关于超图特征向量及Z特征值的一些研究[D];哈尔滨工程大学;2018年
4 方月;超图低秩属性选择算法及应用[D];广西师范大学;2018年
5 梁金花;3一致超图的拉格朗日密度及其扩张的Turán数[D];湖南大学;2018年
6 赵静慧;超图上的混合覆盖阵列的构造[D];河北师范大学;2018年
7 张雪莲;Lovász局部引理在组合数学中的应用[D];北京工业大学;2017年
8 颛孙晨露;关于一致超图的谱对称性[D];安徽大学;2018年
9 李亚萍;稳定指数为1的极小3-一致超图[D];安徽大学;2018年
10 黄月盈;基于超图划分的华为社区界面标签设计[D];暨南大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026