收藏本站
收藏 | 论文排版

多模态数据特征提取的粒计算方法研究与应用

温柳英  
【摘要】:随着传感器网络与物联网的发展,油田等领域的数据以前所未有的速度被大量产生。如何对这些数据进行预处理,以便于存储、挖掘和利用,是大数据领域的核心问题之一。对于结构化数据而言,特征选择和提取是数据降维的两项重要技术,其中后者更具有挑战性。离散化是数值型数据的经典特征提取方法,多年来一直有新算法被提出,以获得更好的处理速度和效果。属性值划分则是符号型数据的特征提取方法,但未获得足够关注,导致成果较少。粒计算是计算智能领域中的一种普适性方法论,是复杂问题求解的有效工具。在数据预处理时,粒计算从不同角度、不同层次建立粒结构,并选择合适的粒度,获得更利于问题求解的数据表示。粒计算的一些具体理论如粗糙集、模糊集、商空间、三支决策、概念格等,均在特征选择方面取得长足进步,并广泛用于石油、金融、医疗等领域。相比而言,特征提取的工作还比较少。本文针对多模态数据,提出基于粒计算的特征提取一般框架与具体方法,以获得存储空间要求更少、更能提高分类器质量的数据。利用油田真实数据集,以及UCI公共数据集,与其他流行的方法进行对比,验证其先进性。具体贡献如下:(1)设计了适用于特征提取的粒计算框架。该框架包括两个阶段,在粒度构建阶段,从单个特征层面建立粒结构。在粒度选择阶段,通过属性内与属性间的粒度选择,获得最终的特征提取方案。(2)针对数值型数据,提出了一种基于信息熵的双阶段离散化算法。在局部离散化阶段,以最小化条件信息熵为标准,进行单个特征的粒度构建和选择。在全局离散化阶段,利用上一阶段获得的粒度结构来构造扩展决策表,在不损失信息的前提下,选择最粗的粒度。与经典和流行的离散化算法对比,结果显示,该算法具有非常好的泛化能力、较好的分类精度和合理的处理速度。该方法可有效地平衡离散化算法在效率与效果之间的矛盾。(3)针对符号型数据,提出了属性值划分的一种双阶段粒计算方法。在单个属性粒度构建阶段,逐步合并属性值所对应的结点,以自底向上的方式构建一棵二叉树。结点合并时,以最小化信息损失为优化目标,以便属性值重要的分裂尽可能靠近根结点。在全局粒度选择阶段,以信息增益最大化为依据,用自顶向下的方式逐步地分裂树节点,最终获得最佳的属性值划分方案。该方法有效地解决因先验知识稀少带来的诸多问题,实现了属性值粒度结构的自动构建和选择。与最新的属性值分组算法对比,结果表明,该算法可以选择较少的属性值,同时能够保持或者改善分类器的性能。(4)针对混合数据,提出了特征提取的一种融合算法。首先使用局部离散化方法,对每个数值型数据进行初步的离散化,将其转为符号型数据。然后使用属性值划分方法,获得最终的属性提取方案。该方法综合考虑了不同模态特征之间的相关性,用一种全局的角度来进行特征的提取。实验结果表明,该融合算法可以有效地对混合数据进行归一化处理,在保证信息损失最小化的前提下,可以获得更为精简的数据表示。(5)针对符号型数据粒度构建,提出了一种树平衡方法,以进一步改善粒结构的质量。在对单个特征进行粒度的构建时,该算法会为每一次的合并操作计算出候选节点的边界,进而保证合并的两个节点处于同一或者相邻的粒度级别。通过引入该方法,最终构建的所有粒度结构都是一颗平衡的二叉树。由于平衡二叉树具有良好的树结构,因此该算法的引入可减少粒度选择阶段中节点分裂的次数,最终达到降低特征提取算法复杂度的目的。论文的研究工作扩展了粒计算的应用范畴。提出了多模态数据环境下基于粒计算的特征提取方法以达到降低数据存储空间、保持或改善分类能力的目的,对大数据领域中数据预处理的研究具有一定的理论和实际意义。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王萍,王汉芝,岳斌,林孔元,刘还珠;一种大规模样本数据的特征提取方法[J];天津轻工业学院学报;2003年04期
2 方莹;;多角度的特征提取方法[J];郑州轻工业学院学报(自然科学版);2010年03期
3 周生祥,冯培恩,潘双夏;材焊接结构加工特征提取方法[J];浙江大学学报(自然科学版);1997年04期
4 王云鹏;刁智华;宋寅卯;王欢;;棉花叶部害螨病斑形态特征提取[J];郑州轻工业学院学报(自然科学版);2013年04期
5 徐瑞芬;;基于冗余提升形态小波的非对称表面特征提取研究[J];机电工程;2012年08期
6 吴响;钱建生;王海燕;秦海初;;微震信号多尺度非线性特征提取与辨识研究[J];仪器仪表学报;2014年05期
7 吴雅娟;徐亚军;赵鹏;;分级特征提取在中子寿命深度校正中的应用[J];计算机系统应用;2014年03期
8 赵剑;许金涛;顾凌榕;;蛋白质序列在频率域上的一种特征提取方法[J];南京工业大学学报(自然科学版);2013年06期
9 陶晨;印梅芬;王栋;;面料摩擦声音特征提取[J];丝绸;2014年03期
10 李鹏;刘民;吴澄;;一种基于特征提取方法的智能预测算法[J];控制与决策;2007年12期
11 郭振铎;刘洲峰;徐庆伟;朱永胜;;玻璃缺陷特征提取[J];中原工学院学报;2010年02期
12 刘炜;刘宏昭;;三种泵功图特征提取方法及比较[J];煤炭技术;2010年09期
13 赵敏;吴文福;张亚秋;;玉米籽粒特征提取及主成分分析[J];农业机械;2011年20期
14 任会峰;阳春华;周璇;桂卫华;鄢锋;;基于自适应谷底检测的浮选泡沫形态特征提取[J];化工自动化及仪表;2011年07期
15 郭晨;胡晓彤;;基于计算机图像处理的书法笔画特征提取[J];天津科技大学学报;2010年05期
16 陈桥;王继坤;刘玲玲;李光;;用红外光谱特征基提取方法确定茶叶的发酵度[J];科协论坛(下半月);2013年03期
17 陈军,尤政,周兆英,刘兴占;特征提取在硅内部微/纳米级体缺陷检测中的应用[J];激光技术;1998年05期
18 张绍武;潘泉;程咏梅;施建宇;;基于一种新的特征提取法和支持向量机的膜蛋白分类研究[J];计算机与应用化学;2006年04期
19 刘俊中;刘媛媛;金鹏;张瑢;滕东兴;;基于特征提取的服装外形设计草图推荐技术[J];计算机系统应用;2008年12期
20 汪金花,张永彬,孔改红;谱间关系法在水体特征提取中的应用[J];矿山测量;2004年04期
中国重要会议论文全文数据库 前10条
1 尚修刚;蒋慰孙;;模糊特征提取新算法[A];1997中国控制与决策学术年会论文集[C];1997年
2 潘荣江;孟祥旭;杨承磊;王锐;;旋转体的几何特征提取方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 薛燕;李建良;朱学芳;;人脸识别中特征提取的一种改进方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
4 杜栓平;曹正良;;时间—频率域特征提取及其应用[A];2005年全国水声学学术会议论文集[C];2005年
5 黄先锋;韩传久;陈旭;周剑军;;运动目标的分割与特征提取[A];全国第二届信号处理与应用学术会议专刊[C];2008年
6 魏明果;;方言比较的特征提取与矩阵分析[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
7 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 秦建玲;李军;;基于核的主成分分析的特征提取方法与样本筛选[A];2005年中国机械工程学会年会论文集[C];2005年
9 刘红;陈光;宋国明;姜书艳;;模拟电路故障诊断中的特征提取方法[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年
10 杜栓平;丁烽;杨华;;基于小波系数聚类的特征提取器[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 易军;人脸识别中的特征提取与度量学习算法研究[D];北京邮电大学;2015年
2 段佳;SAR/ISAR目标电磁特征提取及应用研究[D];西安电子科技大学;2015年
3 冯博;雷达高分辨距离像特征提取与识别方法研究[D];西安电子科技大学;2015年
4 陈斌;连续语音识别特征提取与声学模型训练区分性技术研究[D];解放军信息工程大学;2015年
5 熊庆;列车滚动轴承振动信号的特征提取及诊断方法研究[D];西南交通大学;2015年
6 陈超;复杂光照条件下的人脸识别方法研究[D];浙江大学;2016年
7 魏峰;高光谱遥感数据特征提取与特征选择方法研究[D];西北工业大学;2015年
8 王玉静;滚动轴承振动信号特征提取与状态评估方法研究[D];哈尔滨工业大学;2015年
9 苗捷;时空特征提取方法研究[D];华南理工大学;2016年
10 谭文学;基于机器学习的作物病害图像处理及病变识别方法研究[D];北京工业大学;2016年
中国硕士学位论文全文数据库 前10条
1 韩晓爽;基于激光诱导荧光光谱的油种识别方法研究[D];内蒙古大学;2015年
2 袁芳兵;基于SVM的GSM系统上行干扰判定研究[D];华南理工大学;2015年
3 汤鹏;基于LDA的特征提取及其在人脸识别中的应用[D];河北大学;2015年
4 安磊磊;基于改进PCA和LDA的特征提取方法[D];河北大学;2015年
5 代士超;滚动轴承外圈故障机理建模及双冲击特征提取方法的研究[D];昆明理工大学;2015年
6 王瑞琦;太赫兹光谱降维特征提取及分类方法研究[D];昆明理工大学;2015年
7 江海;心音信号特征提取及分类研究[D];昆明理工大学;2015年
8 董秀青;面向协同过滤的推荐攻击特征提取及检测方法[D];燕山大学;2015年
9 井波;基于EEMD的高速列车安全性态数据的特征研究[D];西南交通大学;2015年
10 梁致汉;基于EEG的脑机接口技术研究与实现[D];天津理工大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978