收藏本站
《山西大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

复杂数据的粒化机理与数据建模

钱宇华  
【摘要】:迅猛发展的计算机技术、网络技术和传感器技术使得诸如天文、军事、生物、医疗、管理等学科的数据采集和数据传输更为便利和快捷,从而使得数据日趋复杂,规模不断增长,形成了大量类型复杂、形式异构的高维海量信息。从数据的描述看,数值型、名义型、区间型、缺省型、集值型等多种类型数据并存构成了复杂数据的主要特征。对复杂数据的建模、分析与利用已成为当今诸多应用领域知识发现面临的主要任务,而数据的复杂性是知识发现面临的主要困难之一。复杂数据已成为现代社会中数据资源和知识发现的主体。 复杂数据的数据建模是其分析与利用的基础。近年来,借鉴认知科学的研究成果来创新数据建模理论与方法越来越受到人们的重视。基于认知科学的数据建模主要从两个方面进行研究,一类着重于感知机理的理解与模拟,另一类着重于认知机理的理解与模拟。作为人类认知的重要特征之一,粒化认知对复杂数据建模具有重要的借鉴作用。借鉴人类的粒化认知机理,有望诞生新的数据建模理论与方法。开展基于粒化机理的复杂数据建模研究,关键是要解决如下三个核心科学问题: ·如何有效地进行复杂数据信息粒化? ·如何分析粒化的不确定性? ·如何借鉴粒化机理进行数据建模? 有鉴于此,本文面向包含数值型、名义型、区间型、缺省型、集值型在内的复杂数据,借鉴人类的粒化认知机理,紧紧围绕三个核心科学问题,从信息粒化、粒化不确定性、建模策略与模型选择四个层次展开系统研究,获得的主要研究成果和创新概括如下: 一、完善了复杂数据的信息粒化方法与算法体系,深刻揭示了复杂数据的粒化机理,为基于粒化机理的复杂数据建模提供了基础。 提出了如何有效地进行带测量误差的数据聚类问题,给出了一种适合于带测量误差数据的聚类算法。实验分析表明:考虑测量误差的聚类算法可能比仅考虑测量值的聚类算法所获得的聚类结果更加贴近于数据的真实分类;误差数距离提供了度量带测量误差对象的差异性的有效方法。 发展了一类基于选举类别代表策略的κ-representatives算法,在半监督环境下该算法在名义型、集值型以及缺省型数据的聚类分析中,其聚类精度、纯度、召回率与迭代次数四个聚类性能评价指标都显示了明显的优势。特别地,由于这个聚类策略回避了数据的空间结构分析,该算法不仅可用于单一数据类型的聚类分析,而且也可用于包含数值型、区间型、名义型、集值型和缺省型等多种类型并存的复杂数据的聚类分析。 二、建立了粒空间的运算方法,从代数角度和几何角度刻画了粒空间的结构特征;揭示了信息粒度度量的本质,为粒化不确定性研究提供了约束性理论与指导性方法。 在粒空间结构研究方面,给出了不同类型粒空间统一的知识表示方法;提出了交、并、补、差四个粒空间算子,给出了精确/模糊粒空间之间的合成、分解与转换运算方法,证明了所有粒空间与这些算子构成了完备有补格,从代数角度揭示了粒空间的层次结构特性;提出了知识距离与模糊知识距离的概念,在其意义下精确/模糊粒空间是一个距离测度空间,从几何角度揭示了粒空间上的几何结构特征。 在信息粒度研究方面,系统建立了精确粒空间与模糊粒空间的信息粒度度量方法;给出了精确/模糊信息粒度的公理化方法,统一了不同类型粒空间背景下信息粒度的相关度量,深刻揭示了精确/模糊信息粒度度量的本质,为粒化不确定性研究提供了约束性理论与指导性方法。 三、借鉴人类的粒化认知能力,发展了基于多粒度认知的、基于动态粒度认知的以及基于序化粒度认知的三大类复杂数据建模理论与方法,极大地推动了基于粒化认知的数据建模发展。 借鉴人类的多粒度认知能力,给出了基于“求同存异”的、基于“求同排异”的以及带概念描述的三类多粒度数据建模方法,极大地丰富了基于粗糙集的建模理论与方法,可以广泛应用于诸如分布式信息系统、多智能Agent等多粒度环境下的数据分析。 借鉴人类的动态粒度认知能力,建立了动态粒度下的概念逼近和决策逼近方法,提出了通用粗糙特征选择加速器,为高效地进行特征选择提供了有效方法。理论分析和实验结论表明:1)将加速器嵌入到每个特征选择方法中后,改进的算法能够保持原有算法的特征选择结果;2)与原有算法相比,带加速器的特征选择算法的耗时大大减少;3)数据规模越大,该加速器的优势越明显。提出了一种特征空间降维和样本空间降维相融合的结构降维策略,并设计了一种高效规则获取算法,分析表明该算法无论从计算时间还是决策性能都具有一定优势,为面向高维海量数据的知识发现提供了高效方法。 借鉴人类的序化粒度认知能力,给出了区间型、合取集值型与析取集值型三类数据的描述语义,建立了基于序化粒度的排序决策与分级决策模型,提出了基于保序原理的特征选择方法,有效解决了序信息系统与序决策信息系统中的特征选择问题。研究结果进一步完善了复杂数据的排序决策、分级决策建模的理论与方法,也为有序分类、有序聚类等相关建模问题提供了可资借鉴的手段。 四、建立了基于整体决策性能评价的模型选择方法,为知识发现的模型选择提供了理论依据与技术支持。 对于完备决策信息系统,给出了整体确定度、整体协调度和整体支持度三个完备决策规则集决策性能评价指标;对于非完备决策信息系统,提出了用极大相容块刻画非完备决策规则的方法,给出了整体确定度、整体协调度和整体支持度;面向分级决策问题,给出了序意义下的整体确定度、整体协调度和覆盖度三个优势规则集决策性能评价指标。理论分析和实验结论表明,提出的评价方法都明显优于基于近似精度和近似质量的评价方法,可为特定问题的模型选择提供理论依据与技术支持。 通过以上系统研究,从揭示人类的粒化认知机理出发,论文在信息粒化、粒化不确定性、建模策略与模型选择四个数据建模阶段都获得了重要的研究成果,初步形成了一个基于粒化机理的数据建模理论与方法体系,对面向复杂数据的数据建模有着重要的理论意义,同时对提高海量信息处理的效率具有实际的应用价值。
【学位授予单位】:山西大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP18;TP274

手机知网App
【引证文献】
中国期刊全文数据库 前3条
1 聂斌;王卓;杜建强;余日跃;徐国良;朱明峰;;基于偏最小二乘法的信息粒降维及聚类研究[J];江西师范大学学报(自然科学版);2012年05期
2 杨习贝;颜成;陈才;於东军;;多粒度空间中的粗糙隶属度与知识粒度[J];淮阴工学院学报;2012年03期
3 杨习贝;窦慧莉;杨静宇;;基于等价关系的混合多粒度粗糙集[J];计算机科学;2012年11期
中国博士学位论文全文数据库 前3条
1 孟军;相容粒计算模型及其数据挖掘研究[D];大连理工大学;2012年
2 陈洁;商空间的粒化关键技术及问题求解研究[D];安徽大学;2014年
3 孙轶轩;基于数据挖掘的道路交通事故分析研究[D];北京交通大学;2014年
中国硕士学位论文全文数据库 前3条
1 秦奇伟;聚类分析中的特征选择研究[D];山西大学;2012年
2 闫麟;基于粗糙集方法的癌症基因微阵列数据分类研究[D];山西大学;2012年
3 王昆;基于逻辑方法的粒化理论[D];首都师范大学;2014年
【参考文献】
中国期刊全文数据库 前10条
1 张文修,魏玲,祁建军;概念格的属性约简理论与方法[J];中国科学E辑:信息科学;2005年06期
2 梁吉业;钱宇华;;信息系统中的信息粒与熵理论[J];中国科学(E辑:信息科学);2008年12期
3 刘清,刘群;粒及粒计算在逻辑推理中的应用[J];计算机研究与发展;2004年04期
4 谢志鹏,刘宗田;概念格的快速渐进式构造算法[J];计算机学报;2002年05期
5 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
6 谢宏,程浩忠,牛东晓;基于信息熵的粗糙集连续属性离散化算法[J];计算机学报;2005年09期
7 徐章艳;刘作鹏;杨炳儒;宋威;;一个复杂度为max(O(|C||U|),O(|C|~2|U/C|))的快速属性约简算法[J];计算机学报;2006年03期
8 王国胤;张清华;;不同知识粒度下粗糙集的不确定性研究[J];计算机学报;2008年09期
9 苗夺谦;Rough Set理论中连续属性的离散化方法[J];自动化学报;2001年03期
10 王国胤,何晓;一种不确定性条件下的自主式知识学习模型[J];软件学报;2003年06期
【共引文献】
中国期刊全文数据库 前10条
1 赵彦辉;张乐文;邱道宏;仲晓杰;;基于粗糙集理论的隧道围岩模糊综合评判[J];四川建筑科学研究;2011年02期
2 吕俊;任雪萍;;一种基于粗糙集理论的变压器故障多变量决策树诊断方法[J];安徽电气工程职业技术学院学报;2011年01期
3 苗强;张学友;毛军军;;基于模糊语言判断矩阵的多目标博弈研究[J];合肥师范学院学报;2010年03期
4 毛军军;贾静丽;张纪强;孙丽;;基于一种新的信息熵的区间直觉模糊集多属性决策分析[J];合肥师范学院学报;2011年06期
5 王长建;李秀琴;;基于不确定语言型多属性决策的承包商选择[J];安防科技;2009年09期
6 阚涛,程家兴,钱付兰,余澄丹;时间规划中D_时刻表的改进算法及应用[J];安徽大学学报(自然科学版);2005年05期
7 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
8 刘金红;陆余良;施凡;宋舜宏;;基于语义上下文分析的因特网人物信息挖掘[J];安徽大学学报(自然科学版);2009年04期
9 李鸿;;基于粒集的概念粒系统[J];安徽大学学报(自然科学版);2009年06期
10 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
中国重要会议论文全文数据库 前10条
1 黄孝鹏;龚亲华;李振宇;许甜甜;;中国古代决策思想与现代决策科学的融合与发展[A];安徽省管子研究会2011年年会暨全国第六届管子学术研讨会交流论文集[C];2011年
2 陈万里;;粒计算的α_决策逻辑语言[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 段震;赵姝;;基于商空间理论的车牌定位[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
5 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
6 郑婷婷;毛军军;吴涛;宋杰;;多重分形和商空间理论在蛋白质结构类分析中的应用[A];第二十六届中国控制会议论文集[C];2007年
7 曾雪兰;李正义;;语言型模糊偏好信息群决策的一种优化算法[A];第二十六届中国控制会议论文集[C];2007年
8 何鹏;王雅琳;桂卫华;孔玲爽;;氧化铝硅渣成分的混沌时间序列分析与SVM预测[A];第二十九届中国控制会议论文集[C];2010年
9 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
10 孙衢;王永玉;;基于云模型的非线性系统智能滑模控制[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
4 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
5 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
6 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
7 杨锦园;基于传感器管理的移动机器人融合算法研究[D];华中科技大学;2010年
8 窦亚玲;基于直觉模糊集的多约束网络路由决策方法研究[D];华中科技大学;2010年
9 冯缨;中小企业电子商务采纳—实施—评价影响因素及方法研究[D];江苏大学;2010年
10 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 周莹;佛手的引种栽培及繁殖技术的研究[D];中南林业科技大学;2009年
3 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
4 潘俊任;基于相似度的模糊推理算法研究[D];浙江理工大学;2010年
5 雷聪聪;一种基于数据聚类的信息粒化方法[D];郑州大学;2010年
6 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
7 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
8 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
9 左国辉;基于子空间方法的人脸识别技术研究[D];哈尔滨工程大学;2009年
10 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张杰;刘小明;贺玉龙;陈永胜;;ARIMA模型在交通事故预测中的应用[J];北京工业大学学报;2007年12期
2 钟连德;孙小端;陈永胜;贺玉龙;刘小明;;高速公路事故预测模型[J];北京工业大学学报;2009年07期
3 张钹;张铃;;粒计算未来发展方向探讨[J];重庆邮电大学学报(自然科学版);2010年05期
4 李鸿;;粒化思维研究[J];滁州学院学报;2010年05期
5 侯方国,胡圣武;模糊信息粒化理论在空间信息系统地位的探讨[J];测绘与空间地理信息;2004年03期
6 刘小明 ,任福田 ,朱弘戈;基于数量化理论的高速公路交通事故预测方法[J];道路交通与安全;2001年01期
7 阚伟生;;路侧事故预测模型的统计分析方法研究[J];道路交通与安全;2006年12期
8 苑雷;日本的交通事故统计年报数据结构分析[J];道路交通管理;2005年07期
9 郎丛妍;须德;李兵;;一种基于模糊信息粒化的视频时空显著单元提取方法[J];电子学报;2007年10期
10 李道国,苗夺谦,张红云;粒度计算的理论、模型与方法[J];复旦学报(自然科学版);2004年05期
中国博士学位论文全文数据库 前3条
1 何富贵;商空间理论在网络路径分析中研究[D];安徽大学;2011年
2 鲍漪澜;基于支持向量机的金融时间序列分析预测算法研究[D];大连海事大学;2013年
3 钱超;高速公路ETC数据挖掘研究与应用[D];长安大学;2013年
中国硕士学位论文全文数据库 前1条
1 王海军;基于微阵列的基因分类算法研究[D];湖南大学;2007年
【二级引证文献】
中国期刊全文数据库 前3条
1 吴根秀;刘佩红;罗冰辉;谢君;;基于秩统计量的粗糙集精度的度量方法[J];江西师范大学学报(自然科学版);2013年01期
2 程艳;苗永春;;高维数据流的聚类离群点检测算法研究[J];江西师范大学学报(自然科学版);2014年05期
3 滕莹峰;李同军;;多粒度近似空间中的知识融合[J];科技视界;2013年07期
【二级参考文献】
中国期刊全文数据库 前10条
1 谢志鹏,刘宗田;概念格与关联规则发现[J];计算机研究与发展;2000年12期
2 刘少辉,盛秋戬,史忠植;一种新的快速计算正区域的方法[J];计算机研究与发展;2003年05期
3 苗夺谦,胡桂荣;知识约简的一种启发式算法[J];计算机研究与发展;1999年06期
4 侯利娟;王国胤;聂能;吴渝;;粗糙集理论中的离散化问题[J];计算机科学;2000年12期
5 刘清;邻域值信息表上的邻域逻辑及其数据推理[J];计算机学报;2001年04期
6 张讲社,梁怡,徐宗本;基于视觉系统的聚类算法[J];计算机学报;2001年05期
7 王国胤,于洪,杨大春;基于条件信息熵的决策表约简[J];计算机学报;2002年07期
8 刘清,郑非,江娟,刘斓;带Rough相等关系词的Rough逻辑系统及其推理[J];计算机学报;2003年01期
9 刘少辉,盛秋戬,吴斌,史忠植,胡斐;Rough集高效算法的研究[J];计算机学报;2003年05期
10 王珏,苗夺谦;Analysis on Attribute Reduction Strategies of Rough Set[J];Journal of Computer Science and Technology;1998年02期
【相似文献】
中国期刊全文数据库 前10条
1 李鸿;;再论粒化思维[J];宿州学院学报;2013年05期
2 李鸿;;粒化思维研究[J];滁州学院学报;2010年05期
3 修保新,任双桥,张维明;基于模糊信息粒化理论的图像插值方法[J];国防科技大学学报;2004年03期
4 赵兴永;陈庆凯;李传红;;高炉渣处理粒化轮损坏原因分析及改进[J];科技传播;2010年21期
5 张燕姑;广义模糊粒化本体论在知识工程中的应用——模糊理论本质研究[J];计算机工程与应用;2005年01期
6 闫林;宋金朋;;数据集的粒化树及其建模应用[J];计算机科学;2014年03期
7 刘生福;信息的粒化与划分(覆盖)解粒[J];计算机工程与应用;2004年02期
8 罗敏;;粒计算及其研究现状[J];计算机与现代化;2007年01期
9 王晓丹;田永梅;;粒计算与WEB信息粒化[J];数字技术与应用;2011年09期
10 陈艳艳;马杰伟;赵海涛;杨国华;;高炉渣离心粒化数值仿真与试验研究[J];计算机仿真;2013年02期
中国重要会议论文全文数据库 前8条
1 闫兆民;周扬民;杨志远;仪垂杰;;离心粒化理论与设备[A];第十一届全国MOCVD学术会议论文集[C];2010年
2 薛青;徐文超;郑长伟;刘永红;;城市作战仿真中战场环境信息粒化模型研究[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
3 仇志国;;青钢图拉法粒化渣工艺的应用与改进[A];2009年山东省炼铁学术交流会论文集[C];2009年
4 李顺;张功多;孟庆波;谢国威;;熔渣离心粒化余热初次回收实验研究[A];2013年全国冶金能源环保生产技术会论文集[C];2013年
5 董志鹏;林东;樊促军;;转炉炉渣粒化工艺在本钢的应用[A];2005中国钢铁年会论文集(第2卷)[C];2005年
6 朱文渊;李先旺;李社锋;;高炉熔渣干式粒化及热能回收技术及工业应用分析[A];2012年全国冶金安全环保暨能效优化学术交流会论文集[C];2012年
7 刘军祥;于庆波;窦晨曦;胡贤忠;;高炉渣转杯式粒化的实验研究[A];2008全国能源与热工学术年会论文集[C];2008年
8 代劲;何中市;;基于云模型的快速信息粒化算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国重要报纸全文数据库 前9条
1 林立恒;熔渣干法粒化工艺技术经济评估[N];世界金属导报;2013年
2 罗锡兰 罗恒志;达钢粒化渣工程竣工投产[N];中国冶金报;2003年
3 太钢设计院 郝正荣 太钢计控处 郝颖;节水、节电的高炉渣轮法粒化装置[N];山西科技报;2000年
4 ;高炉炉渣粒化系统[N];世界金属导报;2003年
5 崔艳萍;INBA渣粒化系统-环境过程控制[N];世界金属导报;2007年
6 刘谭璟;炼铁专业技术成果(五):中冶南方高炉IPE渣处理技术[N];世界金属导报;2012年
7 杨雄飞;熔渣显热利用——干式炉渣粒化工艺研究新进展[N];世界金属导报;2009年
8 童凯 秦黎萍;沙钢钢渣粒化项目正式竣工投产[N];中国冶金报;2005年
9 翟朝平 李占军;宝钢钢渣粒化技术在宣钢“发芽”[N];中国冶金报;2004年
中国博士学位论文全文数据库 前2条
1 陈洁;商空间的粒化关键技术及问题求解研究[D];安徽大学;2014年
2 钱宇华;复杂数据的粒化机理与数据建模[D];山西大学;2011年
中国硕士学位论文全文数据库 前6条
1 王昆;基于逻辑方法的粒化理论[D];首都师范大学;2014年
2 潘利文;液态钢渣的离心粒化设备研制及水淬法模拟研究[D];广西大学;2005年
3 叶青;液态钢渣的离心粒化水淬法研究[D];广西大学;2006年
4 刘明分;棉花种子丸粒化生物学效应的研究[D];河北师范大学;2007年
5 杨银凯;高炉渣干式离心粒化数值模拟研究[D];武汉科技大学;2013年
6 汪显友;粒化过程中琯溪蜜柚果实有机酸代谢及基因表达的研究[D];福建农林大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026