收藏本站
《国防科学技术大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

模糊、动态多维数据建模理论与方法研究

刘青宝  
【摘要】: 多维数据模型的研究为数据仓库技术与OLAP技术的广泛使用提供了基础支撑,具有重要的理论与实践价值。在多维数据模型中,维是一个非常重要的概念,由于其具有一定的层次结构,允许人们用不同的粒度对所关心的事实进行分析。现有的多维数据模型中,维的层次结构建立在完全划分的基础上,具有层次清晰、结构稳定的特性。但现实世界中,描述客观事物的信息往往是不确定、模糊的,而且客观事物本身又是动态演变的,从而难以基于静态的、界线分明的完全划分建立那种层次清晰、结构稳定的分析维模型。为此,本论文以模糊、动态条件下多维数据建模为研究目的,提出支持模糊维的多维数据模型和基于聚类的模糊维构建方法;提出连续数据流的多层次滑窗模型,设计连续数据流的在线聚集算法;提出数据流动态多维数据模型及其在线多维聚集方法。论文的主要工作和创新体现为以下四点: 1.基于模糊商空间理论,提出了模糊多维数据模型 通过引入模糊等价关系,提出了一种支持非完全划分的模糊维结构模型。与普通维相比,本文提出的模糊维主要在两个方面进行了扩展:一是扩展了两个维级别间的元素聚集关系?λ,支持依λ参数的元素聚集操作;二是在级别内部建立了元素聚集关系λ,支持级别内分层递阶结构上的元素聚集操作。而且这种扩展具有兼容性,即普通维可以作为模糊维的一个特例。 在模糊维的基础上,论文给出了模糊多维数据模型、模糊数据立方体、聚集操作,以及上钻、下钻、选择、投影、切片和切块等基本OLAP分析操作的形式化描述。 采用模糊粒度计算理论与方法对模糊聚集问题进行了深入的分析,提出了三种处理方法:保守法、乐观法和元素导出集法。与有关多维数据模型相比,本文提出的模糊多维数据模型突破了传统多维数据建模理论的局限,对非确定性、模糊多维数据分析问题,具有较强的描述与建模能力。 2.提出了基于聚类的模糊维构建方法 针对模糊等价关系难以确定的实际问题,论文根据对象集合的规模大小,分别提出了基于模糊聚类的模糊维构建方法和基于相对密度聚类的模糊维构建方法;同时,提出了基于相对密度的聚类算法,该算法能在不同参数下得到比较稳定的聚类结果,即聚类结果对参数设置不过于敏感,而且高密度的类簇能从相连的低密度的类簇中识别出来,从而可得到多密度分辨率的聚类结果。 3.提出了数据流多层次窗口模型和在线聚集算法 在数据流处理过程中,一般对最近时段的信息要求比较详细,而对较远时段的信息往往只需概貌。为此,论文提出了一种多层次时间窗口模型,能支持在不同时段对数据流进行不同时间粒度的建模;设计了多粒度聚集树结构和过期数据的金字塔快照存储结构;提出了数据流在线聚集与近似查询算法,通过性能分析可知,无论在存储空间还是处理时间上都能满足数据流在线聚集与查询分析的苛刻要求,从而有效地解决了有限时空条件下的数据流聚集与查询问题。 4.提出了数据流动态多维数据模型及其在线多维聚集方法 基于多层次时间窗口模型的时间维模式,提出了数据流动态多维数据模型。与一般数据仓库的多维数据模型相比,数据流动态多维数据模型的突出优点在于能支持时间维的跨度无限性和数据集的动态变化性。数据流时间维的跨度无限性决定了任何存储系统都难以保存整个时间域的所有数据粒子,因此,多层次时间窗口模型是数据流时间维建模的必然选择;而数据集变化的快速性和持续性决定了数据流多维数据模型应支持在线的多维聚集。 由于数据流观测属性的表征性、细节性和技术性等特征,使得数据流多维联机分析处理中的维度选择与构建十分困难。论文提出了支持数据流维度动态建模的在线聚类算法;设计了支持数据流在线聚类与多维聚集的数据结构;提出了数据流基本单元的在线聚集物化方法。 论文在模糊、动态多维数据建模理论和方法方面的研究,对于促进数据仓库技术、OLAP技术和数据挖掘技术的紧密集成和广泛应用具有一定的理论和实践意义。
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP311.13;TP18

【引证文献】
中国博士学位论文全文数据库 前1条
1 侯东风;流式数据多维建模与查询关键技术研究[D];国防科学技术大学;2010年
【参考文献】
中国期刊全文数据库 前10条
1 李道国,苗夺谦,张红云;粒度计算的理论、模型与方法[J];复旦学报(自然科学版);2004年05期
2 陆昌辉;刘青宝;邓苏;张维明;;维度汇总性问题及其对策[J];国防科技大学学报;2006年04期
3 刘青宝;侯东风;邓苏;张维明;;基于相对密度的增量式聚类算法[J];国防科技大学学报;2006年05期
4 张岩,杨冬青,唐世渭;Web仓储中的单视图一致性[J];计算机研究与发展;2004年01期
5 王新军,洪晓光,王海洋,马绍汉;数据仓库中多数据源物化视图的一种有效更新算法[J];计算机研究与发展;2004年05期
6 李泽海;孙吉贵;赵君;于海鸿;;联机分析处理中的非规则维建模[J];计算机研究与发展;2006年02期
7 戴超凡,刘青宝,黄宏斌,邓苏;数据仓库中的元数据管理[J];计算机工程与科学;2003年04期
8 李建中,hlju.edu.cn,高宏;一种数据仓库的多维数据模型[J];软件学报;2000年07期
9 张铃,张钹;模糊商空间理论(模糊粒度计算方法)[J];软件学报;2003年04期
10 金澈清,钱卫宁,周傲英;流数据分析与管理综述[J];软件学报;2004年08期
中国博士学位论文全文数据库 前1条
1 赵基;基于数据挖掘的银行客户分析管理关键技术研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前1条
1 闫朝升;数据流联机分析处理技术的研究[D];黑龙江大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
2 赵海燕;傅珺;;基于灰色模糊理论大型商场火灾风险可靠性的评价研究[J];安防科技;2009年04期
3 干娟;;基于决策树算法的学生综合测评系统的设计[J];安徽电子信息职业技术学院学报;2011年04期
4 李玲玲;辛浩;;FCM算法及其有效性度量方法[J];安徽电子信息职业技术学院学报;2011年05期
5 方天申;弦n维振动的模糊关系矩阵描述方法[J];安徽大学学报(自然科学版);2005年03期
6 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
7 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
8 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
9 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
10 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
中国重要会议论文全文数据库 前10条
1 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
2 张铃;张燕平;方宏彬;张沆;;不可约迭代函数系统的商空间理论[A];第二十六届中国控制会议论文集[C];2007年
3 毛军军;张铃;郑婷婷;吴涛;;基于商空间理论的商分形模型[A];第二十六届中国控制会议论文集[C];2007年
4 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
5 王红霞;田国会;李晓磊;卜范骞;;基于地标信息融合的家庭环境机器人组合导航[A];第二十六届中国控制会议论文集[C];2007年
6 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
7 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
8 曹爱增;陈月婷;魏军;李金屏;;一种基于EDAs和聚类分析的杂合进化算法[A];第二十六届中国控制会议论文集[C];2007年
9 李鑫;李力争;;基于模板匹配的固态流体流速检测算法[A];第二十七届中国控制会议论文集[C];2008年
10 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 闫培雷;考虑隔墙影响的框架结构非线性地震反应分析及地震灾场模拟[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
4 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
5 高晓阳;甘肃河西大麦麦芽干燥控制系统研究[D];甘肃农业大学;2010年
6 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
7 易吉良;基于S变换的电能质量扰动分析[D];湖南大学;2010年
8 陈韶斌;基于知识推理和视觉机理的遥感图像目标识别方法研究[D];华中科技大学;2010年
9 吴海;移动实时数据库中的数据广播策略研究[D];华中科技大学;2010年
10 宋清昆;自适应结构优化神经网络控制研究[D];哈尔滨理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 段守军;煤炭资源潜力评价研究[D];河南理工大学;2010年
2 王焯;基于模糊理论的尾矿坝安全现状综合评价[D];山东科技大学;2010年
3 齐静;数据挖掘在煤炭企业人力资源管理系统中的应用[D];山东科技大学;2010年
4 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
5 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
6 李翠;基于车辆自动识别的智能计重监控系统的研究与设计[D];郑州大学;2010年
7 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
8 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
9 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
10 刘春燕;教学网络DIDS数据分析方法的研究与改进[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前8条
1 向隆刚;龚健雅;;一种高度浓缩和语义保持的数据立方[J];计算机研究与发展;2007年05期
2 师智斌;黄厚宽;;基于形式概念分析的约简数据立方体研究[J];计算机研究与发展;2009年11期
3 刘青宝;金燕;侯东风;张维明;;数据流层次窗口模型及聚集查询算法[J];计算机科学;2007年05期
4 金澈清,钱卫宁,周傲英;流数据分析与管理综述[J];软件学报;2004年08期
5 孟小峰,周龙骧,王珊;数据库技术发展趋势[J];软件学报;2004年12期
6 张冬冬;李建中;王伟平;郭龙江;;数据流历史数据的存储与聚集查询处理算法[J];软件学报;2005年12期
7 骆吉洲;李建中;赵锴;;大型压缩数据仓库上的Iceberg Cube算法[J];软件学报;2006年08期
8 林子雨;杨冬青;王腾蛟;宋国杰;;实视图选择研究[J];软件学报;2009年02期
【二级参考文献】
中国期刊全文数据库 前10条
1 向震,冯珊,梅纲;数据仓库在决策支持系统中的应用[J];华中科技大学学报(自然科学版);2002年06期
2 郭龙江,李建中,王伟平,张冬冬;数据流上的连续预测聚集查询[J];计算机研究与发展;2004年10期
3 戴超凡,邓苏,陈文伟,唐九阳,陆昌辉;开放信息模型研究[J];计算机工程与应用;2001年01期
4 艾中良,麦中凡,朱美正;仓储库的发展[J];计算机工程与应用;2001年11期
5 戴超凡,陈文伟,邓苏,陆昌辉,唐九阳;数据仓库中元数据技术研究[J];计算机工程与应用;2001年14期
6 陈秋双,刘东红,李红星;基于数据仓库的客户分析系统的分析与设计[J];计算机工程与应用;2001年14期
7 赵龙文,侯义斌;Agent的概念模型及其应用技术[J];计算机工程与科学;2000年06期
8 曹蓟光,王申康;元数据管理策略的比较研究[J];计算机应用;2001年02期
9 喻钢,周定康;联机分析处理(OLAP)技术的研究[J];计算机应用;2001年11期
10 唐华松,姚耀文;数据挖掘中决策树算法的探讨[J];计算机应用研究;2001年08期
【相似文献】
中国期刊全文数据库 前10条
1 杨倩,邵伟民,徐忠健;OLAP中一种多维数据模型[J];计算机工程;2004年01期
2 王玲;宋斌;王平立;王克龙;;基于数据仓库三层架构的决策支持系统应用研究[J];计算机应用与软件;2007年02期
3 陈佩佩;孟凡荣;;基于销售系统的联机分析处理设计[J];计算机与信息技术;2007年06期
4 骆伟忠;;银行客户分析系统中OLAP模型的设计[J];电脑知识与技术(学术交流);2007年13期
5 李泽海;孙吉贵;赵君;于海鸿;;支持非覆盖维的扩展多维数据模型[J];计算机科学;2005年09期
6 钟平;;基于FCM算法的凝汽器多维数据模型构建及应用[J];热力发电;2007年05期
7 杨云;罗艳霞;;基于Web数据仓库构建GSM网络优化系统[J];计算机工程与设计;2010年12期
8 李超零;陈越;黄惠新;牛孝印;;网络舆情数据仓库多维建模技术研究[J];情报杂志;2011年07期
9 王文香;左春;张正;;保险业决策支持系统的数据仓库的设计与实现[J];计算机系统应用;2006年07期
10 熊拥军;陈春颖;;基于DW和OLAP技术的数字图书馆资源访问分析[J];现代情报;2009年11期
中国重要会议论文全文数据库 前10条
1 蔡致远;魏藜;钱卫宁;周傲英;;DEODS:快速准确的数据流密度估计[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 丁健;李建中;李金宝;高宏;;数据流上的并行决策树构成算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 李康宁;樊小泊;陈红;;一种数据流滑动窗口范围连接上基于局部特征的查询索引[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
4 谭建龙;郭丽;刘萍;沈星星;;建立数据流管理系统GodRiver[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
5 后小亮;刘奇志;高先锋;檀宝权;;大量多态数据流的综合压缩算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 李爱平;杨庆民;甘亮;;基于Dwarf的数据流立方体的研究与实现[A];第15届全国信息存储技术学术会议论文集[C];2008年
7 林子雨;林琛;冯少荣;张东站;;MESHJOIN~*:实时数据仓库环境下的数据流更新算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
8 李国徽;黄蕾;;数据流环境下的基于加权网格的聚类算法研究[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
9 赵哲;孙婷;陈立军;崔斌;;一种数据流上的快速分段算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
10 李智;唐常杰;栾江;汪锐;贾晓兵;;基于索引的XML数据流的变化检测[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
中国重要报纸全文数据库 前10条
1 本报记者 朱杰;优化数据流构建移动未来网络[N];中国计算机报;2010年
2 谭啸;打通企业数据流[N];计算机世界;2005年
3 深圳市物业发展(集团)股份有限公司 程贵平;以理顺数据流为出发点[N];网络世界;2002年
4 本报记者 卢子月;WIPS捕捉空中数据流[N];通信产业报;2010年
5 陈红;商务智能:从数据中挖取利润[N];中国商报;2003年
6 李;金山毒霸力推数据流杀毒技术[N];计算机世界;2007年
7 杨春光 张钝;数据流托起信息化训练方舟[N];解放军报;2003年
8 朱静芬;新一代ERP的特点[N];财会信报;2007年
9 IBM大中华区董事长及首席执行总裁 钱大群;用领导者价值观改善思维[N];中国经营报;2011年
10 记者 杨晓丹通讯员 朱莹;天津石化建起全过程闭环数据流[N];中国石化报;2008年
中国博士学位论文全文数据库 前10条
1 刘青宝;模糊、动态多维数据建模理论与方法研究[D];国防科学技术大学;2006年
2 陈刚;数据流的无阻塞连接算法研究[D];华中科技大学;2010年
3 李泽海;数据仓库中多维数据处理与查询相关技术的研究[D];吉林大学;2005年
4 马军杰;基于数据仓库与联机处理的区域经济发展管理决策支持系统研究[D];华东师范大学;2007年
5 蒋纲;数据包在无线网络中调度策略的研究[D];华中科技大学;2004年
6 曹锋;数据流聚类分析算法[D];复旦大学;2006年
7 陈辉;数据流频繁模式挖掘及数据预测算法研究[D];华中科技大学;2008年
8 孙玉芬;基于网格方法的聚类算法研究[D];华中科技大学;2006年
9 王鹏;数据流上的分类算法的研究[D];复旦大学;2007年
10 黄芹华;隐私保持数据挖掘与知识发现研究[D];上海大学;2007年
中国硕士学位论文全文数据库 前10条
1 赵国斌;铁路试点数据中心设计及实现[D];北京交通大学;2007年
2 李超良;多维数据模型及多维计算研究[D];中南大学;2004年
3 闫朝升;数据流联机分析处理技术的研究[D];黑龙江大学;2004年
4 李彤;数据仓库中多维数据模型的研究[D];哈尔滨工程大学;2006年
5 刘红敏;数据立方体生成技术研究[D];中北大学;2007年
6 那澎涛;基于CWM的多维数据可视化建模技术研究[D];哈尔滨工业大学;2006年
7 柯艳兵;基于XML的多维数据模型及OLAP系统研究[D];国防科学技术大学;2006年
8 郑超;基于数据仓库的长沙市交通信息处理系统[D];电子科技大学;2009年
9 李晓路;数据仓库中海量数据存储与管理的若干关键技术研究[D];北京邮电大学;2006年
10 孙其辉;基于数据仓库的集装箱支线运输DSS研究[D];大连海事大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026